Compartilhar via


Consultas de mineração de dados

Consultas de mineração de dados são úteis para muitas finalidades. É possível:

  • Aplique o modelo a novos dados para fazer previsões simples ou múltiplas. Você pode fornecer valores de entrada como parâmetros ou em um lote.

  • Obtenha um resumo estatístico dos dados usados para treinamento.

  • Extraia padrões e regras ou gere um perfil do caso típico que representa um padrão no modelo.

  • Extraia fórmulas de regressão e outros cálculos que explicam padrões.

  • Obtenha os casos que se encaixam em um padrão específico.

  • Recupere detalhes sobre casos individuais usados no modelo, incluindo dados não usados na análise.

  • Treine novamente um modelo adicionando novos dados ou execute a previsão cruzada.

Esta seção fornece uma visão geral das informações necessárias para começar a usar consultas de mineração de dados. Ele descreve os tipos de consultas que você pode criar em relação a objetos de mineração de dados, apresenta as ferramentas de consulta e as linguagens de consulta e fornece links para exemplos de consultas que você pode criar em relação aos modelos criados usando os algoritmos fornecidos na Mineração de Dados do SQL Server.

Noções básicas sobre consultas de mineração de dados

Ferramentas e interfaces de consulta

Consultas para diferentes tipos de modelo

Requisitos

Noções básicas sobre consultas de mineração de dados

O Analysis Services Data Mining dá suporte aos seguintes tipos de consultas:

Antes de criar consultas, recomendamos que você se familiarize com as diferenças entre os modelos criados com cada um dos algoritmos de mineração de dados fornecidos pelo SQL Server.

Ferramentas e interfaces de consulta

Você pode criar consultas de mineração de dados interativamente usando uma das ferramentas de consulta fornecidas pelo SQL Server. O Construtor de Consultas de Previsão Gráfica é fornecido no SSDT (SQL Server Data Tools) e no SQL Server Management Studio. Se você não tiver usado o Construtor de Consultas de Previsão antes, recomendamos seguir as etapas no Tutorial básico de mineração de dados para se familiarizar com a interface. Para obter uma visão geral rápida das etapas, consulte Criar uma consulta usando a consulta Criar uma previsão usando o Construtor de Consultas de Previsão.

O Construtor de Consultas de Previsão é útil para iniciar consultas que você personalizará posteriormente. Você pode facilmente adicionar fontes de dados e mapeá-las para colunas e alternar para a exibição DMX e personalizar a consulta adicionando uma cláusula WHERE ou outras funções.

Depois de conhecer os modelos de mineração de dados e como criar consultas, você também pode escrever consultas diretamente usando DMX (Extensões de Mineração de Dados). DMX é uma linguagem de consulta semelhante ao Transact-SQL e que você pode usar de vários clientes diferentes. DMX é a ferramenta de escolha para criar previsões personalizadas e consultas complexas. Para obter uma introdução ao DMX, consulte Criando e consultando modelos de mineração de dados com DMX: tutoriais (Analysis Services – Mineração de Dados).

Os editores DMX são fornecidos no SSDT (SQL Server Data Tools) e no SQL Server Management Studio. Você também pode usar o Construtor de Consultas de Previsão para iniciar suas consultas e, em seguida, alterar a exibição para o editor de texto e copiar a instrução DMX para outro cliente. Para obter mais informações, consulte Interfaces de Consulta de Mineração de Dados.

Você pode compor instruções DMX programaticamente e enviá-las de seu cliente para o servidor do Analysis Services usando AMO ou XMLA. No entanto, DMX é o idioma que você deve usar para criar consultas em um modelo de mineração.

Você também pode consultar os metadados, estatísticas e algum conteúdo do modelo usando DMVs (Exibições de Gerenciamento Dinâmico) que se baseiam nos conjuntos de linhas de esquema de mineração de dados. Essas DMVs facilitam a recuperação de informações sobre o modelo digitando instruções SELECT; no entanto, você não pode criar previsões. Para obter mais informações sobre DMVs compatíveis com o Analysis Services, consulte Usar DMVs (Exibições de Gerenciamento Dinâmico) para monitorar o Analysis Services.

Por fim, você pode criar consultas de mineração de dados para uso em pacotes do Integration Services usando a Tarefa Consulta de Mineração de Dados ou a Transformação Consulta de Mineração de Dados. A tarefa de fluxo de controle dá suporte a vários tipos de consultas DMX, enquanto a transformação de fluxo de dados dá suporte apenas a consultas que funcionam com dados no fluxo de dados, ou seja, consultas que usam a sintaxe PREDICTION JOIN.

Consultas para diferentes tipos de modelo

O algoritmo usado quando o modelo foi criado influencia muito o tipo de informação que você pode obter de uma consulta de mineração de dados. O motivo das diferenças é que cada algoritmo processa os dados de uma maneira diferente e armazena diferentes tipos de padrões. Por exemplo, alguns algoritmos criam clusters; outros criam árvores. Portanto, talvez seja necessário usar funções especializadas de previsão e consulta, dependendo do tipo de modelo com o qual você está trabalhando.

A lista a seguir fornece um resumo das funções que você pode usar em consultas:

  • Funções gerais de previsão: A Predict função é polimórfica, o que significa que funciona com todos os tipos de modelo. Essa função detectará automaticamente o tipo de modelo com o qual você está trabalhando e solicitará parâmetros adicionais. Para obter mais informações, consulte Predict (DMX).

    Aviso

    Nem todos os modelos são usados para fazer previsões. Por exemplo, você pode criar um modelo de clustering que não tenha um atributo previsível. No entanto, mesmo que um modelo não tenha um atributo previsível, você poderá criar consultas de previsão que retornam outros tipos de informações úteis do modelo.

  • Funções de previsão personalizadas: Cada tipo de modelo fornece um conjunto de funções de previsão projetadas para trabalhar com os padrões criados por esse algoritmo.

    Por exemplo, a Lag função é fornecida para modelos de série temporal, para permitir que você exiba os dados históricos usados para o modelo. Para modelos de clustering, funções como ClusterDistance são mais significativas.

    Para obter mais informações sobre as funções com suporte para cada tipo de modelo, consulte os seguintes links:

    Exemplos de consulta de modelo de associação Algoritmo Microsoft Naive Bayes
    Exemplos de consulta de modelo de clustering Exemplos de consulta de modelo de rede neural
    Exemplos de consulta de modelo de árvores de decisão Exemplos de consulta de modelo de agrupamento de sequência
    Exemplos de consulta de modelo de regressão linear Exemplos de consulta de modelo de série temporal
    Exemplos de consulta de modelo de regressão logística

    Você também pode chamar funções VBA ou criar suas próprias funções. Para obter mais informações, consulte Funções (DMX).

  • Estatísticas gerais: Há várias funções que podem ser usadas com quase qualquer tipo de modelo, que retornam um conjunto padrão de estatísticas descritivas, como desvio padrão.

    Por exemplo, a PredictHistogram função retorna uma tabela que lista todos os estados da coluna especificada.

    Para obter mais informações, consulte DMX (Funções de Previsão Geral).

  • Estatísticas personalizadas: Funções de suporte adicionais são fornecidas para cada tipo de modelo, para gerar estatísticas relevantes para a tarefa analítica específica.

    Por exemplo, quando você estiver trabalhando com um modelo de clustering, poderá usar a função PredictCaseLikelihoodpara retornar a pontuação de probabilidade associada a um determinado caso e cluster. No entanto, se você criou um modelo de regressão linear, estaria mais interessado em recuperar o coeficiente e interceptar, o que pode ser feito usando uma consulta de conteúdo.

  • Funções de conteúdo do modelo: O conteúdo de todos os modelos é representado em um formato padronizado que permite recuperar informações com uma consulta simples. Você cria consultas no conteúdo do modelo usando DMX. Você também pode obter algum tipo de conteúdo de modelo usando os conjuntos de linhas de esquema de mineração de dados.

    No conteúdo do modelo, o significado de cada linha ou nó da tabela retornada difere dependendo do tipo de algoritmo usado para criar o modelo, bem como do tipo de dados da coluna. Para obter mais informações, consulte Consultas de conteúdo (mineração de dados).

Requisitos

Antes de criar uma consulta em relação a um modelo, o modelo de mineração de dados deve ter sido processado. O processamento de objetos do Analysis Services requer permissões especiais. Para obter mais informações sobre como processar modelos de mineração, consulte Requisitos e Considerações de Processamento (Mineração de Dados).

Para executar consultas em um modelo de mineração de dados, é necessário diferentes níveis de permissões, dependendo do tipo de consulta executada. Por exemplo, a análise detalhada dos dados de caso ou estrutura normalmente requer permissões adicionais que podem ser definidas no objeto da estrutura de mineração ou no objeto de modelo de mineração.

No entanto, se a consulta usar dados externos e incluir instruções como OPENROWSET ou OPENQUERY, o banco de dados que você está consultando deverá habilitar essas instruções e você deverá ter permissão nos objetos de banco de dados subjacentes.

Para obter mais informações sobre os contextos de segurança necessários para executar consultas de mineração de dados, consulte Visão Geral de Segurança (Mineração de Dados)

Nesta seção

Os tópicos nesta seção introduzem cada tipo de consulta de mineração de dados com mais detalhes e fornecem links para exemplos detalhados de como criar consultas contra modelos de mineração de dados.

Consultas de previsão (mineração de dados)

Consultas de conteúdo (mineração de dados)

Consultas de detalhamento (mineração de dados)

Consultas de definição de dados (mineração de dados)

Interfaces de consulta de mineração de dados

Use esses links para saber como criar e trabalhar com consultas de mineração de dados.

Tarefas Links
Exibir tutoriais e instruções passo a passo sobre consultas de mineração de dados Lição 6: Criando e trabalhando com previsões (Tutorial básico de mineração de dados)

Tutorial DMX de previsão de série temporal
Usar ferramentas de consulta de mineração de dados no SQL Server Management Studio e no SSDT (SQL Server Data Tools) Criar uma consulta DMX no SQL Server Management Studio

Criar uma consulta de previsão usando o Construtor de Consultas de Previsão

Aplicar funções de previsão a um modelo

Editar manualmente uma consulta de previsão
Trabalhar com dados externos usados em consultas de previsão Escolher e mapear dados de entrada para uma consulta de previsão

Escolher e mapear dados de entrada para uma consulta de previsão
Trabalhar com os resultados das consultas Exibir e salvar os resultados de uma consulta de previsão
Usar modelos de consulta DMX e XMLA fornecidos no Management Studio Criar uma consulta de previsão singleton a partir de um modelo

Criar uma consulta de mineração de dados usando XMLA

Usar modelos do Analysis Services no SQL Server Management Studio
Saiba mais sobre consultas de conteúdo e veja exemplos Criar uma consulta de conteúdo em um modelo de mineração

Consultar os parâmetros usados para criar um modelo de mineração

Consultas de conteúdo (mineração de dados)
Definir opções de consulta e solucionar problemas e permissões de consulta Alterar o valor de tempo limite para consultas de mineração de dados
Usar os componentes de mineração de dados no Integration Services Tarefa Consulta de Mineração de Dados

Transformação Consulta de Mineração de Dados

Consulte Também

Algoritmos de mineração de dados (Analysis Services – Mineração de Dados)
Conteúdo do modelo de mineração (Analysis Services – Mineração de dados)