Conteúdo do modelo de mineração (Analysis Services – Mineração de dados)

Depois de projetar e processar um modelo de mineração usando dados da estrutura de mineração subjacente, o modelo de mineração será concluído e conterá o conteúdo do modelo de mineração. Você pode usar esse conteúdo para fazer previsões ou analisar seus dados.

O conteúdo do modelo de mineração inclui metadados sobre o modelo, estatísticas sobre os dados e padrões descobertos pelo algoritmo de mineração. Dependendo do algoritmo usado, o conteúdo do modelo pode incluir fórmulas de regressão, definições de regras e conjuntos de itens ou pesos e outras estatísticas.

Independentemente do algoritmo usado, o conteúdo do modelo de mineração é apresentado em uma estrutura padrão. Você pode navegar pela estrutura no Visualizador de Árvore de Conteúdo Genérico da Microsoft, fornecido no SSDT (SQL Server Data Tools) e alternar para um dos visualizadores personalizados para ver como as informações são interpretadas e exibidas graficamente para cada tipo de modelo. Você também pode criar consultas no conteúdo do modelo de mineração usando qualquer cliente que dê suporte ao conjunto de linhas de esquema MINING_MODEL_CONTENT. Para obter mais informações, consulte Tarefas de Consulta de Mineração de Dados e Instruções.

Esta seção descreve a estrutura básica do conteúdo fornecido para todos os tipos de modelos de mineração. Ele descreve os tipos de nó que são comuns a todo o conteúdo do modelo de mineração e fornece diretrizes sobre como interpretar as informações.

Estrutura do conteúdo do modelo de mineração

Nós no conteúdo do modelo

Conteúdo do modelo de mineração por tipo de algoritmo

Ferramentas para exibir o conteúdo do modelo de mineração

Ferramentas para consultar o conteúdo do modelo de mineração

Estrutura do conteúdo do modelo de mineração

O conteúdo de cada modelo é apresentado como uma série de nós. Um nó é um objeto dentro de um modelo de mineração que contém metadados e informações sobre uma parte do modelo. Nodos são dispostos em uma hierarquia. A organização exata dos nós na hierarquia e o significado da hierarquia dependem do algoritmo que você usou. Por exemplo, se você criar um modelo de árvores de decisão, o modelo poderá conter várias árvores, todas conectadas à raiz do modelo; se você criar um modelo de rede neural, o modelo poderá conter uma ou mais redes, além de um nó de estatísticas.

O primeiro nó em cada modelo é chamado de nó raiz ou o nó pai do modelo . Cada modelo tem um nó raiz (NODE_TYPE = 1). O nó raiz normalmente contém alguns metadados sobre o modelo, além do número de nós filho, mas oferece poucas informações adicionais sobre os padrões descobertos pelo modelo.

Dependendo de qual algoritmo você usou para criar o modelo, o nó raiz tem um número variável de nós filho. Nós filho têm significados diferentes e contêm conteúdo diferente, dependendo do algoritmo e da profundidade e complexidade dos dados.

Nodos no conteúdo do modelo de mineração

Em um modelo de mineração, um nó é um contêiner de uso geral que armazena uma parte das informações sobre todo ou parte do modelo. A estrutura de cada nó é sempre a mesma e contém as colunas definidas pelo conjunto de linhas do esquema de mineração de dados. Para obter mais informações, consulte DMSCHEMA_MINING_MODEL_CONTENT Rowset.

Cada nó inclui metadados sobre o nó, incluindo um identificador exclusivo em cada modelo, o identificador do nó pai e o número de nós filhos. Os metadados identificam o modelo ao qual o nó pertence e o catálogo de banco de dados em que esse modelo específico é armazenado. O conteúdo adicional fornecido no nó difere dependendo do tipo de algoritmo usado para criar o modelo e pode incluir o seguinte:

Contagem de casos nos dados de treinamento que dão suporte a um valor previsto específico.
Estatísticas, como média, desvio padrão ou variação.
Coeficientes e fórmulas.
Definição de regras e ponteiros laterais.
Fragmentos XML que descrevem uma parte do modelo.

Lista de tipos de nós de conteúdo relacionado à mineração

A tabela a seguir lista os diferentes tipos de nós que são gerados em modelos de mineração de dados. Como cada algoritmo processa informações de forma diferente, cada modelo gera apenas alguns tipos específicos de nós. Se você alterar o algoritmo, o tipo de nós poderá ser alterado. Além disso, se você reprocessar o modelo, o conteúdo de cada nó poderá ser alterado.

Observação

Se você usar um serviço de mineração de dados diferente dos fornecidos no SSAS (SQL Server 2014 Analysis Services) ou se criar seus próprios algoritmos de plug-in, os tipos de nó personalizados adicionais poderão estar disponíveis.

NODE_TYPE ID	Rótulo do nó	Conteúdo do Nó
1	Modelo	Metadados e nó de conteúdo raiz. Aplica-se a todos os tipos de modelo.
2	Árvore	Nó raiz de uma árvore de classificação. Aplica-se a modelos de árvore de decisão.
3	Interior	Nó de divisão interior em uma árvore. Aplica-se a modelos de árvore de decisão.
4	Distribuição	Nó terminal de uma árvore. Aplica-se a modelos de árvore de decisão.
5	Clúster	Cluster detectado pelo algoritmo. Aplica-se a modelos de agrupamento e modelos de agrupamento de sequência.
6	Desconhecido	Tipo de nó desconhecido.
7	Conjunto de Itens	Conjunto de itens detectado pelo algoritmo. Aplica-se a modelos de associação ou modelos de agrupamento de sequência.
8	Regra de Associação	Regra de associação detectada pelo algoritmo. Aplica-se a modelos de associação ou de agrupamento de sequência.
9	PredictableAttribute	Atributo previsível. Aplica-se a todos os tipos de modelo.
10	InputAttribute	Atributo de entrada. Aplica-se a árvores de decisão e modelos naïve Bayes.
11	EstadoDoAtributoDeEntrada	Estatísticas sobre os estados de um atributo de entrada. Aplica-se a árvores de decisão e modelos naïve Bayes.
13	Sequência	Nó superior de um componente de modelo de Markov em um cluster de sequência. Aplica-se a modelos de agrupamento de sequência.
14	Transição	Matriz de transição markov. Aplica-se a modelos de agrupamento de sequência.
15	TimeSeries	Nó não raiz de uma árvore de série temporal. Aplica-se somente a modelos de série temporal.
16	TsTree	Nó raiz de uma árvore de série temporal que corresponde a uma série temporal previsível. Aplica-se a modelos de série temporal e somente se o modelo foi criado usando o parâmetro MIXED.
17	NNetSubnetwork	Uma sub-rede. Aplica-se a modelos de rede neural.
18	NNetInputLayer	Grupo que contém os nós da camada de entrada. Aplica-se a modelos de rede neural.
19	NNetHiddenLayer	Grupos que contêm os nós que descrevem a camada oculta. Aplica-se a modelos de rede neural.
21	NNetOutputLayer	Grupos que contêm os nós da camada de saída. Aplica-se a modelos de rede neural.
21	NNetInputNode	Nó na camada de entrada que associa um atributo de entrada aos estados correspondentes. Aplica-se a modelos de rede neural.
22	NNetHiddenNode	Nó na camada oculta. Aplica-se a modelos de rede neural.
vinte e três	NNetOutputNode	Nó na camada de saída. Esse nó geralmente corresponderá a um atributo de saída e aos estados correspondentes. Aplica-se a modelos de rede neural.
24	NNetMarginalNode	Estatísticas marginais sobre o conjunto de treinamento. Aplica-se a modelos de rede neural.
vinte e cinco	RegressionTreeRoot	Raiz de uma árvore de regressão. Aplica-se a modelos de regressão linear e a modelos de árvores de decisão que contêm atributos de entrada contínuos.
26	NaiveBayesMarginalStatNode	Estatísticas marginais sobre o conjunto de treinamento. Aplica-se a modelos de Bayes ingênuo.
27	ArimaRoot	Nó raiz de um modelo de ARIMA. Aplica-se somente aos modelos de série temporal que usam o algoritmo ARIMA.
28	ArimaPeriodicStructure	Uma estrutura periódica em um modelo ARIMA. Aplica-se somente aos modelos de série temporal que usam o algoritmo ARIMA.
29	ArimaAutoRegressive	Coeficiente autoregressivo para um único termo em um modelo ARIMA. Aplica-se somente aos modelos de série temporal que usam o algoritmo ARIMA.
30	ArimaMovingAverage	Mover o coeficiente médio para um único termo em um modelo ARIMA. Aplica-se somente aos modelos de série temporal que usam o algoritmo ARIMA.
1000	CustomBase	Ponto de partida para tipos de nó personalizados. Os tipos de nós personalizados devem ser inteiros com um valor maior do que esta constante. Aplica-se aos modelos criados usando algoritmos de plug-in personalizados.

ID do nó, nome, legenda e descrição

O nó raiz de qualquer modelo sempre tem o ID exclusivo (NODE_UNIQUE_NAME) de 0. Todas as IDs de nó são atribuídas automaticamente pelo Analysis Services e não podem ser modificadas.

O nó raiz de cada modelo também contém alguns metadados básicos sobre o modelo. Esses metadados incluem o banco de dados do Analysis Services em que o modelo é armazenado (MODEL_CATALOG), o esquema (MODEL_SCHEMA) e o nome do modelo (MODEL_NAME). No entanto, essas informações são repetidas em todos os nós do modelo, portanto, você não precisa consultar o nó raiz para obter esses metadados.

Além de um nome usado como o identificador exclusivo, cada nó tem um nome (NODE_NAME). Esse nome é criado automaticamente pelo algoritmo para fins de exibição e não pode ser editado.

Observação

O algoritmo Clustering da Microsoft permite que os usuários atribuam nomes amigáveis a cada cluster. No entanto, esses nomes amigáveis não são persistidos no servidor e, se você reprocessar o modelo, o algoritmo gerará novos nomes de cluster.

A legenda e a descrição de cada nó são geradas automaticamente pelo algoritmo e servem como rótulos para ajudá-lo a entender o conteúdo do nó. O texto gerado para cada campo depende do tipo de modelo. Em alguns casos, o nome, a legenda e a descrição podem conter exatamente a mesma cadeia de caracteres, mas em alguns modelos, a descrição pode conter informações adicionais. Consulte o tópico sobre o tipo de modelo individual para obter detalhes da implementação.

Observação

O servidor do Analysis Services dá suporte à renomeação de nós somente se você criar modelos usando um algoritmo de plug-in personalizado que implementa a renomeação. Para habilitar a renomeação, você deve substituir os métodos ao criar o algoritmo de plug-in.

Pais do Nó, Filhos do Nó e Cardinalidade do Nó

A relação entre nós-pai e nós-filho em uma estrutura de árvore é determinada pelo valor da coluna PARENT_UNIQUE_NAME. Esse valor é armazenado no nó filho e fornece o ID do nó pai. Alguns exemplos a seguir de como essas informações podem ser usadas:

Um PARENT_UNIQUE_NAME que é NULL significa que o nó é o nó superior do modelo.
Se o valor de PARENT_UNIQUE_NAME for 0, o nó deverá ser um descendente direto do nó superior no modelo. Isso ocorre porque o identificador do nó raiz é sempre 0.
Você pode usar funções dentro de uma consulta DMX (Extensões de Mineração de Dados) para localizar descendentes ou pais de um nó específico. Para obter mais informações sobre como usar funções em consultas, consulte Consultas de mineração de dados.

Cardinalidade refere-se ao número de itens em um conjunto. No contexto de um modelo de mineração processado, a cardinalidade informa o número de filhos em um nó específico. Por exemplo, se um modelo de árvore de decisão tiver um nó para [Renda Anual] e esse nó tiver dois nós filhos, um para a condição [Renda Anual] = Alto e outro para a condição [Renda Anual] = Baixo, o valor de "CHILDREN_CARDINALITY" para o nó [Renda Anual] seria 2.

Observação

No Analysis Services, apenas os nós filhos imediatos são contados ao calcular a cardinalidade de um nó. No entanto, se você criar um algoritmo de plug-in personalizado, poderá sobrecarregar CHILDREN_CARDINALITY para contar a cardinalidade de forma diferente. Isso pode ser útil, por exemplo, se você quiser contar o número total de descendentes, não apenas os filhos imediatos.

Embora a cardinalidade seja contada da mesma maneira para todos os modelos, a forma como você interpreta ou usa o valor de cardinalidade difere dependendo do tipo de modelo. Por exemplo, em um modelo de agrupamento, a cardinalidade do nó principal informa o número total de agrupamentos encontrados. Em outros tipos de modelos, a cardinalidade pode ter um valor sempre definido, dependendo do tipo de nó. Para obter mais informações sobre como interpretar a cardinalidade, consulte o tópico sobre o tipo de modelo individual.

Observação

Alguns modelos, como os criados pelo algoritmo Rede Neural da Microsoft, contêm, além disso, um tipo de nó especial que fornece estatísticas descritivas sobre os dados de treinamento para todo o modelo. Por definição, esses nós nunca têm nós filhos.

Distribuição de nós

A coluna NODE_DISTRIBUTION contém uma tabela aninhada que, em muitos nós, fornece informações importantes e detalhadas sobre os padrões descobertos pelo algoritmo. As estatísticas exatas fornecidas nesta tabela mudam dependendo do tipo de modelo, da posição do nó na árvore e se o atributo previsível é um valor numérico contínuo ou um valor discreto; no entanto, eles podem incluir os valores mínimo e máximo de um atributo, pesos atribuídos a valores, o número de casos em um nó, coeficientes usados em uma fórmula de regressão e medidas estatísticas, como desvio e variação padrão. Para obter mais informações sobre como interpretar a distribuição de nós, consulte o tópico para o tipo específico de modelo com o qual você está trabalhando.

Observação

A tabela NODE_DISTRIBUTION pode estar vazia, dependendo do tipo de nó. Por exemplo, alguns nós servem apenas para organizar uma coleção de nós filhos, e são esses nós filhos que contêm as estatísticas detalhadas.

As colunas a seguir estão sempre presentes na tabela aninhada, NODE_DISTRIBUTION. O conteúdo de cada coluna varia dependendo do tipo de modelo. Para obter mais informações sobre tipos de modelo específicos, consulte Conteúdo do Modelo de Mineração por Tipo de Algoritmo.

ATTRIBUTE_NAME
O conteúdo varia de acordo com o algoritmo. Pode ser o nome de uma coluna, como um atributo previsível, uma regra, um conjunto de itens ou uma parte das informações internas do algoritmo, como parte de uma fórmula.

Essa coluna também pode conter um par de atributo-valor.

ATTRIBUTE_VALUE
Valor do atributo nomeado em ATTRIBUTE_NAME.

Se o nome do atributo for uma coluna, no caso mais simples, o ATTRIBUTE_VALUE conterá um dos valores discretos dessa coluna.

Dependendo de como o algoritmo processa valores, o ATTRIBUTE_VALUE também pode conter um sinalizador que informa se existe um valor para o atributo (Existing) ou se o valor é nulo (Missing).

Por exemplo, se o modelo estiver configurado para localizar clientes que compraram um item específico pelo menos uma vez, a coluna ATTRIBUTE_NAME poderá conter o par atributo-valor que define o item de interesse, como Model = 'Water bottle', e a coluna ATTRIBUTE_VALUE conterá apenas a palavra-chave Existing ou Missing.

APOIO
Contagem dos casos que têm esse par de atributo-valor ou que contêm esse conjunto de itens ou regra.

Em geral, para cada nó, o valor de suporte informa quantos casos do conjunto de treinamento estão incluídos no nó corrente. Na maioria dos tipos de modelo, o suporte representa uma contagem exata de casos. Os valores de suporte são úteis porque você pode exibir a distribuição de dados em seus casos de treinamento sem precisar consultar os dados de treinamento. O servidor do Analysis Services também usa esses valores armazenados para calcular a probabilidade armazenada versus a probabilidade anterior, para determinar se a inferência é forte ou fraca.

Por exemplo, em uma árvore de classificação, o valor de suporte indica o número de casos que têm a combinação de atributos descrita.

Em uma árvore de decisão, a soma do suporte em cada nível de uma árvore equivale ao suporte do seu nó pai. Por exemplo, se um modelo que contém 1.200 casos for dividido igualmente por gênero e, em seguida, subdividido igualmente em três valores de renda—Baixa, Média e Alta—os nós filhos do nó (2), que são os nós (4), (5) e (6), sempre somarão o mesmo número de casos que o nó (2).

ID do nó e atributos de nó	Contagem de suporte
(1) Raiz do modelo	1.200
(2) Gênero = Masculino (3) Gênero = Feminino	600 600
(4) Gênero = Masculino e Renda = Alto (5) Sexo = Homem e Renda = Médio (6) Sexo = Masculino e Renda = Baixo	200 200 200
(7) Gênero = Feminino e Renda = Alta (8) Sexo = Feminino e Renda = Médio (9) Gênero = Feminino e Renda = Baixa	200 200 200

Para um modelo de agrupamento, o número de suporte pode ser ponderado para incluir as probabilidades de pertencer a múltiplos agrupamentos. A associação a vários clusters é o método de clustering padrão. Nesse cenário, como cada caso não pertence necessariamente a um e apenas a um cluster, o suporte nesses modelos pode não somar até 100% em todos os clusters.

PROBABILIDADE
Indica a probabilidade para esse nó específico dentro de todo o modelo.

Em geral, a probabilidade oferece suporte a esse valor específico, dividida pela contagem total de casos dentro do nó (NODE_SUPPORT).

No entanto, a probabilidade é ajustada ligeiramente para eliminar o viés causado por valores ausentes nos dados.

Por exemplo, se os valores atuais para [Total de Filhos] forem 'Um' e 'Dois', você deseja evitar a criação de um modelo que preveja que não é possível ter filhos ou ter três filhos. Para garantir que os valores ausentes sejam improváveis, mas não impossíveis, o algoritmo sempre adiciona 1 à contagem de valores reais para qualquer atributo.

Exemplo:

Probabilidade de [Total de Filhos = Um] = [Contagem de casos em que Total de Filhos = Um] + 1/[Contagem de todos os casos] + 3

Probabilidade de [Total de Filhos = Dois]= [Contagem de casos em que Total de Filhos = Dois] +1/[Contagem de todos os casos] +3

Observação

O ajuste de 3 é calculado adicionando 1 ao número total de valores existentes, n.

Após o ajuste, as probabilidades para todos os valores ainda somam 1. A probabilidade para o valor sem dados (neste exemplo, [Total de Filhos = 'Zero', 'Três' ou algum outro valor]), começa em um nível não zero muito baixo e sobe lentamente à medida que mais casos são adicionados.

VARIAÇÃO
Indica a variação dos valores dentro do nó. Por definição, a variação é sempre 0 para valores discretos. Se o modelo der suporte a valores contínuos, a variação será computada como σ (sigma), usando o denominador n ou o número de casos no nó.

Há duas definições em uso geral para representar o desvio padrão (StDev). Um método para calcular o desvio padrão leva em conta o viés e outro método calcula o desvio padrão sem usar o desvio. Em geral, os algoritmos de mineração de dados da Microsoft não usam viés ao calcular o desvio padrão.

O valor que aparece na tabela NODE_DISTRIBUTION é o valor real para todos os atributos discretos e discretizados e a média para valores contínuos.

VALUE_TYPE
Indica o tipo de dados do valor ou um atributo e o uso do valor. Determinados tipos de valor se aplicam somente a determinados tipos de modelo:

VALUE_TYPE ID	Rótulo de valor	Nome do tipo de valor
1	Em falta	Indica que os dados de caso não continham um valor para esse atributo. O `Missing` estado é calculado separadamente dos atributos que têm valores.
2	Existente	Indica que os dados de caso contêm um valor para esse atributo.
3	Contínuo	Indica que o valor do atributo é um valor numérico contínuo e, portanto, pode ser representado por uma média, juntamente com variação e desvio padrão.
4	Discreto	Indica um valor, numérico ou texto, que é tratado como discreto. Nota Valores discretos também podem estar ausentes; no entanto, eles são tratados de forma diferente ao fazer cálculos. Para obter informações, consulte Valores Ausentes (Analysis Services – Mineração de Dados).
5	Discretizado	Indica que o atributo contém valores numéricos que foram discretos. O valor será uma cadeia de caracteres formatada que descreve os buckets de discretização.
6	Existente	Indica que o atributo tem valores numéricos contínuos e que os valores foram fornecidos nos dados, versus valores ausentes ou inferidos.
7	Coeficiente	Indica um valor numérico que representa um coeficiente. Um coeficiente é um valor aplicado ao calcular o valor da variável dependente. Por exemplo, se o modelo criar uma fórmula de regressão que preveja renda com base na idade, o coeficiente será usado na fórmula que relaciona a idade à renda.
8	Ganho de pontuação	Indica um valor numérico que representa o ganho de pontuação para um atributo.
9	Estatísticas	Indica um valor numérico que representa uma estatística para um regressor.
10	Nome único do nó	Indica que o valor não deve ser tratado não como numérico ou cadeia de caracteres, mas como o identificador exclusivo de outro nó de conteúdo em um modelo. Por exemplo, no modelo de rede neural, os identificadores fornecem ponteiros dos nós da rede na camada de saída para os nós na camada oculta e dos nós na camada oculta para os nós na camada de entrada.
11	Interceptar	Indica um valor numérico que representa a interceptação em uma fórmula de regressão.
12	Periodicidade	Indica que o valor indica uma estrutura periódica em um modelo. Aplica-se somente a modelos de série temporal que contêm um modelo ARIMA. Observação: o algoritmo Microsoft Time Series detecta automaticamente estruturas periódicas com base nos dados de treinamento. Como resultado, as periodicidades no modelo final podem incluir valores de periodicidade que você não forneceu como parâmetro ao criar o modelo.
13	Ordem autorregressiva	Indica que o valor representa o número de séries autoregressivas. Aplica-se a modelos de série temporal que usam o algoritmo ARIMA.
14	Ordem média móvel	Representa um valor que representa o número de médias móveis em uma série. Aplica-se a modelos de série temporal que usam o algoritmo ARIMA.
15	Ordem de diferença	Indica que o valor representa um valor que indica quantas vezes a série é diferenciada. Aplica-se a modelos de série temporal que usam o algoritmo ARIMA.
16	Booliano	Representa um tipo booliano.
17	Outros	Representa um valor personalizado definido pelo algoritmo.
18	Cadeia de caracteres pré-gerada	Representa um valor personalizado que o algoritmo renderiza como uma cadeia de caracteres. Nenhuma formatação foi aplicada pelo modelo de objeto.

Os tipos de valor são derivados da enumeração ADMOMD.NET. Para obter mais informações, consulte Microsoft.AnalysisServices.AdomdServer.MiningValueType.

Pontuação do Node

O significado da pontuação do nó difere dependendo do tipo de modelo e também pode ser específico para o tipo de nó. Para obter informações sobre como NODE_SCORE é calculado para cada modelo e tipo de nó, consulte Conteúdo do Modelo de Mineração por Tipo de Algoritmo.

Probabilidade de um nó e probabilidade marginal

O conjunto de linhas de esquema do modelo de mineração inclui as colunas NODE_PROBABILITY e MARGINAL_PROBABILITY para todos os tipos de modelo. Essas colunas contêm valores apenas em nós em que um valor de probabilidade é significativo. Por exemplo, o nó raiz de um modelo nunca contém uma pontuação de probabilidade.

Nesses nós que fornecem pontuações de probabilidade, a probabilidade atribuída ao nó e as probabilidades marginais correspondem a cálculos diferentes.

Probabilidade marginal é a probabilidade de atingir o nó de seu pai.
Probabilidade do nó é a probabilidade de alcançar o nó a partir da raiz.
Probabilidade nodal é sempre menor ou igual à probabilidade marginal.

Por exemplo, se a população de todos os clientes em uma árvore de decisão for dividida igualmente por gênero (e nenhum valor estiver ausente), a probabilidade dos nós filho deverá ser de 0,5. No entanto, suponha que cada um dos nós de gênero seja dividido igualmente por níveis de renda alto, médio e baixo. Nesse caso, o valor de MARGINAL_PROBABILITY para cada nó filho deve sempre ser .33, mas o valor de NODE_PROBABILITY será o resultado da multiplicação de todas as probabilidades que levam a esse nó e, portanto, sempre será menor que o valor de MARGINAL_PROBABILITY.

Nível de nó/atributo e valor	Probabilidade marginal	Probabilidade de nó
Raiz do modelo Todos os clientes-alvo	1	1
Clientes de destino divididos por gênero	.5	.5
Clientes-alvo divididos por gênero e divididos novamente em três grupos de acordo com a renda	.33	.5 * .33 = .165

Regra de nó e regra marginal

O conjunto de linhas de esquema do modelo de mineração também inclui as colunas NODE_RULE e MARGINAL_RULE para todos os tipos de modelo. Essas colunas contêm fragmentos XML que podem ser usados para serializar um modelo ou para representar alguma parte da estrutura do modelo. Essas colunas podem estar em branco para alguns nós, se um valor não tiver sentido.

Dois tipos de regras XML são fornecidos, semelhantes aos dois tipos de valores de probabilidade. O fragmento XML em MARGINAL_RULE define o atributo e o valor do nó atual, enquanto o fragmento XML em NODE_RULE descreve o caminho para o nó atual da raiz do modelo.

Conteúdo do modelo de mineração por tipo de algoritmo

Cada algoritmo armazena diferentes tipos de informações como parte de seu esquema de conteúdo. Por exemplo, o Algoritmo de Agrupamento da Microsoft gera muitos nós filhos, cada um representando um possível cluster. Cada nó de cluster contém regras que descrevem as características compartilhadas por itens no cluster. Por outro lado, o algoritmo regressão linear da Microsoft não contém nenhum nó filho; Em vez disso, o nó pai do modelo contém a equação que descreve a relação linear descoberta pela análise.

A tabela a seguir fornece links para tópicos para cada tipo de algoritmo.

Tópicos de conteúdo do modelo: Explique o significado de cada tipo de nó para cada tipo de algoritmo e forneça diretrizes sobre quais nós são mais interessantes em um tipo de modelo específico.
Consultando tópicos: Forneça exemplos de consultas em relação a um tipo de modelo específico e diretrizes sobre como interpretar os resultados.

Algoritmo ou tipo de modelo	Conteúdo do Modelo	Consultando modelos de mineração
Modelos de regras de associação	Conteúdo do modelo de mineração para modelos de associação (Analysis Services – Mineração de dados)	Exemplos de consulta de modelo de associação
Modelos de clustering	Conteúdo do modelo de mineração para modelos de árvore de decisão (Analysis Services – Mineração de dados)	Exemplos de consulta de modelo de clustering
Modelo de árvores de decisão	Conteúdo do modelo de mineração para modelos de árvore de decisão (Analysis Services – Mineração de dados)	Exemplos de consulta de modelo de árvores de decisão
Modelos de regressão linear	Conteúdo do modelo de mineração para modelos de regressão linear (Analysis Services – Mineração de dados)	Exemplos de consulta de modelo de regressão linear
Modelos de regressão logística	Conteúdo do modelo de mineração para modelos de regressão logística (Analysis Services – Mineração de dados)	Exemplos de consulta de modelo de regressão linear
Modelos Bayes ingênuos	Conteúdo do modelo de mineração para Modelos Bayesianos Ingênuos (Serviços de Análise – Mineração de Dados)	Exemplos de consulta de modelo naive Bayes
Modelos de rede neural	Conteúdo do modelo de mineração para modelos de rede neural (Analysis Services – Mineração de dados)	Exemplos de consulta de modelo de rede neural
Agrupamento de sequências	Conteúdo do modelo de mineração para modelos de agrupamento de sequências (Analysis Services – Mineração de dados)	Exemplos de consulta de modelo de agrupamento de sequência
Modelos de série temporal	Conteúdo do modelo de mineração para modelos de série temporal (Analysis Services – Mineração de dados)	Exemplos de consulta de modelo de série temporal

Ferramentas para exibir o conteúdo do modelo de mineração

Ao navegar ou explorar um modelo no SSDT (SQL Server Data Tools), você pode exibir as informações no Visualizador de Árvore de Conteúdo Genérico da Microsoft, que está disponível no SSDT (SQL Server Data Tools) e no SQL Server Management Studio.

O Visualizador de Conteúdo Genérico da Microsoft exibe as colunas, as regras, as propriedades, os atributos, os nós e outros conteúdos do modelo usando as mesmas informações disponíveis no conjunto de linhas de esquema de conteúdo do modelo de mineração. O conjunto de linhas de esquema de conteúdo é uma estrutura genérica para apresentar informações detalhadas sobre o conteúdo de um modelo de mineração de dados. Você pode exibir o conteúdo do modelo em qualquer cliente que dê suporte a conjuntos de linhas hierárquicas. O visualizador do SSDT (SQL Server Data Tools) apresenta essas informações em um visualizador de tabela HTML que representa todos os modelos em um formato consistente, facilitando a compreensão da estrutura dos modelos que você cria. Para obter mais informações, consulte Procurar um modelo usando o Visualizador de Árvore de Conteúdo Genérico da Microsoft.

Ferramentas para consultar o conteúdo do modelo de mineração

Para recuperar o conteúdo do modelo de mineração, você deve criar uma consulta no modelo de mineração de dados.

A maneira mais fácil de criar uma consulta de conteúdo é executar a seguinte instrução DMX no SQL Server Management Studio:

SELECT * FROM [<mining model name>].CONTENT

Para obter mais informações, consulte Consultas de mineração de dados.

Você também pode consultar o conteúdo do modelo de mineração usando os conjuntos de linhas do esquema de mineração de dados. Um conjunto de linhas de esquema é uma estrutura padrão que os clientes usam para descobrir, procurar e consultar informações sobre estruturas e modelos de mineração. Você pode consultar os conjuntos de linhas de esquema usando instruções XMLA, Transact-SQL ou DMX.

No SQL Server 2014, você também pode acessar as informações nos conjuntos de linhas do esquema de mineração de dados abrindo uma conexão com a instância do Analysis Services e consultando as tabelas do sistema. Para obter mais informações, consulte Consultando os conjuntos de linhas de esquema de mineração de dados (Analysis Services – Mineração de Dados).

Consulte Também

Visualizador de Árvore de Conteúdo Genérico da Microsoft (Mineração de Dados)
Algoritmos de mineração de dados (Analysis Services – Mineração de Dados)

Last updated on 2017-06-13

Compartilhar via

Conteúdo do modelo de mineração (Analysis Services – Mineração de dados)

Estrutura do conteúdo do modelo de mineração

Nodos no conteúdo do modelo de mineração

Lista de tipos de nós de conteúdo relacionado à mineração

ID do nó, nome, legenda e descrição

Pais do Nó, Filhos do Nó e Cardinalidade do Nó

Distribuição de nós

Pontuação do Node

Probabilidade de um nó e probabilidade marginal

Regra de nó e regra marginal

Conteúdo do modelo de mineração por tipo de algoritmo

Ferramentas para exibir o conteúdo do modelo de mineração

Ferramentas para consultar o conteúdo do modelo de mineração

Consulte Também

Recursos adicionais