Compartilhar via


Assistente de Classificação (Suplementos de Mineração de Dados para Excel)

Assistente de classificação na faixa de opções de mineração de dados

O Assistente de Classificação ajuda você a criar um modelo de classificação com base em dados existentes em uma tabela do Excel, em um intervalo do Excel ou em uma fonte de dados externa.

Um modelo de classificação extrai padrões em seus dados que indicam semelhanças e ajuda você a fazer previsões com base em agrupamentos de valores. Por exemplo, um modelo de classificação pode ser usado para prever o risco com base em padrões de renda ou gastos.

Usando o Assistente de Classificação

  1. Na faixa de opções 'Mineração de Dados', clique em Classificar e depois em Avançar.

  2. Na página Selecionar Dados de Origem , escolha os dados a serem analisados.

    Esse assistente dá suporte a vários tipos de dados: tabelas do Excel, intervalos do Excel e fontes de dados externas. Com dados externos, você pode adicioná-los ao Excel ou escolher um conjunto de tabelas ou exibições em uma fonte de dados do Analysis Services. Você também pode adicionar tabelas e alterar colunas para criar fontes de dados ad hoc.

  3. Na página Classificação , escolha a coluna que você deseja classificar.

    Examine as colunas na lista, colunas de entrada e desmarque todas as colunas que têm valores exclusivos e, portanto, não são úteis para criar padrões, como números de ID, nomes de clientes e assim por diante. Você também deve remover colunas que essencialmente duplicam a coluna classificável.

    Por exemplo, se você estiver classificando a previsão da categoria de um produto, deverá excluir o campo de subcategoria se houver uma regra de negócios conhecida ou então a força dessa regra poderá impedir que você descubra outras correlações.

  4. Opcionalmente, clique em Parâmetros para alterar os parâmetros de algoritmo e personalizar o comportamento do modelo de clustering.

  5. Na página Dividir dados em conjuntos de treinamento e teste, especifique a quantidade de dados a serem reservados para teste. O restante é sempre usado para treinar o modelo.

    A configuração padrão é 30% dados de teste e 70% dados de treinamento.

  6. Na página Concluir , forneça um nome descritivo para seu conjunto de dados e modelo e defina as seguintes opções que controlam como você trabalha com o modelo concluído:

    • Navegar modelo. Quando essa opção é selecionada, assim que o assistente termina de processar o modelo, ele abre uma janela Procurar para ajudá-lo a explorar os resultados. O conteúdo do visualizador depende do tipo de modelo criado. Para obter mais informações, consulte Navegando em um modelo de árvores de decisão e navegando em um modelo de rede neural.

    • Habilite o drillthrough. Selecione essa opção para exibir os dados subjacentes do modelo concluído. Essa opção só estará disponível se você criar um modelo de Árvore de Decisão.

    • Use o modelo temporário. Se você selecionar essa opção, o modelo não será salvo no servidor. Os modelos temporários são excluídos quando você fecha o Excel.

Mais sobre modelos de classificação

Na caixa de diálogo Parâmetros de Algoritmo , você também pode escolher o método de classificação entre estes algoritmos fornecidos no Analysis Services:

  • Árvore de decisão da Microsoft

  • Regressão Logística da Microsoft

  • Microsoft Naïve Bayes

  • Rede Neural da Microsoft

Embora os algoritmos possam produzir resultados semelhantes, eles analisam os dados de forma diferente, portanto, recomendamos tentar vários algoritmos e comparar os resultados. O método padrão é Árvores de Decisão da Microsoft.

Na lista Parâmetros , você pode alterar opções avançadas, que dependem do tipo de algoritmo escolhido. Os parâmetros para cada algoritmo são descritos com mais detalhes nos Manuais Online do SQL Server.

Referência técnica do algoritmo Árvores de Decisão da Microsoft

Referência técnica do algoritmo de regressão logística da Microsoft

Referência técnica do algoritmo Microsoft Naive Bayes

Referência técnica do algoritmo de rede neural da Microsoft

Requisitos

Para usar o Assistente de Classificação , você deve estar conectado a um banco de dados do Analysis Services. Para obter informações sobre como criar uma conexão, consulte Conectar-se aos dados de origem (Cliente de Mineração de Dados para Excel).

Consulte Também

Criando um modelo de mineração de dados