Compartilhar via


Assistente de Associação (Ferramenta de Mineração de Dados no Excel)

Assistente de associação na faixa de opções de Mineração de Dados

O Assistente de Associação ajuda você a criar um modelo de mineração de dados usando o algoritmo Regras de Associação da Microsoft. Esses modelos de mineração são particularmente úteis para criar sistemas de recomendação.

Como funciona é que o algoritmo Regras de Associação da Microsoft verifica um conjunto de dados composto por transações ou eventos e localiza as combinações que aparecem frequentemente juntas. Pode haver muitas milhares de combinações, mas o algoritmo pode ser personalizado para encontrar mais ou menos e manter apenas as combinações mais prováveis.

Você pode aplicar a análise de associação a muitos problemas. A aplicação mais popular desse método é a análise de cesta de mercado, que localiza produtos individuais que geralmente são comprados juntos. Em seguida, você pode usar essas informações para recomendar produtos aos clientes com base nos itens que eles já compraram.

Usando o Assistente de Associação

  1. Na guia Mineração de Dados, clique em Associar.

  2. Na página Selecionar Dados de Origem , escolha uma tabela ou intervalo de dados do Excel e clique em Avançar.

    A planilha de dados de exemplo contém um modelo, na guia Associar, de como os dados de transação são normalmente organizados se, por exemplo, você tiver múltiplos produtos em cada transação ou vários registros de compra por cliente que deseja analisar.

    Se você quiser usar dados externos para criar um modelo de associação usando o assistente Associar, deverá adicionar os dados ao Excel primeiro e nivelar os dados. Para obter mais informações sobre como preparar dados para modelagem de associação, consulte Tabelas Aninhadas (Analysis Services – Mineração de Dados), nos Manuais Online do SQL Server.

  3. Na página Associação , escolha a coluna que identifica a transação.

    Para modelos de cesta de mercado, esse identificador representa a unidade que você deseja modelar. Deseja analisar os itens que clientes individuais compraram ao longo do tempo ou deseja analisar muitas transações envolvendo vários clientes? No primeiro caso, você escolheria a ID do cliente; neste último, você escolheria a ordem de compra ou outra ID de transação.

  4. Para Item, selecione a coluna que contém as coisas entre as quais você precisa encontrar associações.

    Por exemplo, em um modelo de cesta de mercado, você escolheria um campo de produtos para analisar quais produtos são frequentemente comprados juntos. Se houver muitos produtos individuais para correlacioná-los efetivamente, você poderá escolher uma categoria de produto ou um campo de subcategoria.

  5. Em Limites, você pode definir valores que controlam ou afetam a saída do modelo:

    • Suporte mínimo. Especifica quantas vezes um grupo de itens deve parecer importante. O algoritmo ignorará as combinações de itens que não atendem a esse critério. Por exemplo, talvez você queira ver apenas os conjuntos de itens em que os itens apareceram juntos pelo menos 10 vezes no geral.

    • Probabilidade mínima de regra. Especifica o valor mínimo de probabilidade necessário para que uma regra seja salva. Todo o conjunto de dados é analisado para localizar todas as combinações e, em seguida, a probabilidade é calculada. Se o limite for baixo, o assistente poderá associar itens que estão apenas correlacionados de forma superficial. Se o limite for muito alto, algumas associações poderão ser omitidas porque não têm dados de suporte suficientes.

    Em geral, alterar esses valores tem os seguintes efeitos:

    • À medida que você reduz o valor do suporte, aumenta o número de combinações encontradas.

    • À medida que você diminui o suporte máximo, filtra itens que ocorrem com tanta frequência que eles têm pouco significado.

    • À medida que você reduz a probabilidade de uma regra, reduz os requisitos que uma combinação deve atender para ser considerada importante no contexto do conjunto de dados total.

    Ponta: É uma boa ideia criar vários modelos de mineração usando combinações diferentes de suporte e probabilidade. Para acompanhar quais configurações você usou para cada modelo, você pode usar o assistente de Modelo de Documento , disponível no Cliente de Mineração de Dados para Excel e usar a opção relatório detalhado . Para obter mais informações, consulte Documenting Mining Models (Suplementos de mineração de dados para Excel).

  6. Opcionalmente, clique em Parâmetros para alterar os parâmetros do algoritmo e personalizar o comportamento do modelo de mineração.

    A caixa de diálogo Parâmetros de Algoritmo inclui todos os parâmetros definidos no assistente, além de alguns que são menos usados, como MAXIMUM_SUPPORT. Para obter informações sobre como usar esses parâmetros, consulte Referência Técnica do Algoritmo de Associação da Microsoft.

  7. Na página Concluir , digite um nome exclusivo para o conjunto de dados e o modelo.

  8. Em Opções, você define como deseja trabalhar com o modelo depois que ele é concluído:

    • Navegue. Quando o modelo estiver pronto, o assistente abrirá uma janela que exibe as regras, os conjuntos de itens e um grafo de rede de dependência que ilustra as associações.

      Para obter mais informações sobre como interpretar os dados no visualizador de modelos de associação, consulte Navegando em um modelo de regras de associação.

    • Habilite o drillthrough. Selecione essa opção para obter acesso aos dados subjacentes por meio do modelo.

      O detalhamento é útil, por exemplo, se você quiser clicar em um conjunto de itens específico e ver os dados de origem.

    • Use o modelo temporário. Selecione essa opção se você não quiser que o modelo seja salvo no servidor. Os modelos temporários são excluídos quando você fecha o Excel.

  9. O assistente analisa todas as combinações possíveis e cria um relatório que contém os conjuntos de itens e as regras.

Mais sobre modelos de associação

O algoritmo Regras de Associação da Microsoft examina os dados de treinamento para localizar itens que aparecem juntos em uma transação. Cada grupo de itens constitui um conjunto de itens. Em seguida, o algoritmo conta o número de vezes que cada conjunto de itens aparece e calcula a importância relativa de cada conjunto de itens em todas as transações.

O algoritmo usa essas informações sobre conjuntos de itens para gerar regras que podem ser usadas para prever associações ou fazer recomendações. Por exemplo, uma regra pode ser "se o usuário comprou um livro pelo Autor 1 e um livro pelo Autor 2, é provável que o usuário também compre um livro pelo Autor 3". Cada recomendação recebe uma probabilidade, com base na força das associações.

Requisitos

Para usar o Assistente de Associação, você deve estar conectado a um banco de dados dos Serviços de Análise.

Seus dados de origem devem ser organizados como uma tabela de transações. Os dados de origem devem conter uma coluna que contenha o identificador de transação. Esta coluna identifica cada grupo de itens. Essa coluna de transação deve estar em uma relação um-para-muitos com uma segunda coluna, a ID do item, que armazena nomes ou números de ID para os itens individuais no grupo.

Conceitualmente, isso pode ser mais fácil de entender ao recordar o exemplo do carrinho de compras. Se o carrinho de compras receber uma ID, a ID do carrinho de compras servirá como o identificador da transação. Cada item no carrinho de compras, como batatas ou leite, é membro dessa transação. O algoritmo Associado pode acompanhar itens entre transações: por exemplo, para determinar quantas vezes batatas e leite aparecem em qualquer transação única.

Seus dados de origem devem ser classificados pela coluna do identificador de transação.

Consulte Também

Criando um modelo de mineração de dados
Navegando em um modelo de regras de associação
Análise de Cesta de Compras (Ferramentas de Análise de Tabela para Excel)
Passo a passo do diagrama de rede de dependência (suplementos de mineração de dados)