Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Às vezes, seus dados podem conter valores peculiares. Por exemplo, a idade de um proprietário pode ser listada como cinco anos. Esses valores, geralmente chamados de exceções, podem estar errados devido a um erro de entrada de dados ou podem indicar tendências incomuns. De qualquer forma, as exceções podem afetar a qualidade da sua análise. A ferramenta Realçar Exceções ajuda você a encontrar esses valores e revisá-los para mais ações.
A ferramenta Exceções Realçadas pode funcionar com todo o intervalo de dados em uma tabela de dados do Excel, ou você pode selecionar apenas algumas colunas. Você também pode ajustar um limite que controla a variabilidade dos dados para encontrar mais ou menos exceções.
Quando a ferramenta conclui sua análise, ela cria uma nova planilha que contém um relatório resumido de quantas exceções foram encontradas em cada uma das colunas analisadas. A ferramenta também realça as exceções na tabela de dados original. Como a ferramenta analisa tendências gerais, ela pode descobrir que a maioria dos valores em uma linha é normal e realçar apenas uma célula nessa linha. No exemplo de proprietário acima, apenas a coluna Idade pode estar destacada.
Você também pode alterar o valor do limite de exceção no Relatório de Resumo. Esse valor indica a probabilidade de que uma célula específica contenha um valor anormal. Portanto, se você aumentar o valor, menos valores serão realçados como exceções. Por outro lado, ao diminuir o valor, você verá células mais realçadas.
Usando a Ferramenta para Destacar Exceções
Abra uma tabela do Excel e clique em Realçar Exceções.
Especifique as colunas a serem analisadas.
Clique em Executar.
Abra a planilha intitulada <nome da tabela> Outliers para exibir um resumo dos outliers encontrados.
Para alterar o número de realces, clique nas setas para cima e para baixo na linha Limite de Exceção do Relatório de Exceções de Realce.
Requisitos
Você pode incluir colunas que não contêm valores incorretos se esses valores contiverem informações que possam ser úteis na previsão de outras linhas. No entanto, você deve desmarcar colunas que tenham muitos valores ausentes ou zero.
Como todas as colunas selecionadas são usadas para criar um padrão geral, você deve evitar o uso de colunas de entrada que você sabe ter informações ruins, como as seguintes:
Colunas que contêm valores exclusivos, como IDs.
Colunas que contêm uma porcentagem alta de valores incorretos.
Colunas com muitos valores ausentes.
Observe que há alguns casos em que é útil incluir colunas de entrada que têm muitos valores ausentes. Por exemplo, se o valor do campo de endereço estiver sempre ausente quando o cliente comprar por meio de um varejista, o algoritmo de mineração de dados poderá usar essas informações para identificar outros clientes semelhantes. Você deve determinar caso a caso se os dados estão ausentes por omissão ou porque o estado Ausente é significativo.
Colunas que dificilmente serão úteis na criação de um padrão. Por exemplo, uma coluna que tem o mesmo valor em cada linha não adiciona informações que seriam úteis em padrões de construção.
Compreendendo o Relatório de Exceções de Destaques
Quando você clica em Executar, a ferramenta faz três coisas:
Cria uma estrutura de mineração de dados com base nos dados atuais na tabela.
Cria um novo modelo de mineração de dados usando o algoritmo de Clustering da Microsoft.
Cria uma consulta de previsão com base nos padrões para determinar se os valores na planilha são improváveis.
O valor inicial do limite de exceção é sempre 75, o que significa que o algoritmo calculado há 75% chance de que os dados realçados estejam errados. A ferramenta define automaticamente esse limite para a aprovação de análise inicial, mas você pode alterar o valor no relatório.
A ferramenta Realçar Exceções realça as células na tabela de dados original que são suspeitas. Realce escuro significa que a linha precisa de atenção. Realce brilhante significa que o valor nessa célula específica foi identificado como suspeito. Se você alterar o limite para as exceções, os valores realçados serão alterados adequadamente.
O gráfico de resumo mostra o número de células em cada coluna que estavam acima do limite de exceção.
Ferramentas relacionadas
Ao limpar ou revisar dados em preparação para mineração de dados, você também pode experimentar os recursos de exploração de dados no Cliente de Mineração de Dados para Excel. Esse suplemento fornece ferramentas mais avançadas para ajudá-lo a descobrir exceções, relançar dados ou exibir a distribuição de dados. Para obter mais informações sobre ferramentas de exploração de dados no Cliente de Mineração de Dados para Excel, consulte Explorando e limpando dados.
A ferramenta Realçar Exceções usa o algoritmo Clustering da Microsoft. Um modelo de clustering detecta grupos de linhas que compartilham características semelhantes. O Cliente de Mineração de Dados para Excel fornece uma janela Procurar que usa grafos e perfis características para permitir que você explore modelos de mineração de dados criados pelo clustering. Para obter informações sobre como procurar o modelo de clustering criado pela ferramenta Exceções de Destaque , consulte Procurar Modelos (Cliente de Mineração de Dados para Excel).
Para obter mais informações sobre o algoritmo de Clustering da Microsoft, consulte o tópico "Algoritmo de Clustering da Microsoft" nos Manuais Online do SQL Server.