Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
A criação de perfil de dados no DQS (Data Quality Services) é o processo de analisar os dados em uma fonte de dados existente e exibir estatísticas sobre os dados nas atividades do DQS. Ele fornece medidas automatizadas de qualidade de dados. A perfilagem do DQS é integrada ao gerenciamento de conhecimento do DQS e aos projetos de qualidade de dados. É dinâmico e ajustável. A criação de perfil tem dois objetivos principais: primeiro, orientar você por meio de processos de qualidade de dados e dar suporte às suas decisões e, em segundo lugar, avaliar a eficácia dos processos. O processo de criação de perfil do DQS tem os seguintes benefícios:
A criação de perfil fornece insights sobre a qualidade dos dados de origem e ajuda a identificar problemas de qualidade de dados.
O perfilamento avalia a eficácia dos processos de qualidade de dados, guiando você na descoberta de conhecimento, na limpeza de dados, nas estratégias de correspondência e no trabalho de correspondência.
O perfilamento apresenta as informações mais relevantes ao momento mais relevante.
O processo de criação de perfil gera notificações que enfatizam estatísticas ou eventos importantes que podem justificar a ação. Em muitos casos, as notificações do DQS indicarão uma condição e recomendarão a ação que você pode tomar para corrigir essa condição.
A criação de perfil permite que você use os Serviços de Qualidade de Dados não apenas para descoberta de conhecimento, limpeza e correspondência, mas também como uma ferramenta de análise. Talvez você queira criar uma base de conhecimento para análise e executar a descoberta de conhecimento usando essa base de conhecimento para determinar, a partir das estatísticas de perfil, se a base de conhecimento atende às suas necessidades de descoberta, limpeza e correspondência.
Como funciona a perfilação
O perfilamento não mede a qualidade da base de conhecimento. Ele mede a qualidade dos dados de origem. O perfilamento fornece estatísticas que indicam o efeito da operação específica que você está realizando no gerenciamento de conhecimento ou em um projeto de qualidade de dados sobre seus dados de origem. A criação de perfil está sempre no contexto da atividade específica que você está executando. Você pode clicar na guia de perfilamento na tela para exibir dados de perfilamento sem sair da etapa da atividade em execução. A tabela de criação de perfil é preenchida em tempo real à medida que o processo é executado, permitindo que você avalie as tarefas de qualidade de dados à medida que as executa. Você pode determinar se os dados de origem são melhores após a limpeza ou a eliminação de duplicação e por quanto.
Todos os números de perfilagem referem-se ao número de ocorrências de um valor e, em muitos casos, à porcentagem do total, com exceção das métricas de singularidade. As métricas de exclusividade referem-se ao número absoluto de valores, independentemente do número de aparências desses valores.
O perfilamento faz parte da solução orientada por conhecimento do DQS. Ele fornece informações sobre uma base de conhecimento, casamento de dados ou processo de limpeza de dados, com base no mapeamento entre campos de fonte de dados e domínios da base de conhecimento. A criação de perfil é executada somente após a conclusão do mapeamento; nenhuma criação de perfil é executada durante o estágio de mapeamento de qualquer atividade. O perfilamento está sempre vinculado a uma atividade. O processo de criação de perfil é executado nos dados que são mapeados para os domínios, não nos dados dentro dos domínios. A criação de perfil é integrada às seguintes etapas de atividades:
As etapas descobrir e gerenciar valores de domínio da atividade de descoberta de conhecimento
As etapas de Purgar e Gerenciar e exibir resultados da atividade de Purificação
A política correspondente e as etapas de resultados correspondentes da atividade de política correspondente
As etapas de correspondência e exportação da atividade de correspondência
O DQS não fornece estatísticas de perfilamento para a atividade de Gerenciamento de Domínio.
Criação de perfil de dados por atividade
A criação de perfil de DQS usa dimensões de qualidade de dados padrão para representar a qualidade dos dados: integridade (até que ponto os dados estão presentes), precisão (até que ponto os dados podem ser usados para seu uso pretendido) e exclusividade (até que ponto valores diferentes representam entidades diferentes). Por padrão, NULL e valores vazios são considerados ausentes ou reduzem o percentual de integridade; no entanto, você também pode definir outros valores como equivalentes a NULL, nesse caso, eles também serão considerados ausentes.
A criação de perfil fornece as estatísticas necessárias para avaliar seus processos, mas você deve interpretar as estatísticas. Entenda o que a análise de perfil está informando analisando coluna por coluna das estatísticas.
As atividades do DQS têm diferentes conjuntos de estatísticas de perfilagem, como segue:
Somente a atividade de limpeza tem estatísticas de perfilamento para precisão (em porcentagem por domínio). A precisão é afetada por validade, consistência, erros de sintaxe e regras de domínio.
Somente a atividade de limpeza tem estatísticas de perfilamento para valores corretos, corrigidos e sugeridos na origem e corrigidos e sugeridos por domínio (ambos números de porcentagem).
As atividades de limpeza e de descoberta do conhecimento têm estatísticas de perfilamento para validade (Limpeza por registro, Descoberta do Conhecimento por registro e domínio). As atividades de Correspondência e a Política de Correspondência não possuem estatísticas sobre validade.
A atividade de limpeza não tem estatísticas de perfilamento para exclusividade. As atividades descoberta de conhecimento, política de correspondência e correspondência têm estatísticas de criação de perfil para exclusividade em número e porcentagem para a origem e por domínio.
Para obter mais informações sobre as estatísticas de criação de perfil específicas relacionadas a uma atividade, consulte as seções de Criação de perfil nos seguintes tópicos:
Perfilamento de dados no monitoramento de atividades
As informações de perfilagem para as atividades de descoberta de conhecimentos, política de conciliação, conciliação e limpeza estão disponíveis não apenas nas páginas de atividade no cliente de Qualidade de Dados, mas também no monitoramento das atividades. O monitoramento de atividades fornece uma visão geral das atividades atuais e anteriores. Além das propriedades e dos processos computacionais relacionados das atividades, você pode exibir as informações de criação de perfil geradas para cada atividade em um único local. Selecione uma atividade na tabela de atividades para exibir os resultados da criação de perfil em uma tabela abaixo. Você também pode exportar os resultados da criação de perfil. Para obter mais informações, consulte Administração do DQS.
Notificações
Além de coletar e exibir estatísticas e métricas importantes por meio da criação de perfil, o DQS gerará notificações (se habilitada) para indicar quando você pode querer executar uma ação com base nas estatísticas de criação de perfil exibidas. O DQS usa notificações para enfatizar fatos importantes sobre a fonte de dados e para mostrar a eficácia da atividade atual em relação à finalidade para a qual foi executada. As notificações fornecem dicas e recomendações que indicam uma condição e recomendam como você pode melhorar uma descoberta de conhecimento, limpeza de dados ou atividade de correspondência de dados.
Uma notificação DQS é usada para gerar um problema que pode interessar a você ou para resolver um possível problema. Se você agir sobre a notificação depende se ela é relevante para suas finalidades. Por exemplo, suponha que o DQS postou uma notificação quando a limpeza de dados não produz valores corrigidos ou valores sugeridos, enquanto a integridade e a precisão são 100%. Essa notificação indica que a atividade pode não precisar ser executada. No entanto, se você optar por executar a atividade, será sua decisão.
Uma notificação é indicada por uma dica de ferramenta com um ponto de exclamação na guia Perfilamento. As estatísticas associadas à notificação são coloridas de vermelho para indicar a justificativa estatística da notificação.
Você pode habilitar (o padrão) ou desabilitar notificações na guia Configurações Gerais da seção Administração da home page do Cliente de Qualidade de Dados. Quando a notificação é desabilitada, as dicas de ferramenta não são exibidas e as estatísticas não são coloridas em vermelho. Não há nenhuma melhoria significativa no desempenho desabilitando notificações. A criação de perfil ainda estará operacional se você desabilitar as notificações.
Para condições específicas associadas a notificações para uma atividade, consulte o seguinte:
Tarefas Relacionadas
| Descrição da tarefa | Tópico |
|---|---|
| Descreve como habilitar ou desabilitar notificações no DQS. | Habilitar ou desabilitar notificações de criação de perfil no DQS |