Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Este tópico fornece informações sobre a limpeza de domínios compostos no DQS (Data Quality Services). Um domínio composto consiste em dois ou mais domínios individuais e é mapeado para um campo de dados que consiste em vários termos relacionados. Os domínios individuais em um domínio composto devem ter uma área comum de conhecimento. Para obter informações detalhadas sobre domínios compostos, consulte Gerenciando um domínio composto.
Mapeando um domínio composto para os dados de origem
Há duas maneiras pelas quais você pode mapear seus dados de origem para um domínio composto:
Os dados de origem são um único campo (digamos nome completo), que é mapeado para um domínio composto.
Se o domínio composto for mapeado para um serviço de dados de referência, os dados de origem serão enviados como estão para o serviço de dados de referência para correção e análise.
Se o domínio composto não for mapeado para um serviço de dados de referência, será analisado com base no método de análise definido para o domínio composto. Para obter mais informações sobre como especificar um método de análise para domínios compostos, consulte Criar um domínio composto
Os dados de origem consistem em vários campos, como Nome (First Name), Nome do Meio (Middle Name) e Sobrenome (Last Name), os quais são mapeados para domínios individuais dentro de um domínio composto.
Para obter um exemplo de como mapear domínios compostos para dados de origem, consulte Anexar um domínio ou domínio composto aos dados de referência.
Correção de dados usando regras definitivas entre domínios
As regras entre domínios no domínio composto permitem criar regras que indicam a relação entre domínios individuais em um domínio composto. As regras entre domínios são levadas em conta quando você executa a atividade de limpeza em seus dados de origem envolvendo domínios compostos. Além de apenas informar sobre a validade de uma regra entre domínios, a regra de domínio cruzado definitiva 'Então', Valor é igual a, também corrige os dados durante a atividade de limpeza de dados.
Considere o seguinte exemplo: há um domínio composto, Product, com três domínios individuais: ProductName, CompanyName e ProductVersion. Crie a seguinte regra definitiva entre domínios:
Se o valor 'CompanyName' do domínio contiver a Microsoft e o valor 'ProductName' do domínio for igual a Office e o valor 'ProductVersion' for igual a 2010 então o valor 'ProductName' do domínio é igual a Microsoft Office 2010.
Quando essa regra entre domínios é executada, os dados de origem (ProductName) são corrigidos para o seguinte após a atividade de limpeza:
Dados de origem
| ProductName | Nome da Empresa | VersãoDoProduto |
|---|---|---|
| Escritório | Microsoft Inc. | 2010 |
Dados de saída
| ProductName | Nome da Empresa | VersãoDoProduto |
|---|---|---|
| Microsoft Office 2010 | Microsoft Inc. | 2010 |
Quando você testa a regra definitiva Then entre domínios, Valor é igual a, a caixa de diálogo Testar Regra de Domínio Composto contém uma nova coluna, Correto Para, que exibe os dados corretos. Em um projeto de limpeza de qualidade de dados, essa regra definitiva entre domínios altera os dados com confiança% de 100%, e a coluna Motivo exibe a seguinte mensagem: Corrigido pela regra '<Nome> da Regra Entre Domínios'. Para obter mais informações sobre regras entre domínios, consulte Criar uma regra entre domínios.
Observação
A regra definitiva entre domínios não funcionará para domínios compostos anexados ao serviço de dados de referência.
Criação de perfil de dados para domínios compostos
A criação de perfil do DQS fornece duas dimensões de qualidade de dados: integridade (até que ponto os dados estão presentes) e precisão (até que ponto os dados podem ser usados para seu uso pretendido) durante a atividade de limpeza. A perfilação pode não fornecer estatísticas de integridade confiáveis para domínios compostos. Se você precisar de estatísticas de integridade, use domínios únicos em vez de domínios compostos. Se você quiser usar domínios compostos, convém criar uma base de dados de conhecimento com domínios únicos para criação de perfil, determinar a integridade e criar outro domínio com um domínio composto para a atividade de limpeza. Por exemplo, a análise de perfil pode mostrar 95% de completude para registros de endereço usando um domínio composto, mas pode haver um nível muito maior de incompletude em uma das colunas, como, por exemplo, a coluna de código postal (CEP). Neste exemplo, talvez você queira medir a completude da coluna de CEP com um único domínio.
A criação de perfil provavelmente fornecerá estatísticas de precisão confiáveis para domínios compostos, pois você pode medir a precisão de várias colunas juntas. O valor desses dados está na agregação composta, portanto, talvez você queira medir a precisão com um domínio composto.
Para obter informações detalhadas sobre o perfilamento de dados durante a atividade de limpeza de dados, consulte Estatísticas do Profiler em Limpeza de Dados Usando DQS (Conhecimento Interno).