Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Aplica-se a:SQL Server
Importante
Os Serviços de Qualidade de Dados (DQS) foram removidos no SQL Server 2025 (17.x). Continuamos a oferecer suporte ao DQS no SQL Server 2022 (16.x) e em versões anteriores.
Este tópico descreve como criar uma política de correspondência numa base de conhecimento no Data Quality Services (DQS). Você se prepara para o processo de correspondência no DQS executando a atividade Política de correspondência em dados de exemplo. Nesta atividade, você cria e testa uma ou mais regras correspondentes na política e, em seguida, publica a base de dados de conhecimento para tornar as regras correspondentes disponíveis publicamente para uso. Pode haver apenas uma política de correspondência em uma base de dados de conhecimento, mas essa política pode conter várias regras de correspondência.
A criação de políticas de correspondência é realizada em três estágios: um processo de mapeamento no qual você identifica a fonte de dados e mapeia domínios para colunas, um processo de política de correspondência no qual você cria uma ou mais regras correspondentes e testa cada regra de correspondência separadamente e um processo de resultados correspondentes no qual você executa todas as regras correspondentes juntas e, se estiver satisfeito com elas, Adicione a política à base de dados de conhecimento. Cada um desses processos é executado numa página separada do assistente de políticas de correspondência, permitindo que se navegue entre diferentes páginas, reexecute o processo, feche um procedimento de correspondência específico e retorne ao mesmo estágio desse procedimento. Depois de testar todas as regras juntas, se desejar, pode retornar à página Política de Correspondência, ajustar uma regra individual, testá-la novamente separadamente e, em seguida, retornar à página Resultados de Correspondência para executar todas as regras juntas mais uma vez. O DQS fornece estatísticas sobre os dados de origem, as regras de correspondência e os resultados correspondentes que permitem tomar decisões informadas sobre a política de correspondência, para que você possa refiná-la.
Antes de começar
Pré-requisitos
O Microsoft Excel deve ser instalado no computador Cliente Data Quality se os dados de origem estiverem em um arquivo do Excel. Caso contrário, você não poderá selecionar o arquivo do Excel na etapa de mapeamento. Os arquivos criados pelo Microsoft Excel podem ter uma extensão de .xlsx, .xlsou .csv. Se a versão de 64 bits do Excel for usada, somente arquivos do Excel 2003 (.xls) serão suportados; Os ficheiros do Excel 2007 ou 2010 (.xlsx) não são suportados. Se estiver a utilizar a versão de 64 bits do Excel 2007 ou 2010, guarde o ficheiro como um ficheiro .xls ou um ficheiro .csv ou instale uma versão de 32 bits do Excel.
Segurança
Permissões
Você deve ter a função dqs_kb_editor ou dqs_administrator no banco de dados DQS_MAIN para criar uma política de correspondência.
Como definir parâmetros de regra correspondentes
Criar uma regra de correspondência é um processo iterativo no qual você insere os fatores usados para determinar se um registro é uma correspondência para outro. Você pode inserir condições para qualquer domínio em uma tabela. Quando o DQS executa a correspondência em dois registros, ele compara os valores nos campos mapeados com os domínios incluídos na regra de correspondência. O DQS analisa os valores em cada campo da regra e, em seguida, usa os fatores inseridos na regra para cada domínio para calcular uma pontuação final correspondente. Caso a pontuação de correspondência dos dois registos comparados seja superior à pontuação mínima estipulada, consideram-se ambos os campos como correspondentes.
Os fatores inseridos em uma regra de correspondência incluem o seguinte:
Peso: Para cada domínio na regra, insira um peso numérico que determine como a análise de correspondência para esse domínio será comparada à análise para cada um dos outros domínios na regra. O peso indica a contribuição da pontuação do campo para a pontuação geral correspondente entre dois registros. As pontuações calculadas atribuídas a cada campo de origem são somadas para uma pontuação de correspondência composta para os dois registros. Para cada campo que não seja um pré-requisito (com semelhança exacta ou similar), defina o peso entre 10 e 100. A soma dos pesos dos domínios que não são pré-requisitos deve ser igual a 100. Se o valor for um pré-requisito, o peso será definido como 0 e não poderá ser alterado.
Semelhança Exata: Selecione Exato se os valores no mesmo campo de dois registos diferentes tiverem de ser idênticos para que sejam considerados uma correspondência. Se idêntica, a pontuação correspondente para esse domínio será definida como "100", e o DQS usará essa pontuação e as pontuações para os outros domínios na regra para determinar a pontuação de correspondência agregada. Se não for idêntica, a pontuação correspondente para esse domínio será definida como "0", e o processamento da regra prosseguirá para a próxima condição. Se configurar uma regra de correspondência para um domínio numérico e selecionar Semelhante, poderá introduzir uma tolerância, quer como uma percentagem, quer como um inteiro. Para um domínio do tipo data, você pode inserir uma tolerância como dia, mês ou ano (inteiro) se selecionar semelhante; Não há tolerância percentual para um domínio de data. Se você selecionar Exato, não terá essa opção.
Similaridade de Similar: Selecione Similar se dois valores no mesmo campo de dois registros diferentes puderem ser considerados uma correspondência, mesmo que os valores não sejam idênticos. Quando o DQS executa a regra, ele calcula uma pontuação correspondente para esse domínio e usa essa pontuação e as pontuações para os outros domínios na regra para determinar a pontuação de correspondência agregada. A semelhança mínima entre os valores de um campo é de 60%. Se a pontuação de correspondência calculada para um campo de dois registros for inferior a 60, a pontuação de similaridade será automaticamente definida como 0. Se estiver a configurar uma regra de correspondência para um campo numérico e selecionar Semelhante, pode introduzir uma tolerância como percentagem ou inteiro. Se estiver a configurar uma regra de correspondência para um campo de data e selecionar Semelhante , pode introduzir uma tolerância numérica.
Pré-requisito: Selecione de pré-requisito para especificar que os valores no mesmo campo em dois registros diferentes devem retornar uma correspondência de 100%, ou os registros não são considerados uma correspondência e as outras cláusulas da regra são desconsideradas. Quando o Pré-requisito é selecionado, o campo de peso do domínio é removido para que não seja possível definir um peso para o domínio. Você deve redefinir um ou mais pesos de domínio para que a soma dos pesos seja igual a 100. Os domínios de pré-requisito não contribuem para a pontuação de correspondência de registros. A pontuação de correspondência de registros é determinada comparando os valores em campos para os quais a Semelhança está definida como Semelhante ou Exata. Quando você torna um campo um pré-requisito, a semelhança para esse domínio é automaticamente definida como Exata.
A pontuação mínima de correspondência é o limite no qual ou acima do qual dois registros são considerados uma correspondência (e o status dos registros é definido como "Compatível"). Insira um valor inteiro em incrementos de "1" ou clique na seta para cima ou para baixo para aumentar ou diminuir o valor em incrementos de "10". O valor mínimo é 80. Se a pontuação de correspondência for inferior a 80, os dois registos não são considerados equivalentes. Não é possível alterar o intervalo da pontuação mínima correspondente nesta página. A pontuação mínima correspondente é 80. No entanto, você pode alterar a pontuação mínima de correspondência mais baixa na página Administração (se você for um administrador do DQS).
Criar uma regra de correspondência é um processo iterativo porque pode ser necessário alterar os pesos relativos dos domínios na regra, ou a semelhança ou a propriedade de pré-requisito para um domínio, ou a pontuação mínima de correspondência para a regra, a fim de alcançar os resultados necessários. Você também pode achar que precisa criar várias regras, cada uma das quais será executada para criar a pontuação correspondente. Pode ser difícil alcançar o resultado necessário com apenas uma regra. Diversas regras fornecerão diferentes perspectivas de uma correspondência necessária. Com várias regras, você poderá incluir menos domínios em cada regra, usar pesos mais altos para cada domínio e obter melhores resultados. Se os dados forem menos precisos e menos completos, poderá necessitar de um maior número de regras para encontrar as correspondências requeridas. Se os dados forem mais precisos e completos, você precisará de menos regras.
A análise de perfis fornece informações sobre completude e unicidade. Considere a completude e a singularidade em conjunto. Use dados de completude e exclusividade para determinar o peso a atribuir a um campo no processo de correspondência. Se houver um alto nível de exclusividade em um campo, o uso do campo em uma política de correspondência pode diminuir os resultados correspondentes, portanto, convém definir o peso desse campo para um valor relativamente pequeno. Se você tiver um baixo nível de exclusividade para uma coluna, mas baixa completude, talvez não queira incluir um domínio para essa coluna. Com um baixo nível de exclusividade, mas um alto nível de completude, você pode querer incluir o domínio. Algumas colunas, como a de género, podem naturalmente ter um baixo nível de singularidade. Para obter mais informações, consulte Profiler e guias de Resultados.
Primeiro passo: Iniciar uma política de correspondência
Você executa a atividade de política de correspondência na área de gerência da base de conhecimento da aplicação Cliente de Qualidade de Dados.
Inicie o Data Quality Client. Para obter informações sobre como fazer isso, consulte Executar a aplicação cliente de qualidade de dados.
Na tela inicial do Cliente Data Quality, clique em Nova base de dados de conhecimento para criar uma política de correspondência em uma nova base de dados de conhecimento. Insira um nome para a base de dados de conhecimento, insira uma descrição e defina Criar base de dados de conhecimento a partir de conforme desejado. Clique em Política de Correspondência para a atividade. Clique Avançar para continuar.
Clique em Abrir base de conhecimento para criar ou modificar a política de correspondência em uma base de conhecimento existente. Selecione a base de conhecimento, selecione Política de Correspondênciae, em seguida, clique em Próximo. Você também pode clicar em uma base de dados de conhecimento em Base de Dados de Conhecimento Recente. Se você abrir uma base de dados de conhecimento que foi fechada enquanto uma política de correspondência estava sendo trabalhada, prosseguirá para o estágio em que a atividade de política de correspondência foi fechada (conforme indicado pela coluna de Estado do para a base de dados de conhecimento na tabela da base de dados de conhecimento ou no nome da base de dados de conhecimento em Base de Dados de Conhecimento Recente). Se você abrir uma base de dados de conhecimento que inclua uma política de correspondência e tenha sido concluída, vá para a página Política de Correspondência de. Se abrires uma base de conhecimento que não inclua uma política de correspondência e estiver concluída, irás para a página Mapeamento.
Estágio de mapeamento
No estágio de mapeamento, você identifica a origem dos dados para os quais criará a política de correspondência e mapeia colunas de origem para domínios para disponibilizar os domínios para a atividade de política correspondente.
Na página Mapa, para criar uma política para um banco de dados, mantenha Fonte de Dados como SQL Server, selecione o banco de dados para o qual deseja criar a política em Banco de Dadose, em seguida, selecione a tabela ou vista em Tabela/Vista. O banco de dados de origem deve estar presente na mesma instância do SQL Server que o Data Quality Server. Caso contrário, ele não aparecerá na lista suspensa.
Para criar uma política para os dados em uma folha de cálculo do Excel, selecione Ficheiro do Excel para Fonte de Dados, clique em Procurar e selecione o ficheiro do Excel, deixando Usar a primeira linha como cabeçalho selecionada, se apropriado. Em Planilha, selecione a planilha no arquivo do Excel que será a fonte dos dados. O Microsoft Excel deve ser instalado no computador Cliente Data Quality para selecionar um arquivo do Excel. Caso contrário, o botão Procurar não estará disponível e você será notificado abaixo desta caixa de texto de que o Microsoft Excel não está instalado.
Em Mapeamentos, selecione um campo para Coluna de Origeme, em seguida, clique no ícone Criar Domínio.
Em Mapeamentos, selecione um campo na fonte de dados para a Coluna de Origeme, em seguida, selecione o domínio correspondente. Repita para todos os domínios utilizados no processo de correspondência de dados. Crie domínios conforme necessário clicando em Criar um domínio ou Criar um domínio composto.
Observação
Você pode mapear seus dados de origem para um domínio DQS ao criar uma política de correspondência somente se o tipo de dados de origem for suportado no DQS e corresponder ao tipo de dados de domínio DQS. Para obter informações sobre tipos de dados com suporte no DQS, consulte Supported SQL Server and SSIS Data Types for DQS Domains.
Clique no controle mais (+) para adicionar uma linha à tabela Mapeamentos ou no controle menos (-) para remover uma linha.
Clique em Visualizar fonte de dados para ver os dados na tabela ou vista do SQL Server que selecionou, ou na planilha do Excel que selecionou.
Clique Exibir/Selecionar Domínios Compostos para exibir uma lista dos domínios compostos disponíveis na base de dados de conhecimento e selecione, conforme apropriado, para mapeamento.
Clique Avançar para prosseguir para o estágio de política correspondente.
Observação
Clique Fechar para salvar o estágio do projeto correspondente e retornar à página inicial do DQS. Da próxima vez que abrir este projeto, este começará a partir da mesma fase. Clique Cancelar para encerrar a atividade correspondente, perder seu trabalho e retornar à página inicial do DQS.
Etapa da política de correspondência
Você cria regras de correspondência e as testa individualmente na página Política de correspondência. Ao testar uma regra de correspondência na página Política de Correspondência, irá ver uma tabela de resultados correspondentes que mostra os clusters que o DQS identificou para a regra que foi selecionada. A tabela mostra cada registro no cluster com os valores de domínio de mapeamento e pontuação correspondente, e o registro de pivô inicial para o cluster. Você também pode exibir dados de criação de perfil para o processo de correspondência como um todo, as condições em cada regra de correspondência e estatísticas sobre os resultados de cada regra de correspondência separadamente. Você pode filtrar os dados da regra mestra desejados.
Para obter mais informações sobre como as regras de correspondência funcionam, consulte Como definir parâmetros de regra correspondentes.
Na página Política de Correspondência, clique no ícone Criar uma regra de correspondência.
Insira um nome e uma descrição para a regra.
Aumente o valor da pontuação mínima de correspondência se quiser tornar os requisitos de correspondência mais rigorosos. Para obter mais informações sobre a pontuação mínima correspondente, consulte Como definir parâmetros de regra de correspondência.
Clique no ícone Adicionar um novo elemento de domínio.
Selecione um domínio ou domínio composto para o qual inserir valores de regra.
Observação
Você pode selecionar um domínio composto somente se cada domínio individual no domínio composto tiver sido mapeado para uma coluna de origem.
Para Semelhança, selecione Semelhante se dois valores no mesmo campo de dois registos diferentes puderem ser considerados correspondentes, mesmo não sendo idênticos. Selecione exato se dois valores no mesmo campo de dois registros diferentes devem ser idênticos para serem considerados uma correspondência. (Para obter mais informações, consulte Como definir parâmetros de regra correspondentes.)
Para Peso , insira um valor que determine a contribuição da pontuação de correspondência de um domínio para a pontuação geral de correspondência entre dois registos.
Observação
Ao definir um peso para um domínio composto, você pode inserir um peso diferente para cada domínio único no domínio composto, caso em que o domínio composto não recebe um peso separado, ou você pode inserir um peso único para o domínio composto, no qual os domínios únicos no domínio composto não recebem pesos separados.
Selecione o pré-requisito para especificar que os valores do campo nos dois registos devem retornar uma correspondência de 100%, caso contrário, os registos não são considerados correspondentes e as outras cláusulas da regra são ignoradas. Se o de Semelhança for Semelhante, ele mudará para Exato, e o peso será removido porque a correspondência deve ser de 100%.
Repita as etapas 4 a 8 para todos os outros domínios que farão parte da regra de correspondência. Certifique-se de que a soma dos pesos para todos os domínios na regra seja igual a 100.
Selecione Clusters sobrepostos na lista suspensa para exibir os registos pivot e os registos seguintes para todos os clusters quando a correspondência for executada, mesmo que grupos de clusters tenham registos em comum. Selecione de clusters não sobrepostos para exibir clusters que tenham registros em comum como um único cluster quando a correspondência for executada.
Clique Recarregar dados da fonte para copiar dados da fonte para a tabela de preparo e reindexá-lo quando executar a política de correspondência. Clique Executar em dados anteriores para executar uma política de correspondência sem copiar os dados para a tabela de preparo e reindexar os dados. Executar em dados anteriores está desativado para a primeira execução da política de associações ou quando se altera o mapeamento na página Mapa, e em seguida se pressionar Sim no pop-up a seguir. Em ambos os casos, você deve reindexar. Não é necessário reindexar se a política de correspondência não tiver sido alterada. A execução em dados anteriores pode ajudar no desempenho.
Clique em Iniciar para executar o processo de correspondência para a regra selecionada. Quando o processo estiver concluído, a tabela exibirá a ID do Registro, o número do Cluster e as colunas de dados (incluindo aquelas que não estão na regra de correspondência) para cada registro em um cluster. A linha de pivô no cluster é considerada a principal candidata para sobreviver ao processo de desduplicação. Cada linha adicional em um cluster é considerada uma duplicata; Sua pontuação correspondente (em comparação com o registro Pivot) é fornecida na tabela de resultados. O número do cluster é o mesmo que o ID de registo para o registro de pivô no cluster.
Você pode trabalhar com os dados na tabela Resultados Correspondentes da seguinte maneira:
Em Filtro, selecione Correspondente para mostrar todas as linhas correspondentes e a sua pontuação. As linhas que não são consideradas correspondências (que têm uma pontuação correspondente inferior à pontuação mínima correspondente) não são mostradas na tabela de resultados correspondentes. Selecione Incomparável para mostrar todas as linhas incompatíveis, não as linhas correspondentes.
Na caixa de seleção suspensa , selecione uma percentagem da lista suspensa, em incrementos de 5%. Todas as linhas com uma pontuação correspondente maior ou igual a essa porcentagem serão exibidas na tabela de resultados correspondentes.
Se clicar duas vezes num registo na tabela de resultados correspondentes, o DQS exibirá uma janela Detalhes da Pontuação Correspondente que exibirá o registo de pivô e o registo de origem (e os valores em todos os campos), a pontuação entre eles e os pormenores da correspondência de registo. O detalhamento exibe os valores em cada campo do registro dinâmico e do registro de origem para que você possa compará-los e mostra a pontuação correspondente que cada campo contribui para a pontuação de correspondência geral para os dois registros.
Exiba as estatísticas nos separadores Profiler e Resultados Correspondentes para garantir que alcanças os resultados que precisas. Para obter mais informações, consulte Profiler e guias de Resultados.
Se a regra precisar ser alterada, altere-a no Editor de regras e clique em Reiniciar.
Observação
Após a conclusão da primeira análise, o botão Iniciar se transforma em um botão Reiniciar. Se os resultados da análise anterior ainda não tiverem sido salvos, clicar em Reiniciar fará com que os dados anteriores sejam perdidos. Como a análise está em execução, não saia da página ou o processo de análise será encerrado.
A guia Resultados Correspondentes exibe estatísticas para as duas últimas execuções da regra. Se você tiver executado a regra de correspondência mais de uma vez com configurações diferentes, compare as estatísticas da regra atual e da regra anterior. Se você achar que os resultados da regra anterior foram melhores, clique em Restaurar regra anterior para restaurar as condições da regra anterior, retornando a regra ao seu estado anterior antes de editar. As condições da regra atual serão perdidas. Isso permite ajustar a política com base nas duas últimas execuções correspondentes, diminuindo o tempo gasto ajustando a política correspondente.
Se desejar que outra regra seja adicionada à política de correspondência, repita a etapa 1.
Clique Avançar para prosseguir para a etapa de resultados correspondentes.
Etapa de resultados correspondentes
Você testa todas as suas regras de correspondência de uma só vez na página Resultados correspondentes. Antes de fazer isso, podes especificar que a execução do teste de regra identifique aglomerações sobrepostas ou não sobrepostas. Se você estiver executando as regras várias vezes, poderá executá-la em dados recarregados da fonte ou em dados anteriores.
Ao testar as regras correspondentes na página Resultados Correspondentes do, você verá uma tabela de resultados correspondentes que mostra os clusters que o DQS identificou para todas as regras. A tabela mostra cada registro no cluster com os valores de domínio de mapeamento e pontuação correspondente, e o registro de pivô inicial para o cluster. Você também pode exibir dados de análise de desempenho para as regras de correspondência como um todo, as condições em cada regra de correspondência e estatísticas sobre os resultados de todas as regras de correspondência.
Na página Resultados de Correspondência, selecione Clusters Sobrepostos na lista suspensa para exibir os registos pivot e os registos subsequentes para todos os clusters quando a correspondência for executada, mesmo que grupos de clusters tenham registos em comum. Selecione de clusters não sobrepostos para exibir clusters que tenham registros em comum como um único cluster quando a correspondência for executada.
Clique Recarregar dados da fonte para copiar dados da fonte para a tabela de preparo e reindexá-lo quando executar a política de correspondência. Clique Executar em dados anteriores para executar uma política de correspondência sem copiar os dados para a tabela de preparo e reindexar os dados. Executar em dados anteriores está desativado para a primeira execução da política de associações ou quando se altera o mapeamento na página Mapa, e em seguida se pressionar Sim no pop-up a seguir. Em ambos os casos, você deve reindexar. Não é necessário reindexar se a política de correspondência não tiver sido alterada. A execução em dados anteriores pode ajudar no desempenho.
Clique em Iniciar para executar o processo de correspondência para todas as regras que definiste. A tabela Resultados Correspondentes exibe a ID do registo, o número do agrupamento e as colunas de dados (incluindo aquelas que não estão presentes na regra de correspondência) para cada registo em um agrupamento. O registro principal no cluster é selecionado aleatoriamente. (Você determina o registro sobrevivente selecionando a regra de sobrevivência na página Exportar quando executa o projeto correspondente.) Cada linha adicional em um cluster é considerada uma duplicata; a sua pontuação de correspondência (em comparação com o registro pivô) é fornecida na tabela de resultados.
Você pode trabalhar com os dados na tabela Resultados Correspondentes da seguinte maneira:
Em Filtro, selecione Correspondente para mostrar todas as linhas correspondentes e a sua pontuação. As linhas que não são consideradas correspondências (que têm uma pontuação correspondente inferior à pontuação mínima correspondente) não são mostradas na tabela de resultados correspondentes. Selecione Incomparável para mostrar todas as linhas incompatíveis, não as linhas correspondentes.
Na caixa de seleção suspensa , selecione uma percentagem da lista suspensa, em incrementos de 5%. Todas as linhas com uma pontuação correspondente maior ou igual a essa porcentagem serão exibidas na tabela de resultados correspondentes.
Se clicar duas vezes num registo na tabela de resultados correspondentes, o DQS exibirá uma janela Detalhes da Pontuação Correspondente que exibirá o registo de pivô e o registo de origem (e os valores em todos os campos), a pontuação entre eles e os pormenores da correspondência de registo. O detalhamento exibe os valores em cada campo do registro dinâmico e do registro de origem para que você possa compará-los e mostra a pontuação correspondente que cada campo contribui para a pontuação de correspondência geral para os dois registros.
Exiba as estatísticas nos separadores Profiler e Resultados Correspondentes para garantir que alcanças os resultados que precisas. Clique no separador Regras de Correspondência para ver quais são as configurações de domínio para cada regra. Para obter mais informações, consulte Profiler e guias de Resultados.
Se não estiver satisfeito com os resultados de todas as regras, clique em Voltar para regressar à página Política de Correspondência, modifique uma ou mais regras conforme necessário, regresse à página Resultados Correspondentes e, em seguida, clique em Reiniciar.
Observação
Após a conclusão da análise, o botão Iniciar se transforma em um botão Reiniciar. Se os resultados da análise anterior ainda não tiverem sido salvos, clicar em Reiniciar fará com que os dados anteriores sejam perdidos.
Se estiver satisfeito com os resultados de todas as regras, clique em Concluir para concluir o processo de política correspondente e, em seguida, clique numa das seguintes opções:
Sim - Publique a base de dados de conhecimento e saia: A base de dados de conhecimento será publicada para o usuário atual ou outros usarem. A base de dados de conhecimento não será bloqueada, o estado da base de dados de conhecimento (na tabela da base de dados de conhecimento) será definido como vazio e as atividades Gerenciamento de Domínio e Descoberta de Conhecimento estarão disponíveis. Você será redirecionado para a tela do Open Knowledge Base.
Não - Salve o trabalho na base de dados de conhecimento e saia: Seu trabalho será salvo, a base de dados de conhecimento permanecerá bloqueada e o estado da base de dados de conhecimento será definido como No trabalho. As atividades de Gerenciamento de Domínio e Descoberta de Conhecimento estarão disponíveis. Você retornará à página inicial.
Cancelar - Permanecer na tela atual: O pop-up será fechado e você retornará à tela Gerenciamento de Domínio.
Clique Fechar para salvar seu trabalho e retornar à página inicial do DQS. O estado da base de dados de conhecimento mostrará a cadeia de caracteres "Política de correspondência - ", e o estado atual. Se clicares em Fechar enquanto estiveres no ecrã Resultado de Correspondência, o estado mostrará: "Política de Correspondência - Resultados". Se você clicou em fechar enquanto estiver na tela Política de correspondência, o estado mostrará: "Política de correspondência - Política de correspondência". Depois de clicar em Fechar, para executar a atividade de Descoberta de Conhecimento, terá que retornar à atividade de Política de Correspondência, clicar em Concluir, e, em seguida, clicar em Sim para publicar a base de conhecimento ou Não para salvar o trabalho na base de conhecimento e sair.
Observação
Se você clicar em Fechar enquanto um processo correspondente estiver em execução, o processo correspondente não será encerrado quando você clicar em Fechar. Você pode reabrir a base de dados de conhecimento e ver se o processo ainda está em execução ou, se concluído, se os resultados são exibidos. Se o processo não tiver sido concluído, a tela exibirá o progresso.
Clique em Cancelar para encerrar a atividade de política de correspondência, perder o seu trabalho e retornar à página inicial do DQS.
Acompanhamento: Após criar uma política de correspondência
Depois de criar uma política de correspondência, você pode executar um projeto correspondente com base na base de dados de conhecimento que contém a política de correspondência. Para obter mais informações, consulte executar um projeto correspondente.
Guias Profiler e Resultados
A guia Profiler e Results contém estatísticas para as páginas Política de correspondência e Resultados correspondentes.
Guia Profiler
Clique na guia Profiler para exibir estatísticas para o banco de dados de origem e para cada campo incluído na regra de política. As estatísticas serão atualizadas à medida que a regra de política for executada.
Para obter mais informações sobre como interpretar as estatísticas a seguir, consulte Como definir parâmetros de regra de correspondência.
As estatísticas da base de dados de origem incluem o seguinte:
Records: O número total de registros no banco de dados de origem
Total de Valores: O número total de valores nos campos da fonte de dados
Novos Valores: O número total de valores novos desde a execução anterior e sua porcentagem do total
Valores Únicos: O número total de valores exclusivos nos campos e sua porcentagem do todo
Novos Valores Exclusivos: O número total de valores exclusivos que são novos nos campos e sua porcentagem do todo
As estatísticas de campo incluem o seguinte:
Nome do campo
Nome de domínio
Novo: O número de novos valores e a percentagem de novos valores em comparação com os valores existentes no domínio
Unique: O número de registos únicos no campo e a percentagem deles do total
Completeness: Completude de cada campo de origem mapeado para o exercício de correspondência
Notificações de política de correspondência
Para a atividade de política de correspondência, as seguintes condições resultam em notificações:
O campo está vazio em todos os registos; é recomendável eliminá-lo do mapeamento.
A pontuação de completude do campo é muito baixa; você pode querer eliminá-lo do mapeamento.
Todos os valores em um campo são inválidos; Você deve verificar o mapeamento e a relevância das regras de domínio para o conteúdo do campo.
Há um baixo nível de valores válidos no campo; Você deve verificar o mapeamento e a relevância das regras de domínio para o conteúdo do campo.
Existe um elevado nível de singularidade neste domínio. O uso deste campo na política de associação pode reduzir os resultados de correspondência.
Separador de Resultados Correspondentes
Clique na guia Resultados Correspondentes para exibir estatísticas para a execução da regra de política correspondente e a execução da regra anterior. Se você tiver executado a mesma regra mais de uma vez com parâmetros diferentes, a tabela de resultados correspondentes exibirá estatísticas para ambas as execuções, permitindo que você as compare. Você também pode restaurar a regra anterior, se desejar.
As estatísticas incluem o seguinte:
O número total de registos na base de dados
O número total de registros correspondentes no banco de dados
O número de registos na base de dados que não são considerados duplicados
O número de clusters descobertos
O tamanho médio do cluster (número de registros duplicados dividido pelo número de clusters)
O menor número de duplicatas em um cluster
O maior número de duplicatas em um cluster