Compartilhar via


Criar relações baseadas em termos

Este tópico descreve como criar relações baseadas em termos para um domínio no DQS (Data Quality Services). Uma TBR (relação baseada em termos) permite que você faça uma correção para um termo que faz parte de um valor em um domínio. Ele permite que vários valores idênticos, exceto pela ortografia de uma parte comum deles, sejam considerados sinônimos idênticos. Por exemplo, você pode configurar uma relação baseada em termos que altera o termo "Inc." para "Incorporated". O termo "Inc." será alterado sempre que ocorrer no domínio. As instâncias de "Contoso, Inc." serão substituídas para "Contoso, Incorporado" e os dois valores serão considerados sinônimos exatos.

Para usar relações baseadas em termos, você cria uma lista de pares Value/Correct To, como "Inc." e "Incorporated", ou "Senior" e "Sr.". O uso de uma relação baseada em termos permite alterar um termo em todo o domínio sem definir manualmente valores de domínio individuais como sinônimos. Você pode especificar que um valor seja corrigido mesmo se a descoberta de conhecimento não tiver descoberto esse valor anteriormente. Se uma transformação de relação baseada em termos fizer com que dois valores sejam idênticos, o DQS criará uma relação de sinônimo entre eles (na descoberta de conhecimento), uma relação de correção entre eles (na correção de dados) ou uma correspondência exata (na correspondência).

A transformação de relações baseadas em termos e a transformação de símbolos (na qual caracteres especiais são substituídos por um espaço ou um nulo) são feitos em um estágio de pré-processamento antes da análise. Se a análise de domínio composto for solicitada, ela será executada antes das duas transformações, pois a análise de delimitador requer símbolos específicos. Outras operações, como regras de domínio e alterações de valor de domínio, serão executadas após as transformações. Para correspondência, as relações baseadas em termos são aplicadas nos dados de origem antes da atividade correspondente, independentemente de você executar a limpeza.

Term-Based Relações e Gerenciamento de Domínios

Quando você aplica uma relação baseada em termos no gerenciamento de domínio, o DQS aplicará as alterações nos processos de descoberta, limpeza ou correspondência de conhecimento; no entanto, o DQS não altera o próprio valor de domínio para estar em conformidade com a relação baseada em termos. Em outras palavras, se você inserir e aceitar uma relação baseada em termos na guia RelaçõesTerm-Based da página Gerenciamento de Domínio , a alteração não será feita na guia Valores de Domínio da mesma página. Isso permite que você altere o TBR posteriormente.

Term-Based Relações e limpeza de dados

Quando você aplica uma relação baseada em termos em um domínio e, em seguida, executa o processo de limpeza de dados, o DQS aplica as alterações durante a limpeza, mas não aplica as alterações aos termos na base de dados de conhecimento.

  • Se um valor for alterado por uma relação baseada em termos estiver no domínio, mas não se tratar de um sinônimo, será mostrado na coluna Corrigir para na guia Corrigido da página Gerenciar e Exibir Resultados, com a razão definida como relação baseada em termos.

  • Se um valor como alterado por uma relação baseada em termos não estiver no domínio e o DQS encontrar um valor correspondente, o valor será corrigido e aparecerá na guia Corrigido ou na guia Sugerido, com base no nível de confiança. Se nenhuma correspondência for encontrada, o valor será exibido em Novo com uma correção de TBR. Isso é feito porque, mesmo se você corrigir o TBR, isso não significa que o valor esteja correto.

  • Se um valor for alterado por uma relação baseada em termos estiver no domínio, mas o valor for Erro/Inválido com a correção existente, o valor aparecerá na guia Atualizado com sua correção, e o motivo sendo Valor do Domínio.

  • Se um valor alterado por uma relação baseada em termos estiver no domínio, mas o valor for Erro/Inválido sem correção, ele será exibido na guia Inválido com o motivo Valor do Domínio.

Term-Based relações e descoberta de conhecimento

Quando você aplica uma relação baseada em termos e, em seguida, executa o processo de descoberta de conhecimento, qualquer valor que esteja em conformidade com o TBR permanecerá como está e será identificado como um valor correto. Qualquer valor alterado por um TBR será importado como um valor correto e será identificado como um sinônimo para um valor que esteja em conformidade com o TBR.

Term-Based Relacionamentos e Importação de Valores de Depuração em um Domínio

Se você importar o conhecimento sobre a qualidade dos dados, coletado durante o processo de limpeza, em um domínio, um valor alterado por um TBR será importado como valor correto.

Antes de começar

Pré-requisitos

Para criar relações baseadas em termos, você deve ter um domínio aberto na atividade de Gerenciamento de Domínio.

Segurança

Permissões

Você deve ter a função dqs_kb_editor ou dqs_administrator no banco de dados DQS_MAIN para criar relações baseadas em termos.

Criar relações baseadas em termos

  1. Iniciar o Cliente Data Quality. Para obter informações sobre como fazer isso, consulte Executar o aplicativo do Data Quality Client.

  2. Na tela inicial do Cliente de Qualidade de Dados, abra ou crie uma base de dados de conhecimento. Selecione o Gerenciamento de Domínio como a atividade e clique em Abrir ou Criar. Para obter mais informações, consulte Criar uma base de dados de conhecimento ou abrir uma base de dados de conhecimento.

    Observação

    O gerenciamento de domínio é executado em uma página do cliente do Serviço de Qualidade de Dados que contém cinco guias para operações de gerenciamento de domínio separadas. Não é um processo orientado por assistente; qualquer operação de gerenciamento pode ser executada separadamente.

  3. Na lista Domínio na página Gerenciamento de Domínio , selecione o domínio para o qual você deseja criar uma regra de domínio ou crie um novo domínio. Se você precisar criar um novo domínio, consulte Criar um Domínio.

  4. Clique na guia Term-Based Relações.

  5. Crie relações baseadas em termos da seguinte maneira:

    1. Clique em Adicionar Nova Relação para adicionar uma linha à tabela Relações.

    2. Para a coluna Valor da linha adicionada, insira um termo que você deseja alterar sempre que ocorrer em um valor no domínio selecionado.

      Observação

      Você receberá um erro se o termo existir como um valor inteiro no domínio ou se ele já existir como um valor de correção no domínio.

    3. Para a coluna Corrigir para, insira um termo que você deseja usar para substituir o termo na coluna Valor.

    4. Clique em Adicionar Novas Relações novamente para adicionar outra relação baseada em termos.

    5. Clique em Excluir Relações Selecionadas para excluir uma ou mais linhas selecionadas da tabela Relações. Você pode selecionar várias linhas pressionando o botão Ctrl e clicando em uma linha não selecionada.

    6. Localize um valor na tabela Relações inserindo um ou mais dígitos na caixa Localizar texto. As correspondências da cadeia de caracteres serão realçadas. Use as setas para cima e para baixo para navegar por diferentes ocorrências do texto na tabela.

    7. Verificador ortográfico: se um valor na coluna Value ou Correct to tiver um sublinhado vermelho ondulado, o Verificador Ortográfico está sugerindo uma correção para o valor. Clique com o botão direito do mouse no valor com o sublinhado e selecione um dos valores propostos pelo Verificador Ortográfico. Como alternativa, você pode clicar em Adicionar no menu de atalho tp continuar com o valor original. Para obter mais informações, consulte Usar o Verificador Ortográfico do DQS e definir propriedades de domínio.

      Observação

      Para usar o Verificador Ortográfico, você pode habilitá-lo na página Propriedades do Domínio ou, se ele estiver desabilitado na página Propriedades do Domínio , você pode clicar no ícone Habilitar/Desabilitar O Verificador ortográfico na página relações deTerm-Based para habilitá-lo nesta página.

  6. Clique em Aplicar Alterações para aplicar as relações baseadas em termos ao domínio.

  7. Clique em Concluir para concluir a atividade de gerenciamento de domínio, conforme descrito em Encerrar a Atividade de Gerenciamento de Domínio.

Seguimento: depois de criar relações de Term-Based

Depois de criar relações baseadas em termos, você pode executar outras tarefas de gerenciamento de domínio no domínio, executar a descoberta de conhecimento para adicionar conhecimento ao domínio ou adicionar uma política de correspondência ao domínio. Para obter mais informações, consulte Executar descoberta de conhecimento, gerenciar um domínio ou criar uma política de correspondência.