Partilhar via


Anexar um domínio ou domínio composto a dados de referência

Este tópico descreve como anexar domínios/domínios compostos a uma base de conhecimento de qualidade de dados em um serviço de dados de referência no Azure Marketplace, para construir conhecimento com base em dados de referência de alta qualidade. Cada serviço de dados de referência contém um esquema (colunas de dados). Depois de anexar um domínio ou um domínio composto a um serviço de dados de referência, você deve mapear o domínio anexado ou os domínios individuais dentro do domínio composto anexado às colunas apropriadas em um esquema de serviço de dados de referência. Anexar um domínio composto a um serviço de dados de referência permite anexar apenas um domínio a um serviço de dados de referência e mapear os domínios individuais dentro do domínio composto para colunas apropriadas no esquema do serviço de dados de referência.

Aviso

O domínio composto anexado a um serviço de dados de referência está disponível na lista suspensa de domínios quando se estão mapeando os domínios para as colunas no esquema do serviço de dados de referência. Não mapeie o domínio composto para uma coluna no esquema de serviço de dados de referência; você só deve mapear domínios individuais dentro de um domínio composto para as colunas apropriadas no esquema do serviço de dados de referência. Caso contrário, isso resultará em um erro.

Um esquema de serviço de dados de referência pode ter uma coluna obrigatória que deve ser mapeada com o domínio apropriado caso você opte por usar o serviço de dados de referência. A coluna obrigatória em um esquema de dados de referência é identificada com "(M)" no nome da coluna. Por exemplo, AddressLine é a coluna de esquema obrigatória em Melissa Data – Dados de Endereço e CompanyName é a coluna de esquema obrigatória na Digital Trowel Inc. – Empresas dos EUA e dados profissionais para usuários do SQL.

Neste tópico, criaremos quatro domínios: Linha de Endereço, Cidade, Estado e Zip, em um domínio composto, Verificação de Endereço, anexaremos o domínio composto ao serviço de dados de referência Melissa Data – Address Check e mapearemos os domínios individuais dentro do domínio composto para colunas apropriadas no esquema do serviço de dados de referência.

Antes de começar

Pré-requisitos

Você deve ter configurado o DQS (Data Quality Services) para usar serviços de dados de referência. Consulte Configurar o DQS para usar dados de referência.

Segurança

Permissões

Você deve ter a função dqs_kb_editor no banco de dados DQS_MAIN para mapear domínios para fazer referência aos dados.

Mapear domínios para fazer referência a dados da Melissa Data

  1. Iniciar o Cliente Data Quality. Para obter informações sobre como fazer isso, consulte Executar o aplicativo do Data Quality Client.

  2. Na tela inicial do Cliente de Qualidade de Dados, em Gerenciamento de Base de Dados de Conhecimento, clique em Nova base de dados de conhecimento.

  3. Na tela Nova base de dados de conhecimento , digite um nome para a nova base de dados de conhecimento, clique na atividade Gerenciamento de Domínio e clique em Criar.

  4. Na tela Gerenciamento de Domínio , clique no ícone Criar um domínio para criar um domínio. Crie os quatro domínios a seguir: Linha de Endereço, Cidade, Estado e Zip.

  5. Clique no ícone Criar um domínio composto para criar um domínio composto. Na caixa de diálogo Criar um domínio composto , digite Verificação de Endereço na caixa Nome de Domínio Composto e inclua todos os domínios criados na etapa 3 no domínio composto. Clique em OK.

  6. No painel Domínio à esquerda, selecione o domínio composto clicando em Verificação de Endereço e clique na guia Dados de Referência no lado direito.

  7. Clique no ícone Procurar .

  8. Na caixa de diálogo Catálogo de Provedores de Dados de Referência Online :

    1. Em DataMarket Data Quality Services, selecione a caixa de seleção Melissa Data – Address Check.

    2. Mapeie as colunas do serviço de dados de referência Melissa Data – Verificação de Endereço com os domínios apropriados (Linha de Endereço, Cidade, Estado e Zip). Você mapeia as colunas selecionando uma coluna de serviço de dados de referência na coluna Esquema RDS e selecionando o domínio apropriado na coluna Domínio . Para adicionar mais linhas na tabela, clique no ícone Adicionar Entrada de Esquema .

    3. Clique em OK para salvar as alterações e feche a caixa de diálogo Catálogo de Provedores de Dados de Referência Online .

      Caixa de diálogo Catálogo de Provedores de Dados de Referência Online Caixa de

      Observação

      • Na caixa de diálogo Catálogo de Provedores de Dados de Referência Online , o nó DataMarket Data Quality Services exibe todos os provedores de serviços de dados de referência aos quais você se inscreveu no Azure Marketplace. Se você tiver configurado provedores de serviços de dados de referência de terceiros online diretos no DQS, eles aparecerão em outro nó chamado Provedores Diretos Online de terceiros (não disponíveis agora, pois nenhum provedor de serviço de dados de referência de terceiros online direto está configurado no DQS).
  9. Você retornará à guia Dados de Referência . Na área Configurações do Provedor, altere os valores nas seguintes caixas, se necessário:

    • Limite de Correção Automática: as correções do serviço de dados de referência com nível de confiança acima desse limite serão feitas automaticamente. Insira um valor na notação decimal do valor de porcentagem correspondente. Por exemplo, insira 0,9 para 90%.

    • Candidatos Sugeridos: Número de candidatos sugeridos a serem exibidos do serviço de dados de referência.

    • Min Confidence: as sugestões do serviço de dados de referência com nível de confiança inferior a esse valor serão ignoradas. Insira um valor na notação decimal do valor de porcentagem correspondente. Por exemplo, insira 0,6 para 60%.

  10. Clique em Concluir para publicar a base de dados de conhecimento. Uma mensagem de confirmação é exibida depois que a base de dados de conhecimento é publicada com êxito.

Agora você pode usar essa base de conhecimento para uma atividade de limpeza em um projeto de qualidade de dados, visando padronizar e limpar endereços dos EUA nos seus dados de origem com base no conhecimento fornecido pela Melissa Data por meio do Azure Marketplace.

Acompanhamento: depois de mapear um domínio para referenciar dados

Crie um projeto de qualidade de dados e execute a atividade de limpeza em seus dados de origem que contêm endereços dos EUA comparando-o com a base de dados de conhecimento criada neste tópico. Consulte Limpar dados usando dados de referência (externos).

Consulte Também

Serviços de Dados de Referência no DQS
Limpeza de dados