Compartilhar via


Criar um domínio composto

Este tópico descreve como criar um domínio composto em uma base de dados de conhecimento no DQS (Data Quality Services). Um domínio composto consiste em um ou mais domínios individuais que se aplicam a um único campo de dados. Para obter mais informações sobre domínios compostos, consulte Gerenciando um domínio composto.

Há duas maneiras de criar um novo domínio composto. A primeira é durante a etapa Mapa da atividade de descoberta de conhecimento, quando você está no processo de analisar um exemplo de dados para adicionar conhecimento a uma base de dados de conhecimento nova ou existente. A segunda é durante a atividade de gerenciamento de domínio, quando em vez de alterar um domínio existente, você cria um novo. Para criar um domínio composto, você já deve ter criado pelo menos dois domínios únicos para adicionar ao domínio composto. Somente os domínios únicos que já foram criados e que não foram adicionados a um domínio composto existente estão disponíveis quando você cria um novo domínio composto. Um único domínio não pode ser adicionado a mais de um domínio composto e um domínio composto não pode ser adicionado a outro domínio composto.

Depois de criar um domínio composto, você pode alterar as propriedades do domínio composto, anexar um serviço de dados de referência ao domínio, criar regras entre domínios ou criar relações de valor. Para fazer isso, selecione o domínio composto na lista domínio da página Gerenciamento de Domínio e selecione a guia apropriada.

Antes de começar

Pré-requisitos

Para criar um domínio composto, você deve ter criado e aberto uma base de dados de conhecimento e deve ter criado pelo menos dois domínios únicos para adicionar ao domínio composto.

Segurança

Permissões

Você deve ter a função dqs_kb_editor ou dqs_administrator no banco de dados DQS_MAIN para criar um domínio composto.

Criar um domínio composto na atividade de descoberta de conhecimento

  1. Iniciar o Cliente Data Quality. Para obter informações sobre como fazer isso, consulte Executar o aplicativo do Data Quality Client.

  2. Na tela inicial do Cliente de Qualidade de Dados, clique em Abrir base de dados de conhecimento e selecione uma base de dados de conhecimento ou clique em Nova base de dados de conhecimento e insira propriedades para a nova base de dados de conhecimento.

  3. Selecione Descoberta de Conhecimento como atividade e clique em Criar para criar a nova base de dados de conhecimento ou Abrir para abrir uma base de dados de conhecimento existente.

  4. Na página Mapa , especifique uma conexão com a fonte de dados. Para obter mais informações, consulte Executar Descoberta de Conhecimento.

  5. Na tabela Mapeamentos selecione uma coluna de origem na lista suspensa para a coluna Coluna de Origem de uma linha vazia. Verifique se a coluna de origem contém o domínio composto endereçado por dois domínios únicos existentes. Se nenhum domínio único correspondente existir, clique no ícone Criar um Domínio .

  6. Na tabela Mapeamentos selecione uma coluna de origem na lista suspensa para a coluna Coluna de Origem de uma linha vazia. Verifique se a coluna de origem contém partes de domínio compostas das quais são tratadas por dois domínios únicos existentes. Se nenhum domínio único correspondente existir, clique no ícone Criar um Domínio para criá-los. Para obter mais informações, consulte Criar um domínio.

  7. Clique no ícone Criar um Domínio Composto .

Criar um domínio composto na atividade de gerenciamento de domínio

  1. Na home page do cliente do Data Quality Services, clique em Abrir base de dados de conhecimento e selecione uma base de dados de conhecimento ou clique em Nova base de dados de conhecimento e insira propriedades para a nova base de dados de conhecimento.

  2. Selecione o Gerenciamento de Domínio como atividade e clique em Criar para criar a nova base de dados de conhecimento ou Abrir para abrir uma base de dados de conhecimento existente.

  3. Verifique se existem dois ou mais domínios únicos exigidos pelo domínio composto. Caso contrário, clique no ícone Criar um Domínio e crie-o. Para obter mais informações, consulte Criar um domínio.

  4. Na página Gerenciamento de Domínio , clique no ícone Criar um Domínio Composto acima da lista domínio.

  5. Insira um nome exclusivo para a base de dados de conhecimento e uma descrição de até 256 caracteres.

  6. Na Lista de Domínios, selecione os domínios que farão parte do domínio composto e clique na seta para a direita para movê-los para os Domínios na tabela Domínio Composto .

  7. Clique em OK.

Definir propriedades de domínio composto

  1. Na caixa de diálogo Criar um Domínio Composto , insira um nome exclusivo para a base de dados de conhecimento e uma descrição de até 256 caracteres.

  2. Na Lista de Domínios, selecione os domínios que farão parte do domínio composto e clique na seta para a direita para movê-los para os Domínios na tabela Domínio Composto . Esta é uma lista de domínios únicos que estão disponíveis para serem adicionados ao domínio composto que você está criando. Somente os domínios únicos que já foram criados e que não foram adicionados a um domínio composto existente estão disponíveis. Um único domínio não pode ser adicionado a mais de um domínio composto na base de dados de conhecimento e um domínio composto não pode ser adicionado a outro domínio composto.

  3. Clique em Avançado.

  4. Selecione um dos seguintes para o Método de Análise:

    • Dados de Referência: analise os valores do campo de acordo com a forma como os dados são formatados pelo SERVIÇO de Dados de Referência (RDS). Os Serviços de Qualidade de Dados enviarão os valores no domínio composto para o RDS e o RDS retornará os dados corrigidos e analisados de acordo com o domínio no domínio composto.

    • Em Ordem: analise os valores do campo de acordo com a ordem dos domínios no domínio composto. O primeiro valor será incluído no primeiro domínio, o segundo valor no segundo domínio e assim por diante.

    • Delimitadores: analise os valores do campo com base no delimitador selecionado nos botões de opção exibidos ao selecionar Delimitadores. Pode ser Tab, Ponto-e-vírgula, Vírgula, Espaço ou Outro. Se Outro, insira o valor que servirá como delimitador.

  5. Se você selecionou Delimitadores para o método de análise, também poderá selecionar Usar Análise Baseada em Conhecimento. Para obter mais informações, consulte Knowledge-Based Análise.

  6. Clique em Concluir para concluir a atividade de gerenciamento de domínio, conforme descrito em Encerrar a Atividade de Gerenciamento de Domínio.

Acompanhamento: depois de criar um domínio composto

Depois de criar um domínio composto, você pode executar outras tarefas de gerenciamento de domínio no domínio, executar a descoberta de conhecimento para adicionar conhecimento ao domínio ou adicionar uma política de correspondência ao domínio. Para obter mais informações, consulte Executar descoberta de conhecimento, gerenciar um domínio ou criar uma política de correspondência.

Análise de Knowledge-Based

Os Serviços de Qualidade de Dados permitem que você analise dados com base no conhecimento, não apenas no delimitador ou na ordem. A análise baseada em conhecimento é usada quando dados de origem complexos são mapeados para um domínio composto e você não está usando serviços de dados de referência. Você pode usar a análise baseada em conhecimento para analisar os dados da fonte de dados nos domínios individuais relevantes. Com a análise baseada em conhecimento, o DQS primeiro tentará usar o conhecimento para analisar dados complexos em domínios únicos. Se possível, ele identificará partes da cadeia de caracteres como em um ou mais domínios e analisará a cadeia de caracteres em seus vários domínios. Por exemplo, suponha que você tenha "John B. Doe" como um valor complexo em um campo de nome completo representado por um domínio composto de nome completo. Se o DQS identificar "John" como no domínio Nome e "Doe" como no domínio Sobrenome, o DQS adicionará "B" ao domínio nome médio com base no conhecimento do domínio.

Você só poderá usar a análise baseada em conhecimento se também selecionar a análise baseada em delimitador. A análise baseada em conhecimento não substitui a análise de delimitador, mas a aprimora. Somente se não houver conhecimento para fazer isso, o DQS usará um delimitador para fazer a análise. Em alguns casos, o DQS pode determinar algumas análises por análise baseada em conhecimento e, em seguida, determinar outra análise por análise baseada em delimitador.

A análise baseada em conhecimento pode ser usada quando o domínio composto é composto por domínios de cadeia de caracteres ou quando o domínio composto é composto por uma combinação de diferentes tipos de domínios (int, data, hora etc. Se a fonte de dados for composta por diferentes tipos de dados, a análise deverá ser feita primeiro para os tipos de dados que não são de cadeia de caracteres e, em seguida, conforme descrito acima com base no conhecimento do domínio para o restante dos dados.

Quando você estiver usando a análise baseada em conhecimento e houver menos valores nos dados de origem do que domínios no domínio composto, o DQS colocará um nulo no domínio ausente. Quando houver mais valores nos dados de origem do que domínios no domínio composto, o DQS adicionará os dados extras a uma das colunas. Se dois ou mais domínios incluirem os mesmos valores, a fonte de dados será analisada para o primeiro domínio correspondente.