Partilhar via


Definir propriedades do domínio

Este tópico descreve como definir propriedades de domínio no DQS (Data Quality Services).

Antes de começar

Pré-requisitos

Para definir propriedades para um domínio, você deve ter criado uma base de dados de conhecimento e um domínio.

Segurança

Permissões

Você deve ter a função dqs_kb_editor ou dqs_administrator no banco de dados DQS_MAIN para definir propriedades em um domínio.

Definir propriedades do domínio

  1. Defina propriedades em um domínio existente abrindo uma base de dados de conhecimento na atividade de Gerenciamento de Domínio (consulte Abrir uma Base de Dados de Conhecimento) e selecionando o domínio apropriado na lista de domínios . A página Propriedades do Domínio será exibida por padrão.

  2. Defina propriedades em um novo domínio depois de criá-lo, conforme descrito em Criar um Domínio.

  3. Clique em Concluir para concluir a atividade de gerenciamento de domínio, conforme descrito em Encerrar a Atividade de Gerenciamento de Domínio.

Acompanhamento: depois de definir propriedades de domínio

Depois de definir propriedades de domínio, você pode executar outras tarefas de gerenciamento de domínio no domínio, executar a descoberta de conhecimento para adicionar conhecimento ao domínio ou adicionar uma política de correspondência ao domínio. Para obter mais informações, consulte Executar descoberta de conhecimento, gerenciar um domínio ou criar uma política de correspondência.

Propriedades de domínio

Nome de domínio e descrição

Depois que um domínio for criado, o nome de domínio ou a descrição poderão ser alterados. O nome de domínio deve ser exclusivo para a base de dados de conhecimento. A descrição pode ter até 256 caracteres.

Tipo de Dados

Ao criar o domínio, selecione um dos seguintes tipos de dados para os valores no domínio: Cadeia de caracteres (o padrão), Data, Inteiro ou Decimal. Depois de criar o domínio, você pode exibir o tipo de dados, mas não pode alterá-lo. O tipo de dados selecionado para um domínio define o tipo de dados de origem que podem ser mapeados para o domínio. Para obter informações sobre tipos de dados com suporte para cada um dos quatro tipos de dados de domínio no DQS, consulte SQL Server com suporte e tipos de dados SSIS para domínios DQS.

Usar valores orientadores

Marque esta caixa de seleção para especificar que o valor principal em um grupo de sinônimos será exibido em vez de um valor que é sinônimo dele. Desmarque Usar Valores Principais para especificar que cada valor de sinônimo é produzido em sua forma correta ou corrigida e não é substituído pelo valor principal de seu grupo.

Normalizar cadeia de caracteres

Se o tipo de dados for String, clique para ignorar os caracteres especiais nos dados de origem para processamento de qualidade de dados pelo DQS. O DQS substitui internamente os caracteres especiais por um null ou um espaço quando os dados são carregados no domínio. Dois-pontos, hífen, ponto, aspas duplas ou ponto-e-vírgula são substituídos por um espaço. Uma única aspa é substituída por um nulo. Usar o nulo reúne as duas partes da cadeia de caracteres.

Ignorar caracteres especiais em um valor de cadeia de caracteres pode aumentar a precisão de correspondência. A pontuação de similaridade entre duas cadeias de caracteres pode ser aumentada substituindo caracteres especiais por um espaço ou um nulo. Marcas de pontuação ou outros símbolos podem ser facilmente diferentes em cadeias de caracteres diferentes. Substituir caracteres especiais internamente pode permitir que a pontuação ultrapasse o limite mínimo de correspondência no DQS, fazendo com que duas cadeias de caracteres sejam consideradas correspondências quando não teriam sido assim de outra forma. No entanto, se você optar por ignorar caracteres especiais pode depender do tipo de dados nos quais você está realizando a correspondência. Por exemplo, quando você estiver trabalhando com dados no sistema de medição em inglês, ignorar aspas duplas e aspas simples nos dados do produto poderá resultar em falsos positivos se uma aspa dupla significar uma polegada e uma única aspa significar um pé.

A normalização é executada quando os dados são carregados e indexados nos estágios de processamento de dados da descoberta, da política correspondente, do projeto correspondente e da limpeza das atividades do projeto. Se habilitada, a normalização e a transformação de relações baseadas em termos são feitas em um estágio de pré-processamento antes da análise. Eles são executados em cada domínio antes que quaisquer algoritmos sejam aplicados que calculam a similaridade entre cadeias de caracteres. Se a análise de domínio composto for solicitada, ela será executada antes da normalização e da transformação de relações baseadas em termos, porque a análise de delimitadores requer símbolos. Outras operações, como regras de domínio e alterações de valor de domínio, serão executadas após as transformações. Os dados resultantes não são alterados pela substituição interna de caracteres especiais no DQS.

Formatar saída para

Selecione a formatação que será aplicada quando os valores de dados no domínio forem gerados. A formatação é específica para o tipo de dados selecionado, conforme mostrado na lista a seguir. Selecionar Nenhum significa que nenhum dos formatos na lista será aplicado.

  • Para um valor de cadeia de caracteres, você pode especificar que a cadeia de caracteres seja convertida em maiúsculas, minúsculas ou capitalizada.

  • Para um valor de data, você pode especificar o formato do dia, mês e ano.

  • Para um valor inteiro, você pode especificar o tipo de máscara de formato a ser aplicado.

  • Para um valor decimal, você pode especificar a precisão e o tipo de máscara de formato que será aplicada.

Idioma

Se o tipo de dados for String, selecione com qual idioma você deseja associar o domínio para a operação do verificador ortográfico. Essa seleção só se aplica ao verificador ortográfico, pois os resultados do verificador ortográfico dependem do idioma em uso. A seleção só se aplica a um único domínio com um tipo de dados é cadeia de caracteres. A propriedade de idioma não é relevante para domínios compostos. O idioma de cada parte de um domínio composto é determinado pelo domínio único relevante.

Inglês é o idioma padrão. Definir a propriedade Language como Outro desabilita o Verificador Ortográfico para o domínio.

Dica

Se o idioma não estiver listado na lista suspensa Idioma , você deverá selecionar Outros. Isso garante que o DQS limpe e elimine duplicatas para os dados de idioma não listados com base no conhecimento disponível (regras de domínio, valores de domínio, TBRs, regra de correspondência) no domínio.

Habilitar o Corretor Ortográfico

Se o tipo de dados for String, clique para habilitar o Verificador Ortográfico do DQS para o domínio. O Speller só funciona em domínios com um tipo de dados de cadeia de caracteres. A caixa de seleção Habilitar Verificador Ortográfico habilita o verificador ortográfico somente para o domínio único associado à caixa de seleção. A caixa de seleção não se aplica a um domínio composto.

O Verificador Ortográfico propõe correções de sintaxe e validação para valores no domínio. Para obter mais informações, consulte Usar o Verificador Ortográfico do DQS.

Desabilitar algoritmos de erro de sintaxe

Se o tipo de dados for String, selecione para especificar que os erros de sintaxe não serão identificados pelo DQS no domínio durante a limpeza. Marque esta caixa de seleção quando identificar erros de sintaxe para esse domínio for irrelevante. Por exemplo, identificar erros de sintaxe pode não importar para um número de série. Esse controle só está disponível para o tipo de dados de cadeia de caracteres. O DQS não verificará os tipos de dados que não são de cadeia de caracteres quanto a erros de sintaxe.