Partilhar via


Adicionando conhecimento a uma base de dados de conhecimento

Aplica-se a:SQL Server

Importante

Os Serviços de Qualidade de Dados (DQS) foram removidos no SQL Server 2025 (17.x). Continuamos a oferecer suporte ao DQS no SQL Server 2022 (16.x) e em versões anteriores.

Este tópico descreve as maneiras pelas quais você pode adicionar conhecimento a uma base de dados de conhecimento no Data Quality Services (DQS). Antes de executar operações de qualidade de dados, você precisa ter conhecimento sobre os dados. Você adquire esse conhecimento criando e mantendo uma base de dados de conhecimento de qualidade de dados e adicionando a ela conhecimento relacionado a um tipo específico de fonte de dados. A base de conhecimento é um repositório de conhecimento sobre os seus dados que lhe permite compreender os seus dados e manter a sua integridade.

A base de dados de conhecimento contém domínios de dados relacionados à fonte de dados. Para cada domínio de dados, o DQKB armazena todos os termos identificados, erros ortográficos, regras de validação e de negócios e dados de referência que podem ser usados para executar ações de qualidade de dados na fonte de dados. O DQS usa esse conhecimento para identificar dados incorretos ou inválidos e realizar comparações.

Você pode adicionar conhecimento a uma base de dados de conhecimento das seguintes maneiras assistidas por computador ou interativas.

Realizar descoberta de conhecimento

A descoberta de conhecimento analisa uma amostra de dados para critérios de qualidade de dados e, em seguida, adiciona o conhecimento adquirido à base de conhecimento. Trata-se de um processo assistido por computador que identifica inconsistências de dados e erros de sintaxe e propõe alterações aos dados. A atividade de descoberta de conhecimento é um assistente que inclui uma página na qual você pode gerenciar valores de domínio interativamente.

Gerenciar valores de dados em um domínio

O DQS permite alterar e aumentar interativamente os metadados gerados pela atividade de descoberta de conhecimento assistida por computador. Você faz isso na atividade Gerenciamento de Domínio, onde pode aplicar uma alteração a um valor de dados específico.

Importar conhecimento de um arquivo .dqs

Você pode importar um domínio de um arquivo de dados .dqs para uma base de dados de conhecimento existente ou pode importar uma base de dados de conhecimento inteira de uma base de dados .dqs para uma nova base de dados de conhecimento. Para fazer isso, primeiro você precisa exportar um domínio ou base de dados de conhecimento existente para um arquivo .dqs. Um arquivo .dqs contendo um domínio inclui todos os dados do domínio; Um arquivo .dqs contendo uma base de dados de conhecimento conterá todas as informações da base de dados de conhecimento, incluindo domínios e a política correspondente.

Importar conhecimento de um arquivo do Excel

Você pode importar valores de domínio de um arquivo de planilha do Excel para um domínio ou base de dados de conhecimento existente. Para fazer isso, você deve primeiro criar uma planilha do Excel com os valores de domínio que deseja importar e garantir que o Excel esteja instalado no computador Cliente Data Quality para que você possa importar valores usando o Cliente Data Quality. Não é possível exportar valores de domínio de um domínio ou base de dados de conhecimento para um arquivo do Excel.

Importar conhecimento de um projeto de volta para a Base de Dados de Conhecimento

Depois de executar um projeto de qualidade de dados de limpeza ou correspondência usando uma base de conhecimento, pode-se importar o conhecimento criado durante a limpeza ou correspondência de volta para essa base de conhecimento. Isso permite que você mantenha o conhecimento gerado durante o projeto e construa continuamente o conhecimento na base de conhecimento.

Usar a Base de Conhecimento DQS Padrão

O DQS é fornecido com uma base de conhecimento pré-construída chamada DQS Data que contém domínios para dados de empresas e endereços dos Estados Unidos. Essa base de dados de conhecimento pode ser usada para iniciar rapidamente um projeto sem criar uma nova base de dados de conhecimento. A base de conhecimento DQS Data é somente leitura, mas o administrador de dados pode criar uma nova base de conhecimento baseando-se nela.