Compartilhar via


DQS (Projetos de Qualidade de Dados)

Um projeto de qualidade de dados no DQS (Data Quality Services) é um meio de usar uma base de dados de conhecimento para melhorar a qualidade dos dados de origem executando atividades de limpeza de dados e correspondência de dados e exportando os dados resultantes para um banco de dados do SQL Server ou um arquivo .csv. Você pode criar um projeto de qualidade de dados como um projeto de limpeza ou um projeto correspondente para executar as respectivas atividades. Projetos de limpeza e adequação podem ser executados usando a mesma base de conhecimento, pois o conhecimento para limpeza e adequação de dados pode ser integrado à mesma base de conhecimento.

Um projeto de qualidade de dados tem os seguintes benefícios:

  • Permite que você execute a limpeza de dados em seus dados de origem usando o conhecimento em uma base de conhecimento do DQS.

  • Permite que você realize o pareamento de dados em seus dados de origem utilizando a política de pareamento em uma base de conhecimento.

  • Fornece um assistente para guiá-lo pelas atividades de limpeza e correspondência, e então exportar os dados conforme sua seleção para um banco de dados do SQL Server ou para um arquivo .csv. O administrador de dados pode usar o projeto de qualidade de dados para executar e controlar as etapas de limpeza e correspondência de dados assistidas por computador/interativas.

Projeto de Qualidade de Dados: Atividade de Limpeza

Um projeto de limpeza de qualidade de dados permite que você higienize seus dados de origem com base em uma base de conhecimento. A atividade de limpeza de dados no DQS é um processo de duas etapas:

  1. Um processo de limpeza de dados assistido por computador que analisa os dados de origem em relação ao conhecimento na base de dados de conhecimento e propõe alterações. Os dados processados são categorizados (sugeridos, novos, inválidos, corrigidos e corretos) pelo DQS e exibidos ao usuário para processamento adicional.

  2. Um processo de limpeza interativo que permite que o administrador de dados aprove, rejeite ou modifique os dados propostos pelo processo de limpeza de dados assistidos por computador.

Para obter informações detalhadas sobre a atividade de limpeza em um projeto de qualidade de dados, consulte Limpeza de Dados.

Projeto de Qualidade de Dados: Atividade correspondente

Um projeto de qualidade de dados de correspondência permite que você execute atividades de correspondência com base na política de correspondência em uma base de conhecimento, visando impedir a duplicação de dados ao identificar correspondências exatas e aproximadas, permitindo assim que você remova dados duplicados. É recomendável que você limpe seus dados antes de executar a comparação. Para fazer isso:

  1. Crie um projeto de qualidade de dados, selecione a atividade limpeza , conclua a atividade de limpeza de dados em seus dados de origem e exporte-a para uma tabela em um banco de dados do SQL Server.

  2. Crie outro projeto de qualidade de dados usando uma base de conhecimento que contenha uma política de correspondência, selecione a atividade Correspondência e, na página Mapa, selecione o banco de dados e a tabela onde você exportou os dados limpos na etapa 1.

  3. Conclua a atividade de correspondência nos dados limpos.

Para obter informações detalhadas sobre a atividade correspondente em um projeto de qualidade de dados, consulte Correspondência de Dados.

Criação de perfil de dados e notificações

Ao executar as atividades de limpeza e correspondência em um projeto de qualidade de dados, você pode ver estatísticas e informações em tempo real sobre os dados que estão sendo processados pelo DQS. A criação de perfil de dados ajuda você a avaliar a eficácia dos processos de limpeza e correspondência, e você pode potencialmente determinar até que ponto a limpeza de dados ou correspondência ajudou a melhorar a qualidade dos dados. A criação de perfil DQS fornece duas dimensões de qualidade de dados: integridade (até que ponto os dados estão presentes) e precisão (até que ponto os dados podem ser usados para seu uso pretendido). Além disso, com base nas informações de criação de perfil de dados, as notificações são exibidas ao usuário sobre as ações que podem ser executadas para aprimorar as operações de limpeza de dados e correspondência de dados. Para obter informações detalhadas sobre criação de perfil de dados e notificações, consulte Criação de Perfil de Dados e Notificações no DQS.

Descrição da tarefa Tópico
Descreve como criar um projeto de qualidade de dados. Criar um projeto de qualidade de dados
Descreve como gerenciar (abrir, desbloquear, renomear e excluir) um projeto de qualidade de dados. Gerenciar (abrir, desbloquear, renomear e excluir) um projeto de qualidade de dados
Descreve como abrir um projeto do Integration Services no Cliente de Qualidade de Dados. Abrir projetos do Integration Services no cliente Data Quality

Consulte Também

Bases de dados de conhecimento e domínios do DQS