Compartir a través de


Proyectos de calidad de datos (DQS)

Un proyecto de calidad de datos en Data Quality Services (DQS) es un medio de usar una base de conocimiento para mejorar la calidad de los datos de origen realizando actividades de limpieza y coincidencia de datos y, a continuación, exportando los datos resultantes a una base de datos de SQL Server o un archivo .csv. Puede crear un proyecto de calidad de datos como un proyecto de limpieza o un proyecto coincidente para realizar las actividades respectivas. Los proyectos de limpieza y coincidencia se pueden ejecutar con la misma base de conocimiento, ya que el conocimiento para la limpieza y la coincidencia de datos se pueden integrar en la misma base de conocimiento.

Un proyecto de calidad de datos tiene las siguientes ventajas:

  • Permite depurar los datos de origen utilizando una base de conocimiento de DQS.

  • Te permite realizar el emparejamiento de datos en tus datos de origen mediante la política de emparejamiento en una base de conocimiento.

  • Proporciona un asistente para guiarle en las actividades de limpieza y emparejamiento, y exportar los datos según su selección a una base de datos de SQL Server o a un archivo de .csv. El administrador de datos puede usar el proyecto de calidad de datos para ejecutar y controlar los pasos de limpieza y coincidencia de datos asistidos por el equipo o interactivos.

Proyecto de calidad de datos: actividad de limpieza

Un proyecto de limpieza de calidad de datos le permite depurar los datos de origen en función de una base de conocimiento. La actividad de limpieza de datos en DQS es un proceso de dos pasos:

  1. Un proceso de limpieza de datos asistido por equipo que analiza los datos de origen con respecto al conocimiento de la base de conocimiento y propone cambios. Los datos procesados se clasifican (sugeridos, nuevos, no válidos, corregidos y correctos) por DQS y se muestran al usuario para su posterior procesamiento.

  2. Un proceso de limpieza interactivo que permite al administrador de datos aprobar, rechazar o modificar los datos propuestos por el proceso de limpieza de datos asistido por el equipo.

Para obtener información detallada sobre la actividad de limpieza en un proyecto de calidad de datos, consulte Limpieza de datos.

Proyecto de calidad de datos: actividad de emparejamiento

Un proyecto de calidad de datos coincidente permite realizar una actividad de coincidencia basada en la directiva de coincidencia en una base de conocimiento para evitar la duplicación de datos mediante la identificación de coincidencias exactas y aproximadas y, por lo tanto, le permite quitar datos duplicados. Se recomienda limpiar los datos antes de realizar la coincidencia de datos. Para ello:

  1. Cree un proyecto de calidad de datos, seleccione la actividad Limpieza , complete la actividad de limpieza de datos en los datos de origen y, a continuación, expórtela a una tabla de una base de datos de SQL Server.

  2. Cree otro proyecto de calidad de datos mediante una base de conocimiento que contenga una directiva de coincidencia, seleccione la actividad Coincidencia y, a continuación, en la página Mapa , seleccione la base de datos y la tabla donde exportó los datos limpios en el paso 1.

  3. Completa la actividad de emparejamiento en los datos depurados.

Para obtener información detallada sobre la actividad de coincidencia en un proyecto de calidad de datos, consulte Coincidencia de datos.

Generación de perfiles y notificaciones de datos

Al ejecutar las actividades de limpieza y coincidencia en un proyecto de calidad de datos, puedes ver estadísticas en tiempo real e información sobre los datos que están siendo procesados por DQS. La generación de perfiles de datos le ayuda a evaluar la eficacia de los procesos de limpieza y coincidencia, y puede determinar la medida en que la limpieza o la coincidencia de datos ayudaron a mejorar la calidad de los datos. La generación de perfiles de DQS proporciona dos dimensiones de calidad de datos: integridad (la medida en que los datos están presentes) y precisión (la medida en que se pueden usar los datos para su uso previsto). Además, en función de los perfiles de datos, se muestran notificaciones al usuario sobre las acciones que se pueden realizar para mejorar las operaciones de limpieza y compatibilidad de datos. Para obtener información detallada sobre la generación de perfiles de datos y las notificaciones, consulte Generación de perfiles de datos y notificaciones en DQS.

Descripción de la tarea Tema
Describe cómo crear un proyecto de calidad de datos. Crear un proyecto de calidad de datos
Describe cómo administrar (abrir, desbloquear, cambiar el nombre y eliminar) un proyecto de calidad de datos. Administrar (abrir, desbloquear, cambiar el nombre y eliminar) un proyecto de calidad de datos
Describe cómo abrir un proyecto de Integration Services en Data Quality Client. Abrir proyectos de Integration Services en Data Quality Client

Véase también

Bases de conocimiento y dominios de DQS