Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este tema se proporciona información sobre la limpieza de dominios compuestos en Data Quality Services (DQS). Un dominio compuesto consta de dos o más dominios únicos y se asigna a un campo de datos que consta de varios términos relacionados. Los dominios individuales de un dominio compuesto deben tener un área común de conocimiento. Para obtener información detallada sobre los dominios compuestos, consulte Administración de un dominio compuesto.
Asignación de un dominio compuesto a los datos de origen
Hay dos maneras de asignar los datos de origen a un dominio compuesto:
Los datos de origen son un único campo (supongamos nombre completo), que se asigna a un dominio compuesto.
Si el dominio compuesto se asigna a un servicio de datos de referencia, los datos de origen se enviarán tal como está al servicio de datos de referencia para la corrección y el análisis.
Si el dominio compuesto no está asignado a un servicio de datos de referencia, se analizará en función del método de análisis definido para el dominio compuesto. Para obtener más información sobre cómo especificar un método de análisis para dominios compuestos, consulte Creación de un dominio compuesto.
Los datos de origen constan de varios campos (supongamos First Name, Middle Name y Last Name), que se asignan a dominios individuales dentro de un dominio compuesto.
Para obtener un ejemplo de cómo asignar dominios compuestos a datos de origen, vea Adjuntar un dominio o un dominio compuesto a datos de referencia.
Corrección de datos mediante reglas definitivas entre dominios
Las reglas entre dominios del dominio compuesto permiten crear reglas que indican la relación entre dominios individuales de un dominio compuesto. Las reglas entre dominios se tienen en cuenta al ejecutar la actividad de limpieza en los datos de origen que implican dominios compuestos. Además de simplemente informarle sobre la validez de una regla entre dominios, la regla definitiva Then entre dominios, Value es igual a, también corrige los datos durante la actividad de limpieza de datos.
Considere el ejemplo siguiente: hay un dominio compuesto, Product, con tres dominios individuales: ProductName, CompanyName y ProductVersion. Cree la siguiente regla definitiva entre dominios:
Si el valor del dominio 'CompanyName' contiene Microsoft y el valor del dominio 'ProductName' es igual a Office y el valor de 'ProductVersion' es igual a 2010, entonces el valor del dominio 'ProductName' es igual a Microsoft Office 2010.
Cuando se ejecuta esta regla entre dominios, los datos de origen (ProductName) se corrigen a lo siguiente después de la actividad de limpieza:
Datos de origen
| ProductName | CompanyName | Versión del Producto |
|---|---|---|
| Oficina | Microsoft Inc. | 2010 |
Datos de salida
| ProductName | CompanyName | Versión del Producto |
|---|---|---|
| Microsoft Office 2010 | Microsoft Inc. | 2010 |
Cuando se prueba la regla definitiva Then cross-domain, Value is equal to, el cuadro de diálogo Test Composite Domain Rule contiene una nueva columna, Correct To, que muestra los datos correctos. En un proyecto de depuración de calidad de datos, esta regla definitiva entre dominios cambia los datos con una confianza de 100%, y la columna Motivo muestra el siguiente mensaje: Corregido por la regla '<Regla entre dominios>'. Para obtener más información sobre las reglas entre dominios, vea Crear una regla entre dominios.
Nota:
La regla definitiva entre dominios no funcionará para los dominios compuestos que están asociados al servicio de datos de referencia.
Generación de perfiles de datos para dominios compuestos
La generación de perfiles de DQS proporciona dos dimensiones de calidad de datos: integridad (la medida en que los datos están presentes) y precisión (la medida en que se pueden usar los datos para su uso previsto) durante la actividad de limpieza. La generación de perfiles puede no proporcionar estadísticas de integridad confiables para dominios compuestos. Si necesita estadísticas de integridad, use dominios únicos en lugar de dominios compuestos. Si desea usar dominios compuestos, puede crear una base de conocimiento con dominios únicos para la generación de perfiles, determinar la integridad y crear otro dominio con un dominio compuesto para la actividad de limpieza. Por ejemplo, la generación de perfiles podría mostrar una incompletitud del 95 %% para los registros de direcciones que usan un dominio compuesto, pero podría haber un nivel mucho mayor de incompletitud para una de las columnas, por ejemplo, una columna de código postal. En este ejemplo, puede que quiera medir la integridad de la columna de código postal con un solo dominio.
La generación de perfiles probablemente proporcionará estadísticas de precisión confiables para dominios compuestos, ya que puede medir la precisión de varias columnas juntas. El valor de estos datos está en la agregación compuesta, por lo que es posible que desee medir la precisión con un dominio compuesto.
Para obtener información detallada sobre el perfilado de datos durante la actividad de limpieza, consulte Estadísticas del perfilador en el documento Limpiar datos mediante conocimiento interno de DQS.