Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este tema se describe cómo adjuntar dominios o dominios compuestos en una base de conocimiento de calidad de datos a un servicio de datos de referencia en Azure Marketplace para crear conocimientos sobre los datos de referencia de alta calidad. Cada servicio de datos de referencia contiene un esquema (columnas de datos). Después de adjuntar un dominio o un dominio compuesto a un servicio de datos de referencia, debe asignar el dominio adjunto o los dominios individuales dentro del dominio compuesto adjunto a las columnas adecuadas en un esquema de servicio de datos de referencia. La asociación de un dominio compuesto a un servicio de datos de referencia le permite asociar solo un dominio a un servicio de datos de referencia y, a continuación, asignar los dominios individuales dentro del dominio compuesto a las columnas adecuadas en el esquema del servicio de datos de referencia.
Advertencia
El dominio compuesto asociado a un servicio de datos de referencia está disponible en la lista desplegable dominios mientras se asignan dominios a las columnas del esquema del servicio de datos de referencia. No asigne el dominio compuesto a una columna en el esquema del servicio de datos de referencia; Solo debe asignar dominios individuales dentro de un dominio compuesto a las columnas adecuadas en el esquema del servicio de datos de referencia. De lo contrario, se producirá un error.
Un esquema de servicio de datos de referencia puede incluir una columna obligatoria que debe asignarse al dominio adecuado en caso de utilizar el servicio de datos de referencia. La columna obligatoria de un esquema de referencia de datos se identifica con "(M)" junto al nombre de la columna. Por ejemplo, AddressLine es la columna de esquema obligatoria de Melissa Data - Address Data y CompanyName es la columna de esquema obligatoria en Digital Trowel Inc. - Empresas y datos profesionales para usuarios de SQL.
En este tema, crearemos cuatro dominios: Línea de dirección, Ciudad, Estado y Zip, en un dominio compuesto, Comprobación de direcciones, adjuntaremos el dominio compuesto al servicio de datos de referencia Melissa Data - Address Check y, a continuación, asignaremos los dominios individuales dentro del dominio compuesto a las columnas adecuadas en el esquema del servicio de datos de referencia.
Antes de empezar
Prerrequisitos
Debe haber configurado Data Quality Services (DQS) para usar los servicios de datos de referencia. Consulte Configuración de DQS para usar datos de referencia.
Seguridad
Permisos
Debe tener el rol dqs_kb_editor en la base de datos de DQS_MAIN para asignar dominios a los datos de referencia.
Mapear dominios para referenciar datos de Melissa Data
Inicie el cliente de calidad de datos. Para obtener información sobre cómo hacerlo, consulte Ejecución de la aplicación Data Quality Client.
En la pantalla principal de Data Quality Client, en Administración de knowledge base, haga clic en Nueva base de conocimiento.
En la pantalla Nueva base de conocimiento , escriba un nombre para la nueva base de conocimiento, haga clic en la actividad Administración de dominios y haga clic en Crear.
En la pantalla Administración de dominios , haga clic en el icono Crear un dominio para crear un dominio. Cree los cuatro dominios siguientes: Línea de direcciones, Ciudad, Estado y Zip.
Haga clic en el icono Crear un dominio compuesto para crear un dominio compuesto. En el cuadro de diálogo Crear un dominio compuesto , escriba Comprobación de direcciones en el cuadro Nombre de dominio compuesto e incluya todos los dominios creados en el paso 3 del dominio compuesto. Haz clic en Aceptar.
En el panel Dominio del lado izquierdo, seleccione el dominio compuesto haciendo clic en Comprobación de direcciones y, a continuación, haga clic en la pestaña Datos de referencia del lado derecho.
Haga clic en el icono Examinar .
En el cuadro de diálogo Catálogo de proveedores de datos de referencia en línea :
En DataMarket Data Quality Services, active la casilla Melissa Data - Address Check.
Mapee las columnas del servicio de datos de referencia de Melissa Data Address Check con los dominios adecuados (Línea de dirección, Ciudad, Estado y Código Postal). Para asignar las columnas, seleccione una columna de servicio de datos de referencia en la columna Esquema de RDS y, a continuación, seleccione el dominio adecuado en la columna Dominio . Para agregar más filas en la tabla, haga clic en el icono Agregar entrada de esquema .
Haga clic en Aceptar para guardar los cambios y cierre el cuadro de diálogo Catálogo de proveedores de datos de referencia en línea .
Nota:
- En el cuadro de diálogo Catálogo de proveedores de datos de referencia en línea , el nodo DataMarket Data Quality Services muestra todos los proveedores de servicios de datos de referencia a los que se ha suscrito en Azure Marketplace. Si ha configurado proveedores de servicios de datos de referencia en línea directa de terceros en DQS, aparecerán en otro nodo llamado Proveedores Directos en Línea de Terceros (no disponible ahora, ya que no hay proveedores directos de servicios de datos de referencia en línea de terceros configurados en DQS).
Volverá a la pestaña Datos de referencia . En el área Configuración del proveedor , cambie los valores de los cuadros siguientes, si es necesario:
Umbral de corrección automática: las correcciones del servicio de datos de referencia con un nivel de confianza por encima de estos valores de umbral se realizarán automáticamente. Escriba un valor en la notación decimal del valor de porcentaje correspondiente. Por ejemplo, escriba 0,9 para 90%.
Candidatos sugeridos: número de candidatos sugeridos para mostrar desde el servicio de datos de referencia.
Confianza mínima: se omitirán las sugerencias del servicio de datos de referencia con un nivel de confianza inferior a este valor. Escriba un valor en la notación decimal del valor de porcentaje correspondiente. Por ejemplo, escriba 0,6 para 60%.
Haga clic en Finalizar para publicar la base de conocimiento. Aparece un mensaje de confirmación después de que la base de conocimiento se publique correctamente.
Ahora puede usar esta base de conocimiento para la actividad de limpieza en un proyecto de calidad de datos para estandarizar y limpiar las direcciones de EE. UU. en los datos de origen en función del conocimiento proporcionado por Melissa Data a través de Azure Marketplace.
Pasos a seguir: Después de asignar un dominio a los datos de referencia.
Cree un proyecto de calidad de datos y ejecute la actividad de limpieza en los datos de origen que contienen direcciones de EE. UU. comparándolo con la base de conocimiento creada en este tema. Ver Limpiar datos usando datos de referencia (externos).