Compartir a través de


Configuración de ejemplo para la gobernanza de datos

La gobernanza de datos de Microsoft Purview, con Catálogo unificado de Microsoft Purview y Mapa de datos de Microsoft Purview, ofrece visibilidad completa, confianza en los datos e innovación responsable para ayudar a las organizaciones a lograr un mayor valor empresarial en la era de la inteligencia artificial. Con un ejemplo de administración de datos de estado, siga los pasos de este artículo para ayudarle a comprender cómo configurar Catálogo unificado y usar su funcionalidad para crear una práctica de gobernanza de datos sólida para su organización.

Paso 1: Configurar los dominios de gobernanza en Catálogo unificado

Los dominios de gobernanza son la clave para establecer la responsabilidad de los datos y ayudan a federar la gobernanza de esos datos en toda la empresa. Al crear dominios de gobernanza, comience con el propietario adecuado para asegurarse de que puede identificar y colaborar de forma eficaz con expertos para todos los datos del patrimonio de datos. Los dominios de gobernanza pueden ser muchos tipos diferentes para alinearse con el tipo de límite de datos para el equipo que rige esos datos. Por ejemplo: dominios funcionales (finanzas, RR. HH., ventas) o dominios de datos (producto, cliente, estado).

Requisitos previos

Concesión de permisos y compilación del primer dominio de gobernanza

  1. Abra el portal de Microsoft Purview.

  2. Inicie sesión en el portal de Microsoft Purview con las credenciales de una cuenta de administrador que tenga el rol De administración de roles (por ejemplo, un administrador de Purview). Vaya a Roles y ámbitos de configuración > para ver y administrar.

  3. Seleccione Grupos de roles.

  4. En la página Grupos de roles para soluciones de Microsoft Purview , seleccione el grupo de roles De gobernanza de datos .

  5. En la página Editar miembro del grupo de roles , seleccione Elegir usuarios o Elegir grupos.

  6. Active la casilla para todos los usuarios o grupos que quiera agregar al grupo de roles.

  7. Seleccione Seleccionar.

  8. En Catálogo unificado, seleccione Administración de catálogos y, a continuación, dominios de gobernanza.

  9. En la página Dominios de gobernanza , puede configurar el resto del catálogo para que otros usuarios puedan federar la propiedad de los datos, capacitar a los equipos para que desarrollen sus conocimientos y establezcan el valor empresarial de los datos.

    1. Para empezar, seleccione Nuevo dominio de gobernanza.
      1. Puede actualizar el nombre del dominio de gobernanza. Para este tutorial, asígnele el nombre "(Tutorial) Personal Health" y asígnele una descripción de "Los datos de salud personal hacen referencia a cualquier información relacionada con la salud física o mental de una persona que se recopile y use dentro del sector sanitario. Estos datos pueden incluir una amplia gama de tipos, como registros médicos, historiales de tratamiento, imágenes de diagnóstico y resultados de pruebas de laboratorio. A menudo está protegido bajo diversas leyes y regulaciones para garantizar la privacidad y la confidencialidad."
      2. Seleccione el tipo como "dominio de datos".
      3. Deje el elemento primario en blanco (si este es el primer dominio de gobernanza del catálogo, no tiene un elemento primario).
      4. Seleccione Crear.
      5. Ahora cree dos dominios más por su cuenta. Estos dominios son puntos clave de federación para la colaboración y la gobernanza en su organización. Piense en quién podría ser el propietario de los dominios al implementar Catálogo unificado.
        1. Puede seguir estos ejemplos:
        • Un dominio funcional corporativo representa los recursos y términos altamente controlados que usa toda una empresa. - Las ventas son un dominio funcional que la mayoría de las organizaciones tienen como dominio secundario de Corporativo.
  10. Seleccione el dominio de gobernanza que creó.

  11. Seleccione la pestaña Roles del dominio de gobernanza.

  12. De forma predeterminada, al crear el dominio de gobernanza, se agrega a todos los roles del dominio de gobernanza. Como propietario del dominio de gobernanza, se agregan los administradores de datos (expertos empresariales en su dominio) y los propietarios de productos de datos (que saben qué recursos de datos son los mejores para que otros usuarios los consuman).

  13. Vuelva a la pestaña Detalles .

  14. Seleccione Administrar directivas para aplicar una directiva de nivel de dominio. Esta directiva se aplica a todos los productos de datos del dominio. Al habilitar la aplicación automática de una directiva, los expertos en datos no tienen que ser también expertos en directivas.

  15. En la pestaña Administrar directivas de acceso , active la casilla situada junto a Permitir copias de datos. Al seleccionar esta opción de directiva, aplica automáticamente una atestación que requiere que todos los usuarios que solicitan acceso a los productos de datos atestiguan que comprenden la directiva de copia de datos de los datos.

  16. Seleccione Guardar cambios para confirmar que el dominio de gobernanza establece la directiva.

  17. Seleccione Publicar en el dominio de gobernanza, que publica todos los demás conceptos dentro del dominio.

Creación de términos de glosario

Agregar términos de glosario al dominio de gobernanza ayuda a otros usuarios a comprender cómo la empresa usa e interpreta los datos. Los términos del glosario también garantizan que la información use términos comunes y, por lo general, sus conocimientos en todo el dominio de gobernanza.

  1. En la página del dominio de gobernanza, busque la tarjeta Términos del glosario y seleccione Ver todo.

  2. En la página Términos del glosario , seleccione Nuevo término.

  3. Escriba los detalles: 1. Nombre: "Brote".

    1. Descripción: una enfermedad que afecta o tiene el potencial de afectar a una gran parte de la población.
    2. Puede dejar el resto en blanco por ahora, pero hay campos que recopilar: el propietario del término responsable de definir el término para su empresa, acrónimos para compartir común también conocidos como nombres del término, por último, puede proporcionar vínculos a los recursos que tendrían aún más información sobre el término.
  4. Seleccione Crear.

  5. Seleccione Administrar directivas. De forma similar a las directivas de nivel de dominio, puede crear directivas de nivel de término que se apliquen siempre que el término esté en uso.

  6. Active la casilla situada junto a Aprobación del administrador requerida. Esta directiva aplica una aprobación secundaria del administrador del usuario en Microsoft Entra id. cuando se solicita acceso a los productos de datos.

  7. Seleccione Publicar para el término brote creado. Los términos publicados se pueden filtrar en Catálogo unificado y asegurarse de que otros usuarios que usan el término para describir su producto de datos pueden ver esa descripción en Catálogo unificado mientras examinan el producto de datos.

  8. Ahora cree dos términos más. Esta vez, seleccione el término "Brote" como término primario para los términos que ha creado. Pruebe a crear relaciones entre estos términos secundarios en la pestaña relacionada de ambos términos para ayudar a crear la red de cómo funcionan conjuntamente estos términos para explicar la totalidad de un tema.

    1. Pandemia: un brote mundial de una enfermedad que afecta a un gran número de personas en varios países, regiones o continentes.
    2. Epidemia: un brote regional o nacional de una enfermedad que es altamente contagiosa y afecta a una gran parte de la población.
  9. Pruebe a crear un par de otros términos en cualquier otro dominio que haya creado anteriormente. Si no está seguro de qué agregar, seleccione Obtener términos sugeridos para que la IA generativa proponga algunos en función de la descripción y el nombre del dominio que ya proporcionó.

Agregar un OKR

Agregue un OKR (resultado objetivo y clave) para su dominio de Personal Health para ayudar a otros usuarios a comprender el valor empresarial de los datos. En este paso se crea una conexión directa entre los datos y el valor empresarial que proporciona.

  1. Seleccione el cuadro OKR en la página dominio de gobernanza.

  2. Seleccione Nuevo OKR.

  3. Escriba primero los detalles del objetivo:

    1. Objetivo: Reducir el riesgo de pandemia al permitir una captación eficaz de la vacuna contra el paciente.
    2. Propietario: escriba su nombre
    3. Fecha de destino: '2024-12-31'
  4. Seleccione Crear.

  5. Agregue resultados clave a su objetivo para que los objetivos sean medibles y para supervisar el progreso hacia el objetivo. Seleccione Agregar resultado de clave.

  6. Escriba los detalles del resultado de la clave:

    1. Resultado clave: Garantizar que el 80 % de los grupos> de edad (65 años) más propensos a verse afectados por la pandemia reciban la vacunación completa a finales del año natural de 2024.
    2. Estado del progreso: En curso
    3. Importe del progreso: 70
    4. Importe objetivo: 80
    5. Cantidad máxima: 100
  7. Seleccione Crear.

  8. Seleccione Publicar.

Creación de elementos de datos críticos

Cree un elemento de datos crítico (CDE) en Personal Health para asegurarse de que las columnas de datos más importantes tengan una definición y una comprensión coherentes. El CDE siempre cumple las expectativas empresariales sobre cómo se forman y almacenan esos datos.

  1. En la página dominios de gobernanza con el dominio de Estado personal seleccionado, seleccione el cuadro Elementos de datos críticos .
  2. Seleccione Nuevo elemento de datos crítico.
  3. Escriba los metadatos básicos de CDE:
    1. Nombre: Grupos de edad
    2. Descripción: La agrupación común de edades de las personas que se usan para garantizar los informes analíticos necesarios sigue una referencia de la que otros pueden depender y la eliminación de edades individuales para mejorar el anonimato de los datos. El grupo de edad se divide en ocho grupos: <2 años, 2-4 años, 5-11 años, 12-17 años, 18-24 años, 25-49 años, 50-64 años, 65+ años.
    3. Propietario: escriba su nombre
    4. Tipo de datos esperado: texto
    5. Seleccione Crear.

La eficacia real del CDE es que se asigna directamente a las columnas de datos físicos donde se almacenan estos datos. Esta conexión garantiza una comprensión común y permite la evaluación de directivas y reglas de calidad de datos a escala.

  1. En el CDE que acaba de crear, seleccione Agregar columna.

  2. Búsqueda del recurso de datos Covid 19 Vaccine and Case Trends desde el contenedor de oro del lago de datos

  3. Seleccione la casilla, no el nombre, del recurso Covid 19 Vaccine and Case Trends(Tendencias de vacuna y caso ).

    Sugerencia

    Si selecciona el nombre azul del recurso, se abrirá una nueva ventana que muestra los detalles del recurso.

  4. Seleccione el botón de radio situado junto a la columna AgeGroupVacc.

  5. Seleccione Agregar.

  6. Seleccione la pestaña Calidad de datos en la parte superior del CDE que acaba de crear para aplicar reglas de calidad de datos al CDE. Es similar a cómo ha agregado directivas para términos de glosario y dominios de gobernanza.

  7. Seleccione Nueva regla.

  8. Seleccionar coincidencia de tipo de datos

  9. Escriba el nombre de la regla: Confirmar formato de grupo de edad

  10. Seleccione Crear.

  11. Seleccione Publicar en el CDE.

Este CDE ahora aplica automáticamente una regla de calidad de datos a todos los productos de datos que usan el recurso Covid 19 Vaccine and Case Trends, que verá en la sección siguiente.

  1. Pruebe a crear un par de otros CDE en los demás dominios. Estas son algunas ideas:
    • Ventas: Ingresos y nombre del vendedor
    • Corporativo: Id. de producto

Paso 2: Configurar y registrar los datos en Data Map

Si no tiene orígenes de datos disponibles para el examen, siga estos pasos para implementar completamente un ejemplo de Azure Data Lake Storage (ADLS Gen2).

Sugerencia

Si ya tiene un origen de datos en el mismo inquilino que su cuenta de Microsoft Purview, pase a la siguiente parte de esta sección para examinar los recursos.

En un patrimonio de datos real, encontrará muchos sistemas diferentes en uso para diferentes aplicaciones de datos. Hay entornos de informes como Fabric y Snowflake en los que los equipos usan copias de datos para crear soluciones analíticas y potenciar sus informes y paneles. Hay sistemas de datos operativos que impulsan a los equipos o clientes de las aplicaciones a completar procesos empresariales que recopilan o agregan datos en función de las decisiones tomadas durante el proceso.

Para crear un patrimonio de datos más realista, muestre muchos orígenes de datos en el catálogo, lo que puede cubrir la amplitud de los distintos datos que puede tener cualquier empresa. Los tipos de datos necesarios para impulsar un caso de uso pueden ser muy diferentes con los usuarios empresariales que necesitan informes y paneles, los analistas necesitan dimensiones y hechos conformes para crear informes, científicos de datos o ingenieros de datos necesitan datos de origen sin procesar que proceden directamente del sistema que recopila los datos. Todos estos y más permiten a los distintos usuarios ver la importancia de buscar, comprender y acceder a los datos en el mismo lugar.

Para otros tutoriales para agregar datos a su patrimonio, siga estas guías:

Requisitos previos

Configuración del patrimonio de datos

R. Creación y rellenado de una cuenta de almacenamiento
  1. Siga esta guía para crear una cuenta de almacenamiento: Crear una cuenta de almacenamiento para Azure Data Lake Storage Gen2
  2. Cree contenedores para el nuevo lago de datos:
    1. Vaya a la página Información general de la cuenta de almacenamiento.
    2. Seleccione la pestaña Contenedores en la sección Almacenamiento de datos.
      1. Seleccione Contenedor.
      2. Asigne al contenedor el nombre "bronze" y seleccione Crear.
      3. Repita estos pasos para crear un contenedor "gold".
  3. Descargue algunos datos CSV de ejemplo de data.gov: Covid-19Vacunación y tendencias de casos por grupo de edad, Estados Unidos
  4. Cargue el archivo CSV en el contenedor denominado "bronze" en la cuenta de almacenamiento que creó.
  5. Seleccione el contenedor denominado "bronze" y seleccione Cargar.
  6. Examine la ubicación donde guardó el ARCHIVO CSV y seleccione el archivo Covid-19_Vaccination_Case _Trends .
  7. Seleccione Cargar.
B. Creación de un Azure Data Factory

En este paso se muestra cómo se mueven los datos entre las capas de un lago de datos medallion y se garantiza que los datos están en un formato estandarizado que los consumidores esperan usar. Este paso es un requisito previo para ejecutar la calidad de los datos.

  1. Siga esta guía para crear un Azure Data Factory: Crear un Azure Data Factory

  2. Copie los datos del archivo CSV del contenedor "bronze" en el contenedor "gold" como una tabla de formato Delta mediante esta guía de Azure Data Factory: Transformación de datos mediante un flujo de datos de asignación

  3. Abra la experiencia de Azure Data Factory (ADF) desde el Azure Portal seleccionando Iniciar studio en la pestaña Información general del recurso de ADF creado.

  4. Seleccione la pestaña Autor en ADF Studio.

  5. Seleccione el + comando y, a continuación, flujo de datos.

  6. Asigne al flujo de datos el nombre "CSVtoDeltaC19VaxTrends".

  7. Seleccione Agregar origen en el cuadro vacío.

  8. Establezca La configuración de origen en:

    1. Nombre del flujo de salida: "C19csv"
    2. Descripción: deje en blanco
    3. Tipo de origen: insertado
    4. Tipo de conjunto de datos insertado: Texto delimitado
    5. Servicio vinculado: seleccione el lago de datos donde almacenó el archivo csv.
  9. Establezca las opciones de origen en:

    1. Modo de archivo: Archivo
    2. Ruta de acceso del archivo: /bronze/ Covid-19_Vaccination_Case _Trends
    3. No se encontró ningún archivo: deje desactivada la opción
    4. Captura de datos modificados: deje desactivada
    5. Tipo de compresión: Ninguno
    6. Codificación: Default(UTF-8)
    7. Delimitador de columna: Coma (,)
    8. Delimitador de filas: Default(\r, \n o\r\n)
    9. Carácter de comillas: comilla doble (")
    10. Carácter de escape: barra diagonal inversa ()
    11. Primera fila como encabezado: CHECKED
    12. Deje el resto como valores predeterminados.
  10. Seleccione Siguiente por el origen creado y seleccione Receptor.

  11. Cree el receptor donde el formato y la ubicación de los datos que se van a almacenar para mover los datos de un csv en "bronce" a una tabla delta en "gold".

    1. Establezca los valores de Receptor (deje todos los valores como predeterminados a menos que se especifique).
    2. Tipo de receptor: insertado.
    3. Tipo de conjunto de datos insertado: Delta.
    4. Servicio vinculado: el mismo lago de datos que se usa en el origen, porque se almacena en un contenedor diferente.
  12. Establezca los valores de Configuración (deje todos los valores como predeterminados a menos que se especifique)

    1. Ruta de acceso de la carpeta: gold/Covid19 Vaccine and Case Trends.
  13. Escriba el valor porque este nombre es cómo desea almacenar los datos y no existe para seleccionarlos.

  14. Seleccione Validar. Esta acción comprueba el flujo de datos y proporciona instrucciones para corregir los errores.

  15. Seleccione Publicar todo.

  16. Seleccione el + comando y, a continuación, seleccione Canalización.

  17. Asigne a la canalización el nombre "CSV to Delta C19 Vax Trends".

  18. Seleccione el flujo de datos creado en los pasos anteriores CSV a Delta (C19VaxTrends) y arrástrelo y colóquelo en la pestaña Abrir canalización.

  19. Seleccione Validar.

  20. Seleccione Publicar.

  21. Seleccione Depurar (usar tiempo de ejecución de actividad) para ejecutar la canalización.

    Sugerencia

    Si recibe errores de espacios o caracteres inadecuados para el formato delta, abra el archivo CSV descargado y realice correcciones. A continuación, vuelva a cargar y sobrescribir el CSV en la zona de bronce. A continuación, vuelva a ejecutar la canalización.

  22. Vaya al contenedor gold en el lago de datos y ahora debería ver la nueva tabla Delta creada durante la canalización.

Examen de los recursos

Si no ha examinado los recursos de datos en el mapa de datos, siga estos pasos para rellenar el mapa de datos.

El análisis de orígenes en el patrimonio de datos recopila automáticamente los metadatos de los recursos de datos (tablas, archivos, carpetas, informes, etc.) de esos orígenes. Al registrar un origen de datos y crear el examen, se establece la propiedad técnica sobre los orígenes y recursos que aparecen en el catálogo. También puede controlar quién puede acceder a los metadatos de Microsoft Purview. Al registrar y almacenar orígenes y recursos en el nivel de dominio, los almacena en el nivel más alto de jerarquía de acceso. Normalmente, es mejor crear algunas colecciones en las que se examinan los metadatos del recurso y se establece la jerarquía de acceso correcta para esos datos.

Si decide usar Fabric o SQL, use estas guías para proporcionar acceso:

Registrar el lago de datos y examinar los recursos

  1. En Mapa de datos, en la pestaña Dominios, seleccione asignaciones de roles para el dominio (es el nombre de la cuenta de Microsoft Purview):

    1. Agréguese como administrador del origen de datos y conservador de datos al dominio.
      1. Seleccione el icono de persona junto al rol Administrador del origen de datos. 1. Busque su nombre tal y como está en Microsoft Entra id. (es posible que tenga que escribir su nombre completo escrito exactamente como está en Microsoft Entra id. ).
      2. Seleccione Aceptar.
      3. Repita estos pasos para el conservador de datos.
  2. Registre el lago de datos:

    1. Seleccione la pestaña Orígenes de datos.
    2. Seleccione Registrar.
    3. Seleccione el tipo de almacenamiento Azure Data Lake Storage Gen2.
  3. Proporcione los detalles para conectarse:

    1. Suscripción (opcional)
    2. Nombre del origen de datos (este es el nombre del origen de ADLS Gen2)
    3. Colección donde se deben almacenar los metadatos del recurso (opcional)
    4. Seleccione Registrar.
  4. Una vez completado el registro del origen de datos, puede configurar el examen. El registro indica que Microsoft Purview está conectado al origen de datos y lo ha colocado en la colección correcta para la propiedad. El examen lee los metadatos del origen y rellena los recursos del mapa de datos.

  5. Seleccione el origen que registró en la pestaña orígenes de datos.

  6. Seleccione nuevo examen y proporcione los detalles:

    1. Uso del entorno de ejecución de integración predeterminado para este examen
    2. La credencial debe ser MSI de Microsoft Purview (sistema)
    3. El nivel de examen es Detección automática
    4. Seleccione una colección o use el dominio (la colección debe ser la misma colección o una colección secundaria de donde se registró el origen de datos)
    5. Seleccione Continuar.

    Sugerencia

    En este momento, se prueba la conexión para validar que se puede realizar un examen. Si no concede acceso al lector MSI de Microsoft Purview en el origen de datos, se produce un error. Si no es el propietario del origen de datos o no tiene colaborador de acceso de usuario, se produce un error en el examen, ya que espera que tenga autorización para crear la conexión.

  7. Ahora solo seleccione el contenedor "gold" donde colocó la tabla delta en la sección de datos de compilación del tutorial. Esta selección impide el examen de cualquier otro recurso de datos que se encuentra en el almacén de datos.

    1. Si solo tiene una comprobación azul junto a oro, puede dejar las comprobaciones junto a todo, ya que examinará el origen completo y seguirá creando los recursos que usaremos y mucho más.
    2. Seleccione Continuar.
  8. En la pantalla seleccionar un conjunto de reglas de examen, debe usar el conjunto de reglas de examen predeterminado.

  9. Seleccione Continuar.

  10. En Set a scan trigger (Establecer un desencadenador de examen), establecerá la frecuencia del examen para que, a medida que continúe agregando recursos de datos al contenedor gold del lago, seguirá rellenando el mapa de datos. Seleccione Una vez.

  11. Seleccione Continuar.

  12. Seleccione Guardar y ejecutar. Esta acción crea un examen que lee los metadatos del contenedor gold del lago de datos y rellena la tabla que usaremos en Catálogo unificado en las secciones siguientes. Si solo selecciona guardar, no ejecutará el examen y no verá los recursos. Una vez que se ejecuta el examen, verá el examen que creó con el estado De última ejecución en cola. Cuando se completen las lecturas del examen, los recursos están listos para la sección siguiente. Este proceso puede tardar unos minutos o horas en función del número de recursos que tenga en el origen.

Paso 3: Publicación de los productos de datos

La creación de productos de datos es esencial para garantizar que su organización pueda detectar los datos adecuados. Los productos de datos ayudan a evitar el sobregobierno de datos que tienen un valor bajo o nulo en el patrimonio de datos porque no tienen ningún uso o valor limitado. Cuando los expertos en datos publican productos de datos, activa los datos más valiosos y crea el nivel correcto de gobernanza en función de ese valor. El mantenimiento de recursos de los que los equipos técnicos no conocen el propósito empresarial o que intentan gobernar todo en su complejo y creciente patrimonio de datos provoca tiempo adicional y pérdida de productividad persiguiendo los detalles de los datos que podrían nunca usarse o que podrían simplemente quitarse del patrimonio. En su lugar, céntrese en los fragmentos de datos que tienen valor y que las personas necesitan descubrir y crear aún más valor. A medida que los equipos usan más datos y obtienen una mejor comprensión de lo que se necesita, puede crear productos de datos más útiles para satisfacer esas demandas. La gobernanza se puede adaptar para asegurarse de que siempre permanece el tamaño correcto en función del valor y la confidencialidad de los datos.

Requisitos previos

Creación y publicación de un producto de datos

  1. Abra el portal de Microsoft Purview.

  2. Seleccione Catálogo unificado.

  3. Seleccione Administración de catálogos y, a continuación, Dominios de gobernanza.

  4. En la página Dominios de gobernanza , seleccione el dominio De mantenimiento personal.

  5. Seleccione Ir a productos de datos en Conceptos empresariales.

  6. Aquí es donde los expertos en datos denominados propietarios de productos de datos identificarán los recursos de datos que están diseñados para ser consumidos por otros usuarios de su organización y proporcionarán la información necesaria para que se puedan usar.

  7. Seleccione Nuevo producto de datos.

  8. Proporcione detalles sobre el producto de datos: 1. Nombre: "Covid-19 Vacunación y tendencias de casos por edad" 1. Descripción: "Estos datos proceden de los CDC como parte del Departamento de Salud de los Estados Unidos & Servicios Humanos. Los datos contienen tendencias en vacunaciones y casos por grupo de edad, a nivel nacional estadounidense. Los datos se estratifican por al menos una dosis y se vacunan completamente. Los datos también representan a todos los asociados de vacunas, incluidas las clínicas de asociados jurisdiccionales, las farmacias minoristas, los centros de atención a largo plazo, los centros de diálisis, la Agencia Federal de Administración de Emergencias y los sitios asociados de administración de recursos y servicios de salud y las instalaciones de entidades federales."

    1. Tipo: Conjunto de datos
    2. Seleccione Siguiente.
    3. Casos de uso: This data is provided for public use and is intended to help understand the trends of vaccination up take and new cases by different age groups. The ages are banded into two groups ranging from <2 years to 65+ years. Similarly the trends are provided in daily numbers that provide seven day average of new cases by age group.
    4. Marcar como Aprobado como comprobado.
    5. Haga clic en Guardar.
  9. Ahora tiene los metadatos base del producto de datos compilados. A continuación, agregue algunas propiedades y asigne el recurso desde Mapa de datos.

  10. Seleccione Agregar recursos de datos.

  11. Verá los recursos que ha examinado en Mapa de datos, incluidas todas las carpetas y capas del origen de datos.

  12. Busque el recurso Covid19 Vaccine and Case Trends que agregó al contenedor dorado del lago de datos y seleccione este conjunto de recursos.

  13. Seleccione Agregar. Puede seleccionar tantos recursos como sea necesario para un producto de datos, pero aquí solo se necesita uno.

    Sugerencia

    Seleccione Get suggestions to have generative AI help pick from the assets in your data map (Obtener sugerencias para que la ayuda de IA generativa se seleccione entre los recursos del mapa de datos) y seleccione Las tendencias de vacuna y caso de Covid19 en una lista reducida de resultados.

  14. Ahora puede ver el recurso agregado al producto de datos.

  15. Seleccione Agregar término junto al título de términos del glosario.

  16. Seleccione el término Brote creado anteriormente y seleccione Agregar.

  17. Debería ver el elemento de datos crítico para el grupo de edad del recurso asignado al producto de datos ahora.

  18. Seleccione Agregar OKR junto al título de OKR.

  19. Seleccione reducir el riesgo de pandemia al permitir una captación eficaz de la vacuna contra el paciente. Es el objetivo que creó en la primera sección.

Administración de directivas de solicitud de acceso a productos de datos

En la parte superior de la página, el último paso antes de publicar el producto de datos es seleccionar Administrar directivas. Aquí, puede configurar las directivas de acceso y solicitar el flujo de trabajo de acceso realizando selecciones y proporcionando los nombres para su aprobación. También puede usar la pestaña Directivas heredadas para ver la directiva de dominio de gobernanza aplicada a la atestación de copias de datos que aplicó anteriormente. Es lo mismo para la aprobación del administrador requerida procedente del término glosario de Brote.

  1. Seleccione la pestaña Administrar directivas .

  2. En Límite de tiempo de acceso, proporcione detalles sobre cuánto tiempo es correcta la solicitud de acceso antes de tener que renovarse. Establezca este valor para conceder acceso durante un año como máximo.

  3. En el cuadro, escriba 1.

  4. Seleccione años en la lista desplegable.

  5. En Requisitos de aprobación, proporcione su nombre en el cuadro aprobadores. (Requiere el nombre registrado en Microsoft Entra id.).

    Nota:

    No es necesario comprobar la aprobación del administrador porque esa directiva se hereda del término del glosario de brotes.

  6. Seleccione Preview request form (Formulario de solicitud en versión preliminar ) para ver lo que ven los consumidores del catálogo al solicitar acceso. Verá la atestación de copia de datos y la aprobación del administrador necesarias porque se establecieron mediante el dominio de gobernanza y el término del glosario.

  7. Seleccione Guardar cambios.

Una vez que asigne los recursos de datos y configure las directivas de acceso, estará listo para publicar el producto de datos en el catálogo.

  1. Seleccione Publicar en el producto de datos.

  2. Pruebe a crear un informe de beneficios en otros dominios que creó anteriormente.

    1. Informe de beneficios, tipo: paneles o informes.
    2. Patrón de producto, tipo: datos de Maser y datos de referencia.

Nota:

Puede agregar muchos recursos a estos recursos y ver cómo se ve un producto de datos con muchos recursos. Agregue los productos de datos a los términos de cualquier dominio para ver cómo se usa el glosario para describir los datos mediante un conjunto coherente de términos.

Paso 4: Ejecución de la calidad de los datos

Ahora que tiene un producto de datos disponible en el catálogo, la ejecución de reglas de calidad de datos indica a todos que los datos están en buen estado y listos para usarse. A medida que obtenga más información sobre los datos, agregue nuevas reglas de calidad de datos para asegurarse de que se ajusten a todos los casos de uso. Asegurarse de que los productos de datos son de la más alta calidad ayuda a generar confianza en los datos y muestra a otros usuarios que los está supervisando y mejorando. A medida que aumenta el valor de los datos, debe supervisar y controlar más estrechamente la calidad de esos datos. Los problemas de calidad de datos mal administrados pueden causar efectos negativos significativos.

Requisitos previos

  • Las reglas de calidad de datos solo se pueden ejecutar en tablas de formato delta en ADLS Gen2 y Microsoft Fabric.
  • La identidad administrada de Microsoft Purview debe estar habilitada para leer el origen de datos, ya que es la única credencial admitida para la calidad de los datos en la actualidad.
  • Debe tener el rol de administrador de calidad de datos en el dominio de gobernanza en el que se ejecuta la calidad de los datos.
  • Debe ser el propietario o tener acceso de administrador de acceso de usuario al origen de datos al que está conectando el examen de calidad de datos para garantizar una autorización de seguridad adecuada para examinar los datos.
  • Debe tener el rol de administrador de perfiles de datos para ejecutar perfiles en los datos.

Creación y ejecución de reglas de calidad de datos

  1. Abra el portal de Microsoft Purview.

  2. Seleccione Catálogo unificado.

  3. Seleccione la pestaña Calidad de los datos en Administración de datos.

  4. Seleccione el dominio de personal health creado en la sección 1.

  5. Seleccione Administrar y, a continuación, seleccione Connections. Al compilar esta conexión, puede ejecutar exámenes de calidad de datos en el origen de datos en ese dominio de gobernanza. Este paso impide que los equipos obtengan acceso al conocimiento de los datos sin la autorización adecuada.

  6. Seleccione Nuevo en la pantalla de conexiones para crear una nueva conexión: 1. Escriba el nombre para mostrar "Personal Health ADLSg2 DQ".

    1. Seleccione el tipo de origen de Azure Data Lake Storage Gen2.
      1. Escriba los detalles del origen de datos creado en la sección 2.

        Nota:

        La credencial debe ser MSI de Microsoft Purview (sistema) para una conexión de calidad de datos.

      2. Seleccione Probar conexión.
      3. Una vez probada la conexión, seleccione Enviar.

Una vez establecida la conexión, está listo para ejecutar perfiles y empezar a crear reglas de calidad de datos. Este paso garantiza que los expertos que conocen las reglas de negocio y las reglas adecuadas se ejecutan en los productos de datos más importantes.

  1. Volver a la página Calidad de datos.
  2. Seleccione el dominio de gobernanza de Personal Health.
  3. Seleccione el producto de datos Covid-19 Vaccination and Case Trending by Age integrado en la sección 3.
  4. Seleccione el recurso que agregó al producto de datos. (Debe estar en formato delta de la sección 2 o la calidad de los datos no se ejecutará).
  5. Aplique reglas de calidad de datos a las columnas de los datos para medir si cumplen las expectativas de calidad:
    1. Seleccione la pestaña Reglas en el recurso seleccionado.
    2. Seleccione Nueva regla.
    3. Seleccione Regla de campos vacíos o en blanco.
    4. Escriba los detalles:
      • Seleccione la columna AgeGroupVacc en la lista desplegable de columnas.
      • Nombre de regla: Confirmar que existe el grupo de edad de vacunación
    5. Seleccione Crear.
    6. Seleccione Nueva regla.
    7. Seleccione Coincidencia de tipo de datos.
    8. Escriba los detalles.
    9. Seleccione La columna DateAdministered.
    10. Seleccione Crear.
  6. Seleccione Ejecutar examen de calidad de datos.

Datos de perfil

Cree un perfil para los datos para ver las estadísticas de alto nivel de cada columna y detectar las anomalías que podrían requerir una nueva regla.

  1. En Catálogo unificado, seleccione Administración de estado y, después, Calidad de datos.
  2. Seleccione Datos de perfil.
  3. Active la casilla superior situada junto a Nombre de columna para generar perfiles de todas las columnas. El sistema recomienda qué columnas generar perfiles y puede seleccionar las columnas que sabe que merecen la pena generar perfiles para ayudar a evitar que los perfiles de datos altamente confidenciales o los datos que sabe se rellenen de forma dispersa.
  4. Seleccione Ejecutar perfil.

Cuando se complete el examen, puede revisar la puntuación de calidad de los datos y el perfil del nuevo producto de datos. Todos los usuarios del catálogo pueden ver la puntuación de calidad de los datos, por lo que todos conocen el estado de los datos.

Cree una programación para los exámenes de calidad de datos para asegurarse de que supervisa continuamente los problemas de calidad de los datos. Establezca alertas para asegurarse de que está solucionando problemas de calidad de datos antes de que los consumidores se vean afectados.

  1. En Administración de estado, seleccione Calidad de los datos.
  2. Seleccione el dominio de Personal Health donde configuró las reglas de calidad de datos.
  3. En la lista desplegable Administrar , seleccione Exámenes programados.
  4. En la página Exámenes programados , seleccione Nuevo.
  5. Agregar detalles de información general
    1. Nombre: Personal Health DQ Monthly Evaluation
    2. Descripción: examen mensual de las reglas de DQ para la mejora continua.
  6. Seleccione Continuar.
  7. Seleccione el ámbito del examen.
  8. Active la casilla situada junto a Covid-19 Vacunación y el producto de datos Tendencias de casos por edad
  9. Seleccione Continuar.
  10. Programar el examen para asegurarse de que se ejecuta el último día de cada mes
    1. Seleccione Periódicamente
    2. Periodicidad: cada mes
    3. Días del mes: último
    4. Programación de la hora del examen (UTC): 12:00:00
    5. Iniciar periodicidad a las (UTC): deje como valor predeterminado.
  11. Seleccione Continuar.
  12. Revise los detalles del examen para ver si hay algún cambio que quiera realizar antes de guardarlo.
  13. Haga clic en Guardar. Dado que desencadenó un examen manual anteriormente, no es necesario desencadenar otro examen ahora. Si necesita un nuevo examen, seleccione Guardar y ejecutar.

Configurar alertas

Después de programar exámenes para la calidad de los datos, puede configurar alertas para notificar a los administradores sobre problemas o cuando los problemas de calidad de los datos o los errores de examen necesitan atención. Configure una alerta de calidad de datos para los exámenes con errores y cuando la puntuación disminuya más del 5 %.

  1. Vuelva al dominio De salud personal en la página Calidad de los datos .
  2. En la lista desplegable Administrar , seleccione Alertas.
  3. Seleccione Nuevo.
  4. Especificar los detalles de la alerta
    1. Nombre para mostrar: Examen mensual de Personal Health DQ
    2. Descripción: para asegurarse de que los umbrales mínimos de DQ cumplen las expectativas del consumidor.
    3. Objetivo: la puntuación disminuye en más de
    4. Umbral: 5
    5. Desactivar notificaciones: deje desactivada la opción
    6. Activar la notificación para los exámenes de calidad con errores: dejar activado
    7. Destinatario: escriba su nombre.
  5. Seleccione Continuar.

Sugerencia

Al implementar en Catálogo unificado, envíe las alertas a los administradores que pueden notificar a los consumidores el problema y trabajar con el propietario técnico de los datos para realizar correcciones.

Al final de esta sección, tiene un Catálogo unificado funcional con calidad de datos operativos para administrar los datos que ofrece a los consumidores de datos de la organización. Todo está configurado para obtener los datos más valiosos para el consumidor y generar confianza en los datos que usan. A medida que aumenta el valor de los datos y surgen nuevas estrategias de datos, en la siguiente sección se muestra cómo puede administrar todo el catálogo o profundizar en la administración de datos específica con datos maestros.

Paso 5: Administración de datos maestros

La administración de datos maestros (MDM) es la práctica de ajustar las entidades de datos más importantes que deben ser precisas, únicas y aplicadas de forma coherente en todas las áreas de la empresa, ya que los errores y problemas de estos datos pueden afectar a toda la empresa. A través de uno de nuestros asociados de MDM, puede integrar su elección de soluciones MDM con Microsoft Purview para habilitar la unificación, estandarización y limpieza de datos que permite la creación de registros dorados y la publicación de datos maestros como productos de datos.

Siga los tutoriales que encontrará aquí para la solución que prefiera: Administración de datos maestros en Microsoft Purview

Paso 6: Administrar el estado de los datos

En el área de administración de salud de Catálogo unificado, la oficina central de datos y otros administradores de datos pueden evaluar el estado de los datos con respecto a sus estándares de empresa y administrar eficazmente el progreso hacia su estrategia. Para asegurarse de que todos los usuarios de la empresa sepan lo que pueden hacer para aumentar el valor de sus datos, es esencial que los estándares se entiendan y sean escalables para toda la organización sin necesidad de convertir a todos en expertos en gobernanza de datos. A partir de un conjunto estándar del sector de controles que están disponibles de forma inmediata, cada oficina de datos puede personalizar los controles para satisfacer sus expectativas y asegurarse de que se alinea con sus objetivos de datos. Fundamental para la eficacia de estos controles no es solo la medición de estos estándares, sino también garantizar que los responsables de los datos puedan tomar medidas por su cuenta y ser responsables de realizar las mejoras que afectan al valor de los datos. En Data Estate Health, puede establecer y administrar todas estas funcionalidades críticas.

Requisitos previos

Evaluación de la gobernanza de los datos con el estado del patrimonio de datos

  1. Abra el portal de Microsoft Purview.

  2. Seleccione Catálogo unificado.

  3. En Data Estate Health en el panel de navegación izquierdo, seleccione Controles de estado.

  4. Seleccione la zanahoria > situada junto al grupo de control Creación de valores .

  5. Mientras mantiene el puntero sobre un título de control, seleccione el icono de lápiz para editar el control. Al editar el control, cambia el umbral del control para establecer expectativas sobre cuál debe ser la puntuación y establecer la puntuación de color para mostrar las fases de progreso.

  6. Los detalles le permiten proporcionar una descripción del control y lo que significa para su organización y establecer un propietario para un control específico.

  7. Seleccione la pestaña Reglas del control para cambiar el umbral. Esta configuración tiene un destino alto y, si no está en buen estado, es fundamental realizar un seguimiento.

    1. Heredar del grupo: alternar para desactivar (debe activarse en gris).
    2. Puntuación de destino: 90
    3. Seleccione Nueva regla.
    4. Establezca el cuadro junto a la puntuación en GreaterThanOrEqual
    5. Establecer el porcentaje en 90
    6. Estado = Estado (verde)
    7. Else Box Status = Critical (Púrpura)
    8. Haga clic en Guardar.
  8. En Estado del patrimonio de datos, seleccione Calidad de metadatos.

Aquí puede cambiar o agregar reglas que creen las puntuaciones del control. Aquí quiere cambiar la gravedad de las acciones para la creación de valores para asegurarse de que todos los usuarios conozcan la importancia de esta acción.

  1. Seleccione Configurar gravedad
  2. Seleccione el grupo de control Creación de valores.
  3. Seleccione el título del control de alineación Business OKR .
  4. Cambie la gravedad de Medio a Alto y seleccione Guardar.
  5. Seleccione la pestaña Acciones de mantenimiento.
  6. Filtro asignado a: a su nombre
  7. Seleccione una acción en la que pueda ver lo que el propietario de la acción debe hacer para garantizar que se cumplan las expectativas de gobernanza o puede asignar un nuevo propietario para obtener el mejor experto para proporcionar su entrada. También hay un estado que permite a otros usuarios saber qué trabajo está en curso y dónde otras acciones podrían necesitar priorización.

Paso 7: Democratización de datos

La democratización de datos permite a los usuarios encontrar y acceder a los datos que necesitan de forma compatible. Garantiza que las personas puedan encontrar los datos que necesitan para crear valor empresarial. Catálogo unificado proporciona una experiencia limpia y sencilla para detectar datos. Permite a los administradores actualizar y administrar los datos disponibles en el catálogo a escala. En esta sección, aprenderá cómo los usuarios pueden buscar y solicitar acceso a los datos y asegurarse de que los aprobadores adecuados puedan realizar un seguimiento y proporcionar entradas en esas solicitudes de acceso.

Requisitos previos

Detección de productos de datos

  1. En Catálogo unificado, seleccione Detección y, después, Productos de datos.
  2. En la página Productos de datos , use la barra de búsqueda para buscar las tasas de vacunación por edad.
  3. Aquí verá los productos de datos que publicó en la sección 2. Esta vista muestra cómo los usuarios solo ven los datos destinados a ellos e impide que los usuarios tengan que navegar por un patrimonio de datos altamente técnico.
  4. Seleccione el producto de datos Covid-19 Vaccination and Case Trending by Age
    1. Aquí, los consumidores pueden ver los metadatos que proporcionó y cualquiera de las demás propiedades que configuró durante la instalación. La puntuación de calidad de los datos también está aquí para que los consumidores conozcan la calidad antes de que incluso obtengan acceso a los datos.
    2. Seleccione el recurso y el consumidor puede ver todas las columnas que están disponibles en el recurso de datos.
    3. Seleccione el término del glosario brote y el consumidor puede ver la descripción y otra información sobre el término para obtener una comprensión más profunda de los datos.
  5. Una vez que el consumidor esté seguro de que quiere usar esos datos, debe obtener acceso aprobado a los datos.
    1. Seleccione Solicitar acceso
    2. Rellene los detalles del formulario para enviar una solicitud.
    3. Usuario: deje su nombre
    4. Aprobación del administrador: se requiere automáticamente y se dirige al administrador de identificadores de Microsoft Entra.
    5. Propósito: seleccionar un propósito
    6. Justificación empresarial: supervisión de OKR
    7. Active la casilla situada junto a la atestación para indicar que comprende las expectativas de usar estos datos.
    8. Seleccione Enviar.

La solicitud de acceso se envía ahora al administrador de la lista en Microsoft Entra id. Desde aquí, el administrador puede acceder a las solicitudes abriendo el correo electrónico y seleccionando un vínculo o llegando a Microsoft Purview. La aprobación y administración del acceso se puede realizar directamente en Microsoft Purview.

  1. En Catálogo unificado, seleccione Administración de catálogos y, a continuación, seleccione Solicitudes.
  2. Seleccione el dominio De salud personal .
  3. Seleccione la solicitud que envió.
  4. Ahora, los aprobadores pueden aprobar o rechazar seleccionando Responder en la solicitud.