Compartir a través de


Implementación de la arquitectura de medallion con vistas materializadas al lago

En este tutorial se describen los pasos y consideraciones para implementar una arquitectura de medallion mediante vistas materializadas del lago. Al final de este tutorial, aprenderá las características y funcionalidades clave de las vistas de lago materializadas y podrá crear un flujo de trabajo de transformación de datos automatizado. Este tutorial no está pensado para ser una arquitectura de referencia, una lista exhaustiva de características y funcionalidades, o una recomendación de procedimientos recomendados específicos.

Prerrequisitos

Como requisito previo para este tutorial, complete los pasos siguientes:

  1. Inicie sesión en su cuenta de Power BI o, si aún no tiene una cuenta, regístrese para obtener una evaluación gratuita.
  2. Habilite Microsoft Fabric en el inquilino. Seleccione el icono predeterminado de Power BI en la parte inferior izquierda de la pantalla y seleccione Tejido.
  3. Cree un área de trabajo habilitada para Microsoft Fabric.
  4. Seleccione un área de trabajo en la pestaña Áreas de trabajo, luego seleccione el elemento + Nuevo y elija Canalización. Proporcione un nombre para la canalización y seleccione Crear.
  5. Cree un Lakehouse con esquemas habilitados. Asígne un nombre a SalesLakehouse y cargue archivos de datos de ejemplo en Lakehouse. Para obtener más información, consulte el tutorial de Lakehouse.

Información general sobre el escenario

En este tutorial, va a tomar un ejemplo de una organización comercial ficticia, Contoso, que usa una arquitectura de medallion para el análisis de datos para obtener información útil sobre sus operaciones de ventas minoristas. Tiene como objetivo simplificar el proceso de análisis y generar información más detallada sobre el rendimiento empresarial mediante la organización de sus datos en tres capas: bronce (datos sin procesar), plata (datos limpios y enriquecidos) y oro (datos agregados y analizados).

El diagrama siguiente representa diferentes entidades en cada capa de arquitectura de medallion en SalesLakehouse:

Captura de pantalla que muestra la arquitectura de medallion.

Entidades

  1. Pedidos: esta entidad incluye detalles sobre cada pedido de cliente, como la fecha de pedido, los detalles del envío, la categoría del producto y la subcategoría. Se pueden extraer conclusiones para optimizar las estrategias de envío, identificar categorías de productos populares y mejorar la gestión de pedidos.

  2. Ventas: al analizar los datos de ventas, Contoso puede evaluar métricas clave como ingresos totales, márgenes de beneficio, prioridades de pedidos y descuentos. Las correlaciones entre estos factores proporcionan una comprensión más clara de los comportamientos de compra de los clientes y la eficacia de las estrategias de descuento.

  3. Ubicación: captura la dimensión geográfica de las ventas y los pedidos, incluidas las ciudades, los estados, las regiones y los segmentos de clientes. Ayuda a Contoso a identificar regiones de alto rendimiento, abordar áreas de bajo rendimiento y personalizar estrategias para segmentos de clientes específicos.

  4. Rendimiento del agente: con detalles sobre los agentes que administran transacciones, sus comisiones y datos de ventas, Contoso puede evaluar el rendimiento de los agentes individuales, incentivo a los principales intérpretes y diseñar estructuras de comisión eficaces.

  5. Comisiones del agente: la incorporación de datos de comisión garantiza la transparencia y permite una mejor administración de costos. Comprender la correlación entre las tasas de comisión y el rendimiento del agente ayuda a refinar los sistemas de incentivos.

Conjunto de datos de ejemplo

Contoso mantiene sus datos sin procesar de operaciones comerciales en formato CSV dentro de ADLS Gen2. Utilizamos estos datos para crear la capa de bronce y, a continuación, usamos la capa de bronce para crear las vistas materializadas del lago que forman las capas de plata y oro de la arquitectura de medallón. En primer lugar, descargue los archivos CSV de ejemplo del repositorio de ejemplos de Fabric.

Creación de la canalización

Los pasos generales son los siguientes:

  1. Capa de bronce: ingiere datos sin procesar en forma de archivos CSV en el lago.
  2. Capa de plata: limpie los datos mediante vistas materializadas del lago.
  3. Capa dorada: cura los datos para análisis e informes mediante vistas materializadas del lago.

Creación de una capa de bronce en la arquitectura de medallón para el análisis de ventas

  1. Cargue los archivos CSV correspondientes a diferentes entidades de los datos descargados en Lakehouse. Para ello, vaya al lakehouse y cargue los datos descargados en la sección Archivos del lakehouse. Crea una carpeta denominada tutorial.

  2. A continuación, cree un acceso directo a él desde la sección Tablas . Seleccione ... junto a la sección Tablas y seleccione Nuevo acceso directo de esquema y, a continuación, Microsoft OneLake. Elija SalesLakehouse en los tipos de origen de datos. Expanda la sección Archivos y elija la carpeta del tutorial y seleccione Crear. También puede usar otras opciones alternativas para obtener datos en Lakehouse.

    Captura de pantalla que muestra cómo crear un acceso directo para obtener los datos en tablas.

  3. En la sección Tablas , cambie el nombre de la carpeta del tutorial como bronce.

    Captura de pantalla que muestra la creación de una capa de bronce.

Crear capas de arquitectura medallón de plata y oro

  1. Suba el archivo del cuaderno descargado a su área de trabajo.

    Captura de pantalla que muestra la creación de la vista del lago de plata materializado.

  2. Abra el cuaderno desde Lakehouse. Para obtener más información, consulte Exploración de los datos de lakehouse con un cuaderno.

  3. Ejecute todas las celdas del cuaderno mediante Spark SQL para crear vistas de lago materializadas con restricciones de calidad de datos. Una vez que todas las operaciones se hayan ejecutado correctamente, actualice el origen de SalesLakehouse para ver las vistas materializadas del lago recién creadas para los esquemas silver y gold.

    Captura de pantalla que muestra la ejecución del cuaderno.

Programación de la canalización

  1. Una vez creadas las vistas materializadas del lago para las capas de plata y oro, vaya a la casa del lago y seleccione Vista de lago materializada administrada para ver la vista de linaje. Se autogenera a partir de las dependencias, donde cada vista materializada del lago dependiente forma los nodos del linaje.

    Captura de pantalla que muestra la vista de lago materializada.

    Captura de pantalla que muestra la creación del linaje.

  2. Seleccione Programar en la cinta de navegación. Encienda la actualización y configure la programación.

    Captura de pantalla que muestra la programación de la ejecución de las vistas materializadas del lago.

Supervisión y solución de problemas

  1. En el menú desplegable se enumeran las ejecuciones actuales e históricas.

    Captura de pantalla que muestra la ejecución de la programación.

  2. Al seleccionar cualquiera de los circuitos, puede encontrar los detalles de la vista al lago materializada en el panel lateral derecho. El panel de actividad inferior proporciona información general de alto nivel sobre el estado de ejecución del nodo.

    Captura de pantalla que muestra los detalles de ejecución.

  3. Seleccione cualquier nodo del linaje para ver los detalles de ejecución del nodo y vincularlos a registros detallados. Si el estado del nodo es Error, también se mostrará un mensaje de error.

    Captura de pantalla que muestra los registros de detalles de ejecución.

  4. Al seleccionar el vínculo Registros detallados , se le redirigirá al centro de supervisión desde donde puede acceder a los registros de errores de Spark para solucionar más problemas.

    Captura de pantalla que muestra los registros de Spark.

  5. Seleccione el botón Informe de calidad de datos de la cinta de opciones en la página de vistas de lago materializadas para crear o ver un informe de calidad de datos generado automáticamente.