Compartir a través de


Inicio rápido: Creación de una solución para mover y transformar datos

En este inicio rápido, aprenderá cómo funcionan conjuntamente los flujos de datos y las canalizaciones para crear una solución eficaz de Data Factory. Limpiará los datos con flujos de datos y los moverá con tuberías.

Prerrequisitos

Antes de empezar, necesita lo siguiente:

Comparación de flujos de datos y canalizaciones

Dataflow Gen2 proporciona una interfaz de poco código con más de 300 transformaciones basadas en datos e inteligencia artificial. Puede limpiar, preparar y transformar fácilmente los datos con flexibilidad. Las canalizaciones ofrecen funcionalidades de orquestación de datos enriquecidas para crear flujos de trabajo de datos flexibles que satisfagan sus necesidades empresariales.

En una canalización, puede crear agrupaciones lógicas de actividades que realizan una tarea. Esto puede incluir llamar a un flujo de datos para limpiar y preparar los datos. Aunque hay alguna funcionalidad superpuesta entre los dos, la elección depende de si necesita las funcionalidades completas de las canalizaciones o puede usar las funcionalidades más sencillas de los flujos de datos. Para obtener más información, consulte la guía de decisión de Fabric.

Transformación de datos con flujos de datos

Siga estos pasos para configurar el flujo de datos.

Crear un flujo de datos

  1. Seleccione su área de trabajo habilitada para Fabric, luego Nuevo y elija Dataflow Gen2.

    Captura de pantalla de inicio de un flujo de datos Gen2.

  2. En el editor de flujo de datos, seleccione Importar desde SQL Server.

    Captura de pantalla del editor de flujo de datos.

Obtención de datos

  1. En el cuadro de diálogo Conectarse al origen de datos, escriba los detalles de la base de datos de Azure SQL y seleccione Siguiente. Use la base de datos de ejemplo AdventureWorksLT a partir de los requisitos previos.

    Captura de pantalla de la conexión a una base de datos de Azure SQL.

  2. Seleccione los datos que se van a transformar, como SalesLT.Customer, y use Seleccionar tablas relacionadas para incluir tablas relacionadas. Seleccione Crear.

    Captura de pantalla de la selección de datos que se van a transformar.

Transformación de los datos

  1. Seleccione Vista diagrama en la barra de estado o en el menú Ver del editor de Power Query.

    Captura de pantalla de la selección de la vista de diagrama.

  2. Seleccione con el botón derecho la consulta SalesLT Customer o seleccione los puntos suspensivos verticales situados a la derecha de la consulta y, a continuación, seleccione Combinar consultas.

    Captura de pantalla de la opción Combinar consultas.

  3. Configure la combinación con SalesLTOrderHeader como tabla derecha, CustomerID como columna de combinación y Externa izquierda como tipo de combinación. Selecciona Aceptar.

    Captura de pantalla de la pantalla de configuración de combinación.

  4. Agregue un destino de datos seleccionando el símbolo de base de datos con una flecha. Elija Azure SQL Database como tipo de destino.

    Captura de pantalla del botón Agregar destino de datos.

  5. Proporcione los detalles de la conexión de la base de datos de Azure SQL en la que se publicará la consulta de combinación. En este ejemplo, usamos también la base de datos AdventureWorksLT que usamos como origen de datos para el destino.

    Captura de pantalla del cuadro de diálogo Conectar al destino de datos.

  6. Elija una base de datos para almacenar los datos y proporcione un nombre de tabla y, después, seleccione Siguiente.

    Captura de pantalla de la ventana Elegir destino de destino.

  7. Acepte la configuración predeterminada en el cuadro de diálogo Elegir configuración de destino y seleccione Guardar configuración.

    Captura de pantalla del cuadro de diálogo Elegir configuración de destino.

  8. Seleccione Publicar en el editor de flujos de datos para publicar el flujo de datos.

    Captura de pantalla en la que se resalta el botón Publicar en el editor de flujo de datos gen2.

Movimiento de datos con canalizaciones

Ahora que ha creado un Dataflow Gen2, puede trabajar con ella en una canalización. En este ejemplo, copiará los datos generados desde el flujo de datos en formato de texto en una cuenta de Azure Blob Storage.

Creación de una canalización

  1. En el área de trabajo, seleccione Nuevo y, a continuación, Pipeline.

    Captura de pantalla de la creación de una nueva canalización.

  2. Asigne un nombre a la canalización y seleccione Crear.

    Captura de pantalla que muestra el mensaje de creación de la nueva canalización con un nombre de canalización de ejemplo.

Configuración del flujo de datos

  1. Agregue una actividad de flujo de datos a la canalización seleccionando Flujo de datos en la pestaña Actividades .

    Captura de pantalla de la adición de una actividad de flujo de datos.

  2. Seleccione el flujo de datos en el lienzo de la canalización, vaya a la pestaña Configuración y elija el flujo de datos que creó anteriormente.

    Captura de pantalla de la selección de un flujo de datos.

  3. Seleccione Guardar y, a continuación, Ejecutar para rellenar la tabla de consulta combinada.

    Captura de pantalla que muestra dónde seleccionar Ejecutar.

Agregar una actividad de copia

  1. Seleccione Copiar datos en el lienzo o use el Asistente para copia en la pestaña Actividades .

    Captura de pantalla que muestra las dos maneras de acceder al asistente de copia.

  2. Elija Azure SQL Database como origen de datos y seleccione Siguiente.

    Captura de pantalla que muestra dónde elegir un origen de datos.

  3. Cree una conexión al origen de datos seleccionando Crear nueva conexión. Rellene la información de conexión necesaria en el panel y escriba AdventureWorksLT para la base de datos, donde se generó la consulta de combinación en el flujo de datos. A continuación, seleccione Siguiente.

    Captura de pantalla en la que se muestra dónde crear una nueva conexión.

  4. Seleccione la tabla que generó anteriormente en el paso de flujo de datos y, a continuación, seleccione Siguiente.

    Captura de pantalla que muestra cómo seleccionar entre las tablas disponibles.

  5. Para el destino, elija Azure Blob Storage y, a continuación, seleccione Siguiente.

    Captura de pantalla que muestra el destino de datos de Azure Blob Storage.

  6. Cree una conexión al destino seleccionando Crear nueva conexión. Proporcione los detalles de la conexión y, a continuación, seleccione Siguiente.

    Captura de pantalla que muestra cómo crear una conexión.

  7. Seleccione la Ruta de acceso de la carpeta y proporcione un Nombre de archivo y, a continuación, seleccione Siguiente.

    Captura de pantalla que muestra cómo seleccionar la ruta de acceso de carpeta y el nombre de archivo.

  8. Seleccione Siguiente de nuevo para aceptar el formato de archivo predeterminado, el delimitador de columna, el delimitador de fila y el tipo de compresión, opcionalmente, incluido un encabezado.

    Captura de pantalla que muestra las opciones de configuración del archivo en Azure Blob Storage.

  9. Finalizar la configuración. A continuación, revise y seleccione Guardar y ejecutar para finalizar el proceso.

    Captura de pantalla que muestra cómo revisar la configuración de los datos de copia.

Diseña tu canalización y guárdala para ejecutar y cargar datos

  1. Para ejecutar la actividad de Copia después de la actividad Flujo de datos, arrastre desde Correcto en la actividad Flujo de datos a la actividad de Copia. La actividad Copiar solo se ejecuta después de que la actividad Flujo de datos se realice correctamente.

    Captura de pantalla que muestra cómo realizar la ejecución del flujo de datos después de la actividad de copia.

  2. Seleccione Guardar para guardar la canalización. A continuación, seleccione Ejecutar para ejecutar la canalización y cargar los datos.

    Captura de pantalla en la que se muestra dónde seleccionar Guardar y ejecutar.

Programación de la ejecución de canalización

Una vez que termine de desarrollar y probar la canalización, puede programarla para que se ejecute automáticamente.

  1. En la pestaña Inicio de la ventana del editor de canalizaciones, seleccione Programar.

    Captura de pantalla del botón Programación en el menú de la pestaña Inicio del editor de canalizaciones.

  2. Configure la programación según sea necesario. En el ejemplo siguiente se programa la canalización para que se ejecute diariamente a las 8:00 p. m. hasta el final del año.

    Captura de pantalla que muestra la configuración de programación para que un pipeline se ejecute diariamente a las 8:00 p. m. hasta el final del año.

En este ejemplo se muestra cómo crear y configurar un flujo de datos Gen2 para crear una consulta de combinación y almacenarla en una base de datos de Azure SQL y, a continuación, copiar datos de la base de datos en un archivo de texto en Azure Blob Storage. Ha aprendido a:

  • Cree un flujo de datos.
  • Transforme los datos con el flujo de datos.
  • Cree una canalización mediante el flujo de datos.
  • Ordene la ejecución de pasos en la canalización.
  • Copie los datos con el Asistente de Copia.
  • Ejecute y programe la canalización.

A continuación, avance para obtener más información sobre la supervisión de las ejecuciones de canalización.