Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este tutorial, ingerirá más tablas dimensionales y tablas de hechos de Wide World Importers (WWI) en el lago.
Requisitos previos
- Si no tiene una instancia de Lakehouse, debe crear un lakehouse.
Ingerir datos
En esta sección, usará la actividad Copiar datos de la canalización de Data Factory para ingerir datos de ejemplo de una cuenta de almacenamiento de Azure en la sección Archivos de la instancia de Lakehouse que creó anteriormente.
Seleccione Áreas de trabajo en el panel de navegación izquierdo y, a continuación, seleccione el área de trabajo nueva en el menú Áreas de trabajo. Aparece la vista de elementos del área de trabajo.
En la opción Nuevo elemento de la cinta de opciones del área de trabajo, seleccione Canalización.
En el cuadro de diálogo Nueva canalización, especifique el nombre como IngestDataFromSourceToLakehouse y seleccione Crear.
En la canalización recién creada, seleccione Actividad de canalización para agregar una actividad a la canalización y seleccione Copiar datos. Esta acción agrega la actividad de copia de datos al lienzo de la canalización.
Seleccione la actividad de copia de datos recién agregada en el lienzo. Las propiedades de actividad aparecen en un panel debajo del lienzo (es posible que tenga que expandir el panel hacia arriba arrastrando el borde superior). En la pestaña General del panel de propiedades, escriba Copia de datos a Lakehouse en el campo Nombre . Deje las propiedades restantes en sus valores predeterminados.
En la pestaña Origen de la actividad de copia de datos seleccionada, abra el campo Conexión y seleccione Examinar todo. Elija la ventana del origen de datos emergente, busque y seleccione Blobs de Azure. En este tutorial, todos los datos de ejemplo están disponibles en un contenedor público de Azure Blob Storage. Se conecta a este contenedor para copiar datos de él.
Escriba los detalles siguientes en la ventana Configuración de conexión y seleccione Conectar para crear la conexión al origen de datos.
Propiedad Valor Nombre o dirección URL de la cuenta https://fabrictutorialdata.blob.core.windows.net/sampledata/Connection Creación de una nueva conexión Nombre de conexión wwisampledata Tipo de autenticación Anónimas Una vez creada la nueva conexión, vuelva a la pestaña Origen de la actividad de copia de datos y la conexión recién creada esté seleccionada de forma predeterminada. Especifique las siguientes propiedades antes de pasar a la configuración de destino.
Propiedad Valor Connection wwisampledata Tipo de ruta de acceso de archivo Ruta de acceso del archivo Ruta de acceso del archivo Nombre del contenedor (primer cuadro de texto): sampledata
Nombre del directorio (segundo cuadro de texto): WideWorldImportersDW/parquetRecursivamente Comprobado Formato de archivo Binary En la pestaña Destino de la actividad de datos de copia seleccionada, especifique las siguientes propiedades:
Propiedad Valor Connection wwilakehouse (elija su lakehouse si lo denomina de forma diferente) Carpeta raíz Archivos Ruta de acceso del archivo Nombre del directorio (primer cuadro de texto): wwi-raw-data Formato de archivo Binary Ha configurado la actividad de copia de datos. Seleccione el icono Guardar de la cinta de opciones superior (debajo de Inicio) para guardar los cambios y seleccione Ejecutar para ejecutar la canalización y su actividad. También puede programar canalizaciones para actualizar los datos a intervalos definidos para satisfacer los requisitos empresariales. Para este tutorial, ejecutamos la canalización solo una vez seleccionando Ejecutar.
Esta acción desencadena la copia de datos del origen de datos subyacente a la instancia de Lakehouse especificada y puede tardar hasta un minuto en completarse. Puede supervisar la ejecución de la canalización y su actividad en la pestaña Salida. El estado de la actividad cambia de Queued>In progressSucceeded (Estado de la actividad en cola en curso >Correcto).
Una vez que la actividad de copia se haya realizado correctamente, abra lakehouse (wwilakehouse) para ver los datos. Actualice la sección Archivos para ver los datos ingeridos. Una nueva carpeta wwi-raw-data aparece en la sección de archivos y los datos de las tablas de blobs de Azure se copian allí.