Compartir a través de


Obtención de datos de OneLake

En este artículo, aprenderá a obtener datos de OneLake en una tabla nueva o existente.

Prerrequisitos

Paso 1: Origen

Seleccione OneLake como origen de datos, como se indica a continuación:

  1. En la cinta inferior de la base de datos KQL, seleccione Obtener datos para abrir la pestaña Origen de la ventana Obtener datos .

  2. Seleccione el origen de datos. En este ejemplo, estás ingiriendo datos de OneLake o de la lista del catálogo de OneLake que está incrustado.

    Captura de pantalla de la ventana Seleccionar un origen de datos con el icono de Onelake y las opciones de catálogo de Onelake incrustadas resaltadas.

    Nota

    Al seleccionar un origen de la lista en el catálogo de OneLake incrustado, puede usar los botones de categoría o filtrar por palabra clave para buscar un origen específico.

Paso 2: Configurar

Elija una tabla de destino y configure el origen, como se indica a continuación:

  1. Seleccione una tabla de destino. Si desea ingerir datos en una nueva tabla, seleccione +Nueva tabla y escriba un nombre de tabla.

    Nota

    Los nombres de tabla pueden tener hasta 1,024 caracteres, entre los que se incluyen espacios, alfanuméricos, guiones y caracteres de subrayado. No se admiten caracteres especiales.

  2. Seleccione un archivo OneLake para ingerir:

    • Al seleccionar OneLake como origen, debe especificar el Workspace, Lakehouse y Archivo en las listas desplegables.

    • Al seleccionar el catálogo de OneLake incrustado como origen, el área de trabajo y Lakehouse se rellenan automáticamente. Debe especificar el archivo que se va a importar.

    Recorte de pantalla de la pestaña configurar con las listas desplegables Área de trabajo, Almacén de lago de datos y Archivo.

  3. Seleccione Siguiente.

Paso 3: Inspeccionar

La pestaña Inspeccionar se abre con una vista previa de los datos.

Para completar el proceso de ingesta, seleccione Finalizar.

Captura de pantalla de la pestaña inspeccionar.

Puede ver, inspeccionar y configurar los datos ingeridos. Los números de la imagen corresponden a estas opciones:

(1) Seleccione Visor de comandos para ver y copiar los comandos automáticos generados a partir de los valores que haya introducido.

(2) Use la lista desplegable Archivo de definición de esquema para cambiar el archivo del que se deduce el esquema.

(3) Cambie el formato de datos inferido automáticamente seleccionando el formato deseado en la lista desplegable. Para obtener más información, consulte Formatos de datos compatibles con Real-Time Intelligence.

(4) Editar columnas.

(5) Explore las Opciones avanzadas basadas en el tipo de datos.

Editar columnas

Nota

  • En el caso de formatos tabulares (CSV, TSV, PSV), no se puede asignar una columna dos veces. Para mapear a una columna existente, primero elimine la nueva columna.
  • No se puede cambiar un tipo de columna existente. Si intenta asignar a una columna con un formato diferente, puede acabar con columnas vacías.

Los cambios que puede realizar en una tabla dependen de los parámetros siguientes:

  • El tipo de tabla es nuevo o existente
  • El tipo de mapeo es nuevo o existente
Tipo de tabla Tipo de mapeo Ajustes disponibles
Nueva tabla Nuevo mapeo Cambio del nombre de columna, cambio del tipo de datos, cambio del origen de datos, la transformaciones de asignación, adición de columna, eliminación de columna
Tabla existente Nuevo mapeo Agregar columna (en la que puede cambiar el tipo de datos, cambiar el nombre y actualizar)
Tabla existente Asignación existente ninguno

Captura de pantalla de las columnas abiertas para su edición.

Transformaciones de mapeo

Algunas asignaciones de formato de datos (Parquet, JSON y Avro) admiten transformaciones sencillas al momento de la ingestión. Para aplicar transformaciones de asignación, cree o actualice una columna en la ventana Editar columnas.

Las transformaciones de asignación se pueden realizar en una columna de tipo string o datetime, con un origen con un tipo de datos int o long. Para más información, consulte la lista completa de transformaciones de asignación admitidas.

Opciones avanzadas basadas en el tipo de datos

Tabular (CSV, TSV, PSV):

  • Si va a ingerir formatos tabulares en una tabla existente, puede seleccionar Opciones avanzadas>Mantener esquema de tabla. Los datos tabulares no incluyen necesariamente los nombres de columna que se usan para asignar datos de origen a las columnas existentes. Cuando se activa esta opción, el mapeo se realiza por orden, y el esquema de la tabla permanece igual. Si esta opción está desactivada, se crean nuevas columnas para los datos entrantes, independientemente de la estructura de datos.

    Captura de pantalla de opciones avanzadas

  • Los datos tabulares no incluyen necesariamente los nombres de columna que se usan para asignar datos de origen a las columnas existentes. Para usar la primera fila como nombres de columna, seleccione La primera fila es el encabezado de la columna.

    Recorte de pantalla del modificador La primera fila es el encabezado de la columna.

Paso 4: Resumen

En la ventana Preparación de datos, los tres pasos se marcan con marcas de verificación verdes cuando la ingesta de datos finaliza correctamente. Puede seleccionar una tarjeta para consultar, quitar los datos ingeridos o ver un panel del resumen de la ingesta.

Captura de pantalla de la página de resumen con la ingestión exitosa completada.