Compartir a través de


Configuración del acceso a datos para la ingesta

En este artículo se describe cómo los usuarios administradores pueden configurar el acceso a los datos de un contenedor en Azure Data Lake Storage (ADLS) para que los usuarios de Azure Databricks puedan cargar datos de ADLS en una tabla de Azure Databricks.

En este artículo se describen las siguientes formas de configurar el acceso seguro a los datos de origen:

  • (Recomendado) Cree un volumen de del catálogo de Unity.
  • Cree una ubicación externa del catálogo de Unity con una credencial de almacenamiento.
  • Inicie un recurso de proceso que use una entidad de servicio.
  • Genere credenciales temporales (un token de SAS de blob).

Antes de empezar

Antes de configurar el acceso a los datos en ADLS, asegúrese de que tiene lo siguiente:

  • Datos en un contenedor en una cuenta de almacenamiento de Azure. Para crear un contenedor, consulte Creación de un contenedor en la documentación de Azure Storage.
  • Para acceder a los datos mediante un recurso de proceso con una entidad de servicio, los permisos de administrador del área de trabajo de Azure Databricks.
  • Para acceder a los datos mediante credenciales temporales:
    • Los permisos de administrador del área de trabajo de Azure Databricks.
    • Los permisos en la cuenta de Azure para crear tokens de SAS de blob. Esto le permite generar credenciales temporales.

Configuración del acceso al almacenamiento en la nube

Use uno de los métodos siguientes para configurar el acceso a ADLS:

Limpieza

Puede limpiar los recursos asociados de la cuenta en la nube y Azure Databricks si ya no desea conservarlos.

Eliminación de la cuenta de almacenamiento de ADLS

  1. Abra Azure Portal para la cuenta de Azure, normalmente en https://portal.azure.com.
  2. Vaya a la cuenta de almacenamiento y ábrala.
  3. Haga clic en Eliminar.
  4. Escriba el nombre de la cuenta de almacenamiento y después haga clic en Eliminar.

Detener el almacén de SQL

Si no usa el almacén de SQL para ninguna otra tarea, debe detenerlo para evitar costos adicionales.

  1. En el rol SQL, en la barra lateral, haga clic en Almacenes de SQL.
  2. Haga clic en Stop junto al nombre del almacén de SQL.
  3. Cuando se le solicite, haga clic en Stop de nuevo.

Pasos siguientes

Después de completar los pasos descritos en este artículo, los usuarios pueden ejecutar el COPY INTO comando para cargar los datos del contenedor de ADLS en el área de trabajo de Azure Databricks.