Compartir a través de


Acceso a datos compartidos con usted mediante Delta Sharing (para destinatarios)

En este artículo se muestra cómo acceder a los datos que se han compartido con usted mediante el uso compartido de Delta.

Delta Sharing y destinatarios de datos

Delta Sharing es un estándar abierto para el uso compartido seguro de datos. Un usuario de Databricks, denominado proveedor de datos en este contexto, puede usar Delta Sharing en Azure Databricks para compartir datos con una persona o grupo fuera de su organización, denominado destinatario de datos.

Uso compartido de Databricks a Databricks y uso compartido abierto

La forma de acceder a los datos depende de si es un usuario de Databricks y de si el proveedor de datos configuró o no los datos que se comparten con usted para el uso compartido de Databricks a Databricks o el uso compartido abierto.

En el modelo de Databricks a Databricks, debe ser un usuario en un área de trabajo de Databricks habilitada para Unity Catalog. Un miembro del equipo proporciona al proveedor de datos un identificador único para el metastore de Unity Catalog y el proveedor de datos lo usa para crear una conexión de uso compartido seguro. Los datos compartidos simplemente están disponibles para el acceso en el área de trabajo. Si es necesario, un miembro del equipo configura un control de acceso granular en esos datos.

En el modelo de uso compartido abierto, puede usar cualquier herramienta que quiera (incluido Databricks) para acceder a los datos compartidos. El proveedor de datos le envía una dirección URL de activación o un vínculo del portal a través de un canal seguro. Sigue las instrucciones para descargar un archivo de credencial o una dirección URL que le permita acceder a los datos compartidos con usted.

Databricks no proporciona directamente los datos compartidos, sino que estos los proporcionan los proveedores de datos que se ejecutan en Azure Databricks.

Nota:

Databricks puede recopilar información sobre el uso y el acceso de los destinatarios de datos a los datos compartidos (incluida la identificación de cualquier persona o empresa que acceda a los datos mediante el archivo de credenciales en relación con dicha información) y puede compartirla con el proveedor de datos aplicable.

Obtener acceso a los datos compartidos con usted

La forma de acceder a los datos depende de si el proveedor de datos ha compartido datos con usted mediante el protocolo de uso compartido abierto o el protocolo de uso compartido de Databricks a Databricks. Consulte Uso compartido de Databricks a Databricks y uso compartido abierto.

Obtener acceso en el modelo de Databricks a Databricks

En el modelo de Databricks a Databricks:

  1. El proveedor de datos le envía instrucciones para buscar un identificador único para el metastore del Unity Catalog asociado al área de trabajo de Databricks y enviárselo.

    El identificador de uso compartido es una cadena que consta de la nube, la región y el UUID de metastore (el identificador único de la metastore), con el formato <cloud>:<region>:<uuid>. Por ejemplo, aws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef.

    Para obtener el identificador de uso compartido mediante Catalog Explorer:

    1. En el área de trabajo de Azure Databricks, haga clic en el icono Datos.Catálogo.

    2. En la parte superior del panel Catálogo, haga clic en el icono de engranaje y seleccione Delta Sharing.

      Como alternativa, en la página Acceso rápido, haga clic en el botón Delta Sharing>.

    3. En la pestaña Compartidos conmigo, haga clic en el nombre de la organización de uso compartido de Databricks en la zona superior derecha y seleccione Copiar identificador de uso compartido.

    Para obtener el identificador de uso compartido mediante un cuaderno o una consulta de Databricks SQL, use la función SQL predeterminada CURRENT_METASTORE. Si utiliza un ordenador portátil, debe funcionar en un modo de acceso estándar o dedicado en el espacio de trabajo que utilizará para acceder a los datos compartidos.

    SELECT CURRENT_METASTORE();
    
  2. El proveedor de datos crea:

    • Un destinatario en su cuenta de Databricks para representarle a usted y a los usuarios de su organización que tendrán acceso a los datos.
    • Un recurso compartido, que es una representación de las tablas, volúmenes y vistas que se van a compartir con usted.
  3. Puede acceder a los datos compartidos con usted. Usted o alguien del equipo pueden, si es necesario, configurar el acceso a datos pormenorizado en esos datos para los usuarios. Consulte Lectura de datos compartidos mediante el uso de Delta de Databricks a Databricks Delta Sharing (para destinatarios).

Obtener acceso en el modelo de uso compartido abierto

En el modelo de uso compartido abierto:

  1. El proveedor de datos crea:

    • Un destinatario en su cuenta de Databricks para representarle a usted y a los usuarios de su organización que tendrán acceso a los datos.
    • Un recurso compartido, que es una representación de las tablas y particiones que se van a compartir con usted.
  2. El proveedor de datos le envía una dirección URL de activación (a través de un canal seguro) o una dirección URL del portal. Siga este proceso para descargar un archivo de credencial o una dirección URL que le permita acceder a los datos compartidos con usted.

    Se admiten tokens de portador y credenciales de cliente de OAuth.

    Importante

    No comparta el vínculo de activación con nadie. Puede descargar un archivo de credenciales solo una vez. Si vuelve a visitar el vínculo de activación después de haber descargado el archivo de credenciales, el botón Descargar archivo de credenciales se deshabilita.

    Si pierde el vínculo de activación antes de usarlo, póngase en contacto con el proveedor de datos.

  3. Almacene el archivo de credenciales en una ubicación segura.

    No comparta el archivo de credenciales con nadie fuera del grupo de usuarios que deba tener acceso a los datos compartidos. Si necesita compartirlo con alguien de su organización, Databricks recomienda usar un administrador de contraseñas.

Lectura de los datos compartidos

La forma de leer los datos que se han compartido de forma segura con Delta Sharing depende de si recibió un archivo de credenciales (el modelo de uso compartido abierto) o si usa un área de trabajo de Databricks y proporcionó al proveedor de datos el identificador de uso compartido (el modelo de Databricks a Databricks).

Leer datos compartidos mediante un archivo de credenciales (uso compartido abierto)

Si los datos se han compartido con usted mediante el protocolo de uso compartido abierto Delta Sharing con tokens de portador, use el archivo de credenciales que descargó para autenticarse en la cuenta del proveedor de datos y leer los datos compartidos. El acceso persiste siempre y cuando el token subyacente sea válido y el proveedor siga compartiendo los datos. Los proveedores administran la expiración y la rotación del token. Los tokens son válidos para un máximo de un año después de la creación. Las actualizaciones de los datos están disponibles casi en tiempo real. Puede leer y realizar copias de los datos compartidos, pero no puede modificar los datos de origen.

Para obtener información sobre cómo acceder a datos compartidos y leerlos mediante el archivo de credenciales en Azure Databricks, Apache Spark, pandas y Power BI, consulte Leer datos compartidos utilizando la compartición Delta abierta con tokens de portador (para destinatarios).

Leer datos compartidos mediante una federación de OIDC (uso compartido abierto)

Si los datos se han compartido con usted mediante el protocolo de uso compartido abierto delta sharing con la federación de OIDC, use la dirección URL que se le envió para autenticarse en la cuenta del proveedor de datos y leer los datos compartidos. El acceso persiste siempre que el proveedor siga compartiendo los datos. Las actualizaciones de los datos están disponibles casi en tiempo real. Puede leer y realizar copias de los datos compartidos, pero no puede modificar los datos de origen.

Para obtener información sobre cómo acceder a los datos compartidos y leerlos mediante el flujo de federación de tokens OIDC en Tableau y Power BI, consulte Recibir recursos compartidos de Delta Sharing usando la federación de Open ID Connect (OIDC) en un flujo de usuario a máquina (uso compartido abierto). Para aprender cómo acceder y leer datos compartidos mediante el flujo de federación de tokens OIDC en una aplicación cliente de Python, consulte Recibir acciones de Delta Sharing mediante un cliente de Python y federación Open ID Connect (OIDC) en un flujo de máquina a máquina (compartición abierta).

Lectura de datos compartidos mediante el uso compartido de Databricks a Databricks

Si los datos se han compartido con usted mediante el modelo de Databricks a Databricks, no se requiere ningún archivo de credenciales para acceder a los datos compartidos. Databricks se encarga de la conexión segura y los datos compartidos se pueden detectar automáticamente en el área de trabajo de Databricks.

Para aprender a buscar, leer y administrar esos datos compartidos en el área de trabajo de Databricks, consulte Lectura de datos compartidos mediante Databricks a Databricks de Delta Sharing (para destinatarios).

Auditar el uso de datos compartidos

Si tiene acceso a un área de trabajo de Azure Databricks, puede usar los registros de auditoría de Azure Databricks para comprender quién tiene acceso a los datos que usan Delta Sharing. Consulte Auditoría y supervisión del uso compartido de datos.

Pasos siguientes