Partager via


Partager des données à l’aide du protocole de partage ouvert Delta Sharing (pour les fournisseurs)

Cette page fournit une vue d’ensemble de la façon dont les fournisseurs peuvent utiliser le protocole de partage ouvert Delta Sharing pour partager des données à partir de votre espace de travail Azure Databricks compatible avec Unity Catalog avec n’importe quel utilisateur sur n’importe quelle plateforme informatique, n’importe où. Si vous êtes un destinataire de données (un utilisateur ou un groupe d’utilisateurs avec lequel les données sont partagées), consultez Accéder aux données partagées avec vous à l’aide de Delta Sharing (pour les destinataires) à la place.

À qui s’adresse l’utilisation du protocole de partage ouvert Delta Sharing ?

Il existe trois façons de partager des données à l’aide de Delta Sharing :

  1. Le protocole de partage ouvert Databricks, abordé dans cet article, vous permet de partager des données que vous gérez dans un espace de travail Databricks compatible Unity Catalog avec des utilisateurs sur n’importe quelle plateforme informatique.

    Cette approche utilise le serveur de partage Delta intégré à Azure Databricks et est utile lorsque vous gérez des données à l’aide de Unity Catalog et souhaitez le partager avec des utilisateurs qui n’utilisent pas Databricks ou qui n’ont pas accès à un espace de travail Databricks compatible avec le catalogue Unity. L’intégration à Unity Catalog côté fournisseur simplifie la configuration et la gouvernance pour les fournisseurs.

  2. Une implémentation gérée par le client du serveur Delta Sharing open source vous permet de partager de n’importe quelle plateforme vers n’importe quelle plateforme, qu’il s’agisse d’une plateforme Databricks ou non.

    Consultez github.com/delta-io/delta-sharing.

  3. Le protocole de partage Databricks-to-Databricks vous permet de partager des données à partir de votre espace de travail compatible Unity Catalog avec des utilisateurs qui ont également accès à un espace de travail Databricks compatible Unity Catalog.

    Consultez Partager des données à l’aide du protocole Delta Sharing Databricks-to-Databricks (pour les fournisseurs).

Pour une présentation du Delta Sharing et plus d’informations sur ces trois approches, consultez Qu’est-ce que le Delta Sharing ?.

Workflow du protocole Delta Sharing de partage ouvert

Cette section fournit une vue d’ensemble générale du workflow de partage ouvert, avec des liens vers la documentation détaillée de chaque étape.

Dans le modèle du protocole Delta Sharing de partage ouvert :

  1. Le fournisseur de données crée un destinataire. Il s’agit d’un objet nommé qui représente un utilisateur ou un groupe d’utilisateurs avec lesquels le fournisseur de données souhaite partager des données.

    Lorsque le fournisseur de données crée le destinataire, le fournisseur configure l’authentification à l’aide d’un jeton de porteur de longue durée ou d’une fédération Open ID Connect (OIDC). Si le fournisseur utilise un jeton du porteur, Azure Databricks génère un fichier d’informations d’identification et un lien d’activation que le fournisseur de données peut envoyer au destinataire pour accéder au fichier d’informations d’identification. Dans le flux de fédération OIDC, l’IDP du destinataire gère l’authentification, en fonction d’une stratégie créée par le fournisseur.

    Pour plus d’informations, consultez Créer un objet destinataire pour les utilisateurs non Databricks utilisant des jetons de porteur (partage ouvert) et Utiliser la fédération Open ID Connect (OIDC) pour activer l’authentification auprès des partages Delta Sharing (partage ouvert).

  2. Le fournisseur de données crée un partage, qui est un objet nommé qui contient une collection de tables inscrites dans un metastore Unity Catalog dans le compte du fournisseur.

    Pour plus d’informations, consultez Créer et gérer des partages pour Delta Sharing.

  3. Le fournisseur de données accorde au destinataire l’accès au partage.

    Pour plus de détails, veuillez consulter Gérer l’accès aux partages de données Delta Sharing (pour les fournisseurs).

  4. Dans le flux de jeton du porteur, le fournisseur de données envoie le lien d’activation au destinataire via un canal sécurisé, ainsi que des instructions d’utilisation du lien d’activation pour télécharger le fichier d’informations d’identification que le destinataire utilisera pour établir une connexion sécurisée avec le fournisseur de données pour recevoir les données partagées.

    Pour plus d’informations, consultez Obtenir le lien d’activation.

    Dans le flux de fédération OIDC, les destinataires s’authentifient par l’intermédiaire de leur fournisseur d’identité. Consultez Utiliser la fédération Open ID Connect (OIDC) pour activer l’authentification auprès des partages Delta Sharing (partage ouvert).

  5. Dans le flux de jeton du porteur, le destinataire des données suit le lien d’activation pour télécharger le fichier d’informations d’identification, puis utilise le fichier d’informations d’identification pour accéder aux données partagées.

    Les données partagées sont disponibles en lecture seule. Les utilisateurs peuvent accéder aux données à l’aide de la plateforme ou des outils de leur choix. Pour plus de détails, consultez Lire des données partagées à l’aide du partage ouvert Delta Sharing avec des jetons de porteur (pour les destinataires).

    Dans le flux de fédération OIDC, les destinataires s’authentifient par l’intermédiaire de leur fournisseur d’identité. Consultez Utiliser la fédération Open ID Connect (OIDC) pour activer l’authentification auprès des partages Delta Sharing (partage ouvert).

Configurations spécifiques au fournisseur

De nombreux fournisseurs ont leurs propres réseaux de partage Delta pour le partage. Pour obtenir des instructions de partage spécifiques, consultez, par exemple :

Considérations relatives à la configuration et à la sécurité du fournisseur pour le partage ouvert

Une gestion correcte des jetons est essentielle pour partager des données des manière sécurisée dans le cas du modèle de partage ouvert :

  • Les fournisseurs de données sur Azure Databricks qui ont l’intention d’utiliser le partage ouvert lorsqu’ils fournissent des partages doivent configurer la durée de vie du jeton de destinataire par défaut lorsqu’ils activent le partage Delta pour leur metastore Unity Catalog. Databricks vous recommande de configurer les jetons pour qu’ils expirent. Consultez Activer Delta Sharing sur un metastore.
  • Si vous devez modifier la durée de vie par défaut du jeton, consultez Modifier la durée de vie du jeton du destinataire.
  • Encouragez les destinataires à gérer le fichier d’informations d’identification téléchargé de façon sécurisée.
  • Pour plus d’informations sur la gestion des jetons et la sécurité de partage ouverte, consultez Gérer les jetons de destinataire.
  • Le partage ouvert est pris en charge entre les types d’environnement cloud, par exemple des clouds commerciaux AWS vers AWS GovCloud ou Azure China.

Les fournisseurs de données peuvent renforcer la sécurité en attribuant des listes d’accès IP pour restreindre l’accès des destinataires à des emplacements réseau spécifiques. Voir Restreindre l’accès des destinataires Delta Sharing à l’aide de listes d’accès IP (partage ouvert).