Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Cette page explique comment créer une salle propre Databricks à l’aide de l’interface utilisateur. Une salle propre est un environnement sécurisé pour l’analyse des données collaboratives.
Fonctionnalités et limitations clés :
- Collaboration sécurisée : les salles de nettoyage permettent à plusieurs parties de travailler ensemble sur des données d’entreprise sensibles sans accéder directement aux données brutes des autres.
- Capacité de collaborateur : une salle propre peut avoir dix parties, y compris le créateur et jusqu’à neuf autres collaborateurs.
- Limite du metastore : Azure Databricks applique des quotas de ressources sur tous les objets sécurisables de salle blanche. Consultez l’article Limites des ressources.
Pour utiliser l’API REST, consultez Créer une salle propre.
Avant de commencer
Les privilèges nécessaires pour utiliser des salles blanches varient en fonction de la tâche :
| Tâche | Privilèges requis |
|---|---|
| Afficher une salle propre | Doit être le propriétaire de la salle propre, ou avoir l’un des privilèges suivants sur la salle propre : MANAGE, , MODIFY CLEAN ROOM, EXECUTE CLEAN ROOM TASKou BROWSE. |
| Mettre à jour le propriétaire d’une salle blanche | Doit être le propriétaire de la salle blanche ou disposer du privilège MANAGE sur cette salle blanche. |
| Ajouter ou supprimer des ressources de données dans une salle propre | Doit être le propriétaire de la salle blanche ou disposer du privilège MODIFY CLEAN ROOM sur cette salle blanche. Si vous n’êtes pas le propriétaire de la salle blanche, vous et le propriétaire de la salle blanche devez avoir SELECT sur n’importe quelle table ou vue, et READ VOLUME sur tout volume que vous ajoutez, ainsi que USE CATALOG et USE SCHEMA sur le catalogue parent et le schéma. |
| Ajouter ou supprimer des blocs-notes dans une salle propre | Pour l'uploadeur du bloc-notes :
|
| Mettre à jour un commentaire dans une salle propre | Doit être le propriétaire de la salle blanche ou disposer du privilège MODIFY CLEAN ROOM sur cette salle blanche. |
| Accorder l’accès à une salle blanche | Doit être le propriétaire ou avoir le privilège MANAGE sur la salle blanche. |
| Supprimer une salle blanche | Doit être le propriétaire ou avoir le privilège MANAGE sur la salle blanche. |
Au-delà des privilèges spécifiques à la tâche, lorsqu’une salle propre est partagée, l’adresse e-mail attachée à l’identificateur de partage devient automatiquement le propriétaire dans l’organisation de votre collaborateur. Voir l’étape 1. Demandez l’identificateur de partage du collaborateur.
Pour en savoir plus sur les autorisations exigées pour mettre à jour les salles blanches et exécuter des tâches (notebooks) dans les salles blanches, consultez Gérer les salles blanches et Exécuter des notebooks dans des salles blanches.
Remarque
La salle blanche centrale peut avoir deux régions au maximum en plus de la région centrale de la salle blanche parmi ses collaborateurs.
Étape 1. Demander l’identificateur de partage du collaborateur
Avant de pouvoir créer une salle propre, vous devez disposer de l’identificateur de partage de salle propre des organisations avec lesquelles vous collaborerez. L’identificateur de partage est une chaîne qui se compose de l’ID global du metastore de l’organisation + ID d’espace de travail + nom d’utilisateur du contact (adresse e-mail). Vos collaborateurs peuvent se trouver dans n’importe quel cloud ou région.
Contactez vos collaborateurs pour demander leur identificateur de partage. Ils peuvent obtenir l’identificateur de partage à l’aide des instructions fournies dans Rechercher votre identificateur de partage.
Étape 2. Créer une salle blanche
Pour créer une salle blanche, vous devez utiliser l’Explorateur de catalogues.
Dans votre espace de travail Azure Databricks, cliquez sur
Catalogue.
Cliquez sur le bouton Salles propres>.
Cliquez sur Create Clean Room (Créer une salle blanche).
Dans la page Create Clean Room, entrez un nom convivial pour la salle blanche.
Le nom ne peut pas contenir d’espaces, de points ni de barres obliques (/).
Une fois enregistré, le nom de la salle propre ne peut pas être modifié. Utilisez un nom que les collaborateurs potentiels trouveront utiles et descriptifs.
Sélectionnez le fournisseur de cloud et la région où la salle blanche centrale sera créée.
Le fournisseur de cloud doit correspondre à votre espace de travail actuel, mais la région peut être différente. Tenez compte de la résidence des données de votre organisation ou d’autres stratégies lorsque vous effectuez votre sélection.
Chaque salle propre peut avoir jusqu’à dix collaborateurs. Entrez l’identificateur de partage de salle propre pour chaque collaborateur. Voir l’étape 1. Demandez l’identificateur de partage du collaborateur.
Vous pouvez tester votre salle propre avant le déploiement complet à l’aide de votre identificateur de partage ou de l’identificateur d’un autre utilisateur dans votre metastore actuel. Cela crée deux salles propres dans votre metastore actuel. Par exemple, si vous créez une salle propre intitulée
test_clean_room, une deuxième salle propre nomméetest_clean_room_collaboratorapparaît également. L’exécution de notebooks avec un collaborateur dans les mêmes fonctions de metastore fonctionne de la même manière qu’avec un collaborateur externe. Consultez Exécuter des notebooks dans des salles blanches.Notez les noms de catalogue attribués à vous et à vos collaborateurs.
Toutes les ressources de données ajoutées à la salle blanche apparaissent sous ce catalogue dans la salle blanche centrale et peuvent être référencées à l’aide de ce catalogue dans l’espace de noms à trois niveaux de Unity Catalog (
<catalog>.<schema>.<table-etc>).Sélectionnez le type de stratégie d’accès réseau. Cela ne peut pas être modifié une fois la salle propre créée.
- accès complet: accès Internet sortant illimité.
- accès restreint: cela limite l’accès sortant aux destinations Internet que vous spécifiez. Consultez la vue d’ensemble de la stratégie réseau et Gérer les stratégies réseau pour le contrôle de sortie serverless.
Remarque
L’accès restreint peut retarder la disponibilité des ressources pendant jusqu’à dix minutes.
Après avoir créé la salle propre, vous pouvez afficher la stratégie d’accès réseau sous l’onglet Sécurité.
- Cliquez sur Create Clean Room (Créer une salle blanche).
Si votre espace de travail actuel est défini sur le profil de sécurité de conformité HIPAA, lorsque vous créez une salle propre, ce paramètre est appliqué à la salle propre centrale. Les collaborateurs doivent accéder à la salle propre à partir d’un espace de travail avec le même profil de sécurité. Consultez Profil de sécurité de conformité.
Étape 3. Ajouter des ressources de données et des notebooks à la salle blanche
Aussi bien le créateur que les collaborateurs peuvent ajouter des tables, des volumes, des vues et des notebooks à la salle blanche.
Remarque
Les instructions suivantes supposent que vous revenez à une salle propre déjà créée pour ajouter des ressources. Si vous venez de créer une salle blanche pour la première fois, un Assistant vous guide dans l’ajout de ressources de données et de notebooks. Que vous soyez guidé par l’Assistant ou non, l’interface utilisateur réelle pour l’ajout de ces ressources est la même.
Pour ajouter des cahiers :
Cliquez sur le bouton + Ajouter des blocs-notes et recherchez le bloc-notes que vous souhaitez ajouter.
Nommez le bloc-notes.
Sélectionnez le collaborateur qui peut exécuter le bloc-notes. Sélectionnez Vous pour exécuter le bloc-notes vous-même.
Vous pouvez éventuellement donner au notebook un autre nom de notebook.
Les notebooks que vous partagez dans les salles blanches interrogent les données et exécutent des charges de travail d’analyse des données sur les tables, les vues et les volumes que vous et tous les autres collaborateurs avez ajoutés à la salle blanche.
Si vous partagez un bloc-notes qui inclut des résultats, ces résultats sont partagés avec vos collaborateurs.
Vous pouvez utiliser un bloc-notes pour créer des tables de sortie qui sont temporairement partagées avec le metastore de votre collaborateur lors de l’exécution du notebook. Consultez Créer et utiliser des tables de sortie dans Databricks Clean Rooms.
Pour utiliser un jeu de données de test, téléchargez notre exemple de notebook.
Importante
Les références de bloc-notes aux tables, vues ou volumes ajoutés à la salle propre doivent utiliser le nom du catalogue attribué lors de la création de la salle propre (« créateur » pour les ressources de données ajoutées par le créateur de salle propre et « collaborateur » pour les ressources de données ajoutées par le collaborateur invité). Par exemple, une table ajoutée par le créateur peut être nommée
creator.sales.california.De même, vérifiez que le notebook utilise les alias qui ont été affectés aux ressources de données ajoutées dans la salle propre.
Pour ajouter des ressources :
Dans votre espace de travail Azure Databricks, cliquez sur
Catalogue.
Cliquez sur le bouton Salles propres>.
Recherchez et cliquez sur le nom de la salle blanche à mettre à jour.
Cliquez sur + Ajouter des ressources de données pour ajouter des tables, des volumes ou des vues.
Sélectionnez les ressources de données que vous souhaitez partager, puis cliquez sur Ajouter des ressources de données.
Lorsque vous partagez une table, un volume ou une vue, vous pouvez éventuellement ajouter un alias. Le nom de l’alias est le seul nom visible dans la salle propre.
Lorsque vous partagez une table, vous pouvez éventuellement ajouter des clauses de partition qui vous permettent de partager uniquement une partie de la table. Pour plus d’informations sur l’utilisation des partitions pour limiter ce que vous partagez, consultez Spécification des partitions de table à partager.
Remarque
Le partage de tables fédérées est en version bêta. Voir Ajouter des schémas étrangers ou des tables à un partage.