Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Cette page explique comment se connecter à un emplacement externe de stockage racine databricks (DBFS). Après vous être connecté, vous pouvez régir l’accès aux objets dans le stockage racine DBFS à l’aide du catalogue Unity.
Bien que Databricks recommande de ne pas stocker de données dans le stockage racine de DBFS, votre espace de travail pourrait le faire à cause de pratiques anciennes. Par exemple, votre metastore Azure Databricks Hive hérité et local peut avoir stocké des données dans la racine DBFS. Suivez ce guide pour vous connecter à la racine DBFS en créant d’abord un objet d’informations d’identification de stockage qui autorise l’accès à la racine DBFS, puis un objet d’emplacement externe qui définit le chemin d’accès à la racine DBFS. Ces objets vous permettent de vous connecter à votre metastore Hive hérité afin que votre équipe puisse travailler avec vos tables de metastore Hive à l’aide du catalogue Unity. Consultez la fédération du metastore Hive : activez le catalogue Unity pour régir les tables inscrites dans un metastore Hive et activer la fédération de metastore Hive pour un metastore Hive hérité.
Avant de commencer
Pour créer un emplacement externe pour la racine DBFS, vous devez disposer d’informations d’identification de stockage définies dans le catalogue Unity qui donne accès à l’emplacement de stockage cloud de la racine DBFS. Si vous n’en avez pas encore, le système peut en créer un pendant le processus de création de l’emplacement externe.
Conditions requises pour les autorisations :
Vous devez disposer des privilèges
CREATE STORAGE CREDENTIALetCREATE EXTERNAL LOCATIONsur le metastore. Les administrateurs de metastore ont ces privilèges par défaut.Note
Si des informations d’identification de stockage pour l’emplacement de stockage de la racine DBFS existent déjà, l’utilisateur qui crée l’emplacement externe n’a pas besoin de
CREATE STORAGE CREDENTIAL, mais a besoin deCREATE EXTERNAL LOCATIONà la fois pour les informations d’identification de stockage et le metastore.Vous devez être administrateur d’espace de travail pour que le système crée les informations d’identification de stockage pour vous lors de la création d’un emplacement externe.
Vous n’êtes pas obligé d’être administrateur d’espace de travail si des informations d’identification de stockage qui donnent accès à l’emplacement de stockage racine DBFS existent déjà et que vous disposez
CREATE EXTERNAL LOCATIONà la fois des informations d’identification de stockage et du metastore.
Créer l’emplacement externe
Vous pouvez utiliser l’Explorateur de catalogues pour créer un emplacement externe pour la racine DBFS.
Dans la barre latérale, cliquez sur
Catalogue.
Cliquez sur Données >externes et créez un emplacement externe.
Entrez un nom d’emplacement externe.
Pour le type de stockage, sélectionnez Racine DBFS.
Les champs URL et sous-chemin sont renseignés avec le chemin de stockage cloud vers la racine DBFS.
Important
Lorsque vous créez un emplacement externe pour la racine DBFS, vous devez utiliser le sous-chemin vers l’emplacement racine DBFS, et non le chemin d’accès à l’ensemble du compartiment. L’URL et le sous-chemin sont préremplis avec
user/hive/warehouse, qui est l’emplacement de stockage par défaut pour les tables de metastore Hive. Si vous souhaitez un contrôle d’accès plus précis aux données de la racine DBFS, vous pouvez créer des emplacements externes distincts pour les sous-chemins dans la racine DBFS.Warning
Votre racine DBFS peut être stockée dans le stockage Blob Azure au lieu d’Azure Data Lake Storage. Ces emplacements sont accessibles à l’aide du
wasbpilote, qui n’autorise pas les contrôles au niveau du répertoire ou du fichier. Par conséquent, Unity Catalog peut appliquer le contrôle d’accès uniquement au niveau du conteneur, ce qui signifie que les utilisateurs ayant accès à cet emplacement externe peuvent potentiellement accéder à d’autres données dans le même conteneur s’ils utilisent des ressources de calcul avec le mode d’accès dédié (anciennement mode d’accès utilisateur unique). Pour éviter cela, appliquez l’utilisation des ressources de calcul du mode d’accès standard (anciennement mode d’accès partagé), des entrepôts SQL ou du calcul serverless.Sélectionnez des informations d’identification de stockage qui accordent l’accès à l’emplacement de stockage cloud racine DBFS ou, si aucun n’a été défini, cliquez sur + Créer des informations d’identification de stockage.
Les informations d’identification de stockage sont créées automatiquement lorsque vous enregistrez l’emplacement externe.
(Facultatif) Ajoutez un commentaire.
(Facultatif) Cliquez sur Options avancées et activez le mode de secours.
Le mode de secours est destiné aux scénarios de migration de charge de travail de systèmes anciens. Consultez Activer le mode de secours sur des emplacements externes.
Cliquez sur Créer.
Accédez à l’onglet Autorisations pour accorder l’autorisation d’utiliser l’emplacement externe.
- Cliquez sur Accorder.
- Sélectionnez les utilisateurs, les groupes ou les principaux de service dans le champ Principaux , puis sélectionnez le privilège que vous souhaitez accorder.
- Cliquez sur Accorder.
(Facultatif) Définissez les espaces de travail qui peuvent accéder à cet emplacement externe.
Par défaut, les utilisateurs sur n’importe quel espace de travail qui utilise ce metastore du catalogue Unity peuvent se voir accorder l'accès aux données de cet emplacement. Vous pouvez limiter cet accès à des espaces de travail spécifiques. Databricks recommande de limiter l’accès à l’espace de travail dans lequel se trouve la racine DBFS.
Consultez Lier un emplacement externe à un ou plusieurs espaces de travail.