Partager via


Désactiver l’accès au metastore Hive utilisé par votre espace de travail Azure Databricks

Cette page explique comment désactiver l’accès direct au metastore Hive hérité utilisé par votre espace de travail Azure Databricks, qu'il s'agisse d'un metastore Hive local de l’espace de travail ou d'un metastore Hive externe. Lorsque vous avez terminé votre migration de catalogue Unity ou fédéré votre metastore Hive en tant que catalogue étranger régi par le catalogue Unity, vous pouvez utiliser un paramètre d’administrateur d’espace de travail simple pour empêcher les utilisateurs de contourner le catalogue Unity et d’accéder aux tables inscrites dans le metastore Hive.

Les données du metastore Hive ne sont pas régies par le catalogue Unity. La désactivation de l’accès direct au metastore Hive est une étape importante du processus de migration vers le catalogue Unity et de vous assurer que vous tirez pleinement parti de la gouvernance des données du catalogue Unity. Vous pouvez désactiver l’accès direct et continuer à interroger des tables gérées par votre metastore Hive en tirant parti de la fédération du metastore Hive. Vous pouvez fédérer des tables de metastore Hive avant ou après avoir désactivé l’accès direct de l’espace de travail au metastore Hive. Consultez Mise à niveau d’un espace de travail existant vers le catalogue Unity et la fédération de metastore Hive : activez Unity Catalog pour régir les tables inscrites dans un metastore Hive.

Important

Même après la migration vers Unity Catalog, les clusters de calcul Azure Databricks se connectent au metastore Hive par défaut, sauf si vous désactivez explicitement l’accès au metastore Hive. Pour empêcher la maintenance du metastore Hive d’affecter vos charges de travail du catalogue Unity, vous pouvez désactiver l’accès direct au metastore Hive pour tous les clusters et charges de travail à la fois (désactiver tout accès direct au metastore Hive) ou utiliser une configuration Spark pour désactiver l’accès sur une base de cluster par cluster (désactivez tout accès direct au metastore Hive).

Pour désactiver l’accès au metastore Hive au niveau du compte pour les nouveaux espaces de travail, utilisez le paramètre Désactiver les fonctionnalités héritées.

Avant de commencer : quand devez-vous désactiver le metastore hérité ?

Avant de désactiver le metastore Hive hérité, vous devez respecter les critères suivants :

  • Vous avez terminé de migrer toutes les tables inscrites dans le metastore hérité vers Unity Catalog ou toujours utilisé Unity Catalog et jamais le metastore Hive hérité.
  • Vous souhaitez obliger vos utilisateurs à arrêter d'utiliser des tables enregistrées dans le metastore hérité.
  • Vous avez mis à niveau toutes les tâches vers Databricks Runtime 13.3 LTS ou une version ultérieure.

Que se passe-t-il lorsque vous désactivez le metastore hérité ?

Après avoir désactivé le metastore hérité :

  • Les travaux exécutés sur des tables inscrites dans le metastore Hive échouent.

  • La solution de secours est désactivée.

  • Les travaux qui s’exécutent sur les versions databricks Runtime inférieures à la version 13.3 échouent.

    Actuellement, les tâches en cours d'exécution continueront de fonctionner jusqu'à ce qu'elles soient terminées, mais les redémarrages sur ces clusters échoueront.

  • Le titre Legacy et le hive_metastore catalogue disparaissent du volet Catalog Explorer.

  • Les commandes SQL qui tentent d’afficher le contenu du hive_metastore catalogue échouent.

Note

La désactivation de l’accès hérité n’empêche pas les utilisateurs d’utiliser des informations d’identification au niveau du cluster, telles que les principaux de service, qui sont disponibles sur un cluster. Databricks vous recommande de supprimer ces informations d’identification de vos clusters.

Les clusters partagés d’isolement ne respectent pas le paramètre de désactivation du metastore Hive hérité. Pour empêcher les utilisateurs de créer et d’utiliser de tels clusters, activez le paramètre Appliquer l’isolation utilisateur pour l’espace de travail. Consultez Appliquer des types de cluster d’isolation utilisateur sur un espace de travail.

Désactiver tout accès direct au metastore Hive

Désactivez le metastore Hive hérité de votre espace de travail à l’aide du paramètre administrateur de l’espace de travail Désactiver l’accès hérité :

  1. En tant qu’administrateur d’espace de travail, connectez-vous à votre espace de travail Azure Databricks.
  2. Cliquez sur le menu profil utilisateur en haut à droite, puis sélectionnez Paramètres dans le menu.
  3. Accédez à Administrateur d’espace de travail > Sécurité.
  4. Définissez Désactiver l’accès hérité sur Désactivé : les fonctionnalités d’accès héritées ne peuvent pas être utilisées.
  5. Pour vous assurer que le nouveau paramètre a pris effet, attendez environ cinq minutes.
  6. Redémarrez tous les clusters en cours d’exécution.

Désactiver l’accès pour des clusters de calcul individuels

Vous pouvez également désactiver l’accès direct au metastore Hive progressivement, sur une base de cluster par cluster. Cette approche peut être utile lors d’une migration de catalogue Unity lorsque vous souhaitez réduire la dépendance du metastore Hive de manière incrémentielle jusqu’à ce que vous puissiez la désactiver pour l’ensemble de l’espace de travail.

Pour désactiver l’accès direct, définissez les configurations Spark suivantes sur le cluster :

spark.databricks.unityCatalogOnlyMode True
spark.databricks.sql.initial.catalog.namespace <catalog-name>

Remplacez <catalog-name> par le nom d'un catalogue Unity Catalog qui existe dans votre metastore. Lorsque vous activez le mode Catalogue Unity uniquement, vous devez également définir un catalogue initial, car le cluster ne peut plus utiliser hive_metastore comme catalogue par défaut.