Partager via


Mise en miroir du catalogue Unity Azure Databricks

De nombreuses organisations inscrivent aujourd’hui leurs données dans Unity Catalog dans Azure Databricks. Un catalogue Unity mis en miroir dans Fabric permet au client de lire les données gérées par le catalogue Unity à partir des charges de travail Fabric. Azure Databricks et Fabric sont mieux ensemble.

Pour obtenir un tutoriel sur la configuration de votre espace de travail Azure Databricks pour la mise en miroir du catalogue Unity dans Fabric, consultez Tutoriel : Configurer des bases de données mises en miroir Microsoft Fabric à partir d’Azure Databricks.

Les bases de données mises en miroir dans Fabric permettent aux utilisateurs de profiter d’un produit hautement intégré, de bout en bout et facile à utiliser, conçu pour simplifier vos besoins d’analyse. Vous pouvez profiter d’un produit facile à utiliser conçu pour simplifier vos besoins d’analytique et conçu pour l’ouverture et la collaboration entre Microsoft Fabric et Azure Databricks.

Lorsque vous utilisez Fabric pour lire les données inscrites dans le catalogue Unity, il n’existe aucun déplacement de données ni réplication des données. Seule la structure de catalogue Azure Databricks est mise en miroir sur Fabric et les données de catalogue sous-jacentes sont accessibles via des raccourcis. Les modifications apportées aux données sous-jacentes peuvent ne pas apparaître immédiatement dans Fabric. La propagation peut prendre n’importe où de quelques secondes à plusieurs minutes, comme décrit dans la documentation sur les performances des points de terminaison SQL Analytics.

Quelles expériences d’analyse sont intégrées

Les catalogues mis en miroir sont un élément de l’entreposage de données Fabric distinct du point de terminaison d’analytique SQL et Warehouse.

Lorsque vous mirrorez un catalogue Azure Databricks Unity, Fabric crée ces éléments :

Vous pouvez accéder à vos données Azure Databricks mises en miroir de plusieurs façons :

  • Chaque élément Azure Databricks mis en miroir a un point de terminaison d’analytique SQL généré automatiquement qui fournit une expérience analytique enrichie créée par le processus de mise en miroir. Utilisez des commandes T-SQL pour définir et interroger des objets de données à partir du point de terminaison d’analytique SQL en lecture seule.
  • Utilisez Power BI avec le mode Direct Lake pour créer des rapports sur l’élément Azure Databricks.

Synchronisation des métadonnées

Lorsque vous créez une base de données mise en miroir à partir d’Azure Databricks dans Fabric, par défaut, la synchronisation automatique des modifications futures du catalogue pour le schéma sélectionné est activée. Les modifications de métadonnées suivantes sont reflétées de votre espace de travail Azure Databricks vers Fabric si la synchronisation automatique est activée :

  • Ajout de schémas à un catalogue.
  • Suppression de schémas d’un catalogue.
  • Ajout de tables à un schéma.
  • Suppression de tables d’un schéma.

Sélection de schéma/table :

  • Par défaut, l’ensemble du catalogue est sélectionné lorsque l’utilisateur ajoute le catalogue.
  • L’utilisateur peut exclure certaines tables dans le schéma.
  • Désélectionner un schéma désélectionne toutes les tables du schéma.
  • Si l’utilisateur revient et sélectionne le schéma, toutes les tables du schéma sont à nouveau sélectionnées.
  • Le même comportement de sélection s’applique aux schémas d’un catalogue.

Il existe d’autres conditions de filtrage appliquées aux catalogues/schémas/tables :

  • Les vues matérialisées et les tables de diffusion en continu ne seront pas affichées.
  • Les tables externes qui ne prennent pas en charge le format Delta ne sont pas affichées.