Partager via


Différences entre Azure Data Factory et Fabric Data Factory

Data Factory dans Microsoft Fabric est la prochaine génération d’Azure Data Factory, conçue pour gérer vos défis d’intégration de données les plus complexes avec une approche plus simple et plus puissante.

Ce guide vous aide à comprendre les principales différences entre ces deux services, ce qui vous permet de faire le bon choix pour votre entreprise. Nous allons vous guider dans ce qui est nouveau, ce qui est différent et quels avantages Fabric apporte à la table.

Fabric Data Factory est la nouvelle génération d’Azure Data Factory, conçue pour simplifier et améliorer les flux de travail d’intégration des données. Cette section présente les principales fonctionnalités et avantages de Fabric Data Factory.

Prêt à explorer vos options de migration ? Consultez notre guide de migration.

Comparer les fonctionnalités côte à côte

Voici comment les principales fonctionnalités sont empilées entre Azure Data Factory et Fabric Data Factory. Nous avons mis en évidence ce qui a changé, ce qui est nouveau et ce qui reste le même.

Azure Data Factory. Data Factory dans Fabric Différences
Canalisation Canalisation Meilleure intégration : Les pipelines dans Fabric fonctionnent en toute transparence avec Lakehouse, Data Warehouse et d’autres services Fabric intégrée par défaut. Les pipelines de fabrication incluent davantage d'activités basées sur le SaaS et diffèrent par les définitions JSON. Pour plus d’informations, consultez notre comparaison de fonctionnalités de pipeline .
Mappage de flux de données Dataflow Gen2 Plus facile à utiliser : Dataflow Gen2 vous offre une expérience plus simple pour la création de transformations. Nous ajoutons en permanence d'autres fonctionnalités de flux de données de mappage à Gen2.
Activités Activités Plus d’activités à venir : nous travaillons à apporter toutes vos activités ADF préférées à Fabric. De plus, vous bénéficiez de nouvelles fonctionnalités telles que les activités Office 365 Outlook qui ne sont pas disponibles dans ADF. Pour plus d’informations, consultez notre comparaison d’activités .
Jeu de données Connexions uniquement Approche plus simple : Aucune configuration de jeu de données plus complexe. Pour Data Factory dans Fabric, vous utilisez des connexions pour lier vos sources de données et commencer à travailler. Fabric élimine les jeux de données, en définissant les propriétés des données en ligne dans les activités.
Service lié Connexions Plus intuitive : les connexions fonctionnent comme les services liés, mais sont plus faciles à configurer et à gérer.
Déclencheurs Planification et archivage des déclencheurs d'événements Planification intégrée : utilisez le planificateur et les événements Reflex de Fabric pour exécuter automatiquement vos pipelines. Les déclencheurs d’événements de fichier fonctionnent en mode natif dans Fabric sans configuration supplémentaire. Fabric intègre des déclencheurs dans son framework Activateor, contrairement aux déclencheurs autonomes d’ADF.
Publier Enregistrer et exécuter Aucune étape de publication : dans Fabric, ignorez entièrement l’étape de publication. Sélectionnez Simplement Enregistrer pour stocker votre travail, ou sélectionnez Exécuter pour enregistrer et exécuter votre pipeline immédiatement.
Résolution automatique et runtime d’intégration Azure Non nécessaire Architecture simplifiée : il n’est pas nécessaire de gérer les runtimes d’intégration. Fabric gère le calcul pour vous.
Runtimes d’intégration auto-hébergés Passerelle de données locale Même accès local : connectez-vous à vos données locales à l’aide de la passerelle de données locale familière. En savoir plus dans notre guide d’accès aux données local.
Runtimes d’intégration Azure-SSIS À déterminer Fonctionnalité future dans Fabric : nous travaillons toujours sur la conception de l’intégration de SSIS dans Fabric.
Réseaux virtuels managés et points de terminaison privés À déterminer. Fonctionnalité future dans Fabric : nous travaillons toujours à l’intégration pour les réseaux virtuels managés et les points de terminaison privés dans Fabric.
Langage d’expression Langage d’expression Mêmes expressions : vos connaissances d’expression existantes transfèrent directement. La syntaxe est presque identique.
Types d’authentification Types d’authentification Plus d’options : Toutes vos méthodes d’authentification ADF populaires fonctionnent dans Fabric, et nous avons ajouté de nouveaux types d’authentification.
CI/CD CI/CD Les fonctionnalités améliorées au-delà d’ADF incluent la sélection facile, la promotion d’éléments individuels, l’activation du dépôt Git et les options CI/CD SaaS intégrées.
Exportation/importation de modèle ARM Enregistrer sous Duplication rapide : Dans Fabric, utilisez « Enregistrer sous » pour dupliquer rapidement des pipelines pour le développement ou le test.
Surveillance Hub de surveillance + Historique des exécutions Supervision avancée : le hub de supervision offre une expérience moderne avec des insights inter-espaces de travail et de meilleures fonctionnalités d’exploration.
Débogage Mode interactif Débogage simplifié : Fabric élimine le mode de débogage d’ADF. Vous êtes toujours en mode interactif.
Capture des modifications de données (CDC) Travaux de copie Déplacement incrémentiel des données : Fabric gère le déplacement incrémentiel des données via les travaux de copie au lieu des artefacts CDC.
Azure Synapse Link Mirroring Réplication des données : Fabric remplace Azure Synapse Link par des fonctionnalités de mise en miroir pour la réplication des données.
Exécuter une activité de pipeline Activité d’appel de pipeline Appel multiplateforme : Fabric améliore l’activité d’exécution du pipeline ADF avec un appel multiplateforme.

Comparaison des fonctionnalités de pipeline

Catégorie ADF Pipelines Pipelines de structure
Type de service Service PaaS d’intégration de données Service SaaS d’intégration de données
Environnement d'édition Portail Azure (ADF Studio) Espace de travail Fabric / PBI (expérience utilisateur unifiée avec Lakehouses, Warehouses, etc.)
Orchestration de la chaîne de traitement Pipelines complètes comprenant des activités, des déclencheurs et des paramètres Même modèle d’orchestration, repensé pour l’expérience utilisateur de Fabric
Déplacement des données Activité de copie, flux de données de mappage, prise en charge du runtime d’intégration local, réseau virtuel managé Activité de copie, Dataflows Gen2, connectivité intégrée aux éléments OneLake et Fabric, passerelle de données locale, passerelle de réseau virtuel
Calcul / Environnement d'Intégration Auto-hébergé, SSIS et Azure IR (pour le mouvement + transformation) Connexions cloud, passerelle de réseau local et de réseau virtuel
Flux de données Azure Blob, Data Lake Storage, SQL, 100+ connecteurs Mêmes connecteurs + intégration native de OneLake, alignement plus étroit de l'espace de travail Fabric
Surveillance Pipelines et flux de données dans ADF Studio avec des exécutions, des déclencheurs, des alertes Supervision du hub et de l’espace de travail avec des vues unifiées sur des pipelines, des flux de données, des notebooks, des bases de données, etc.
Déclencheurs Planifications, fenêtre glissante, déclencheurs basés sur des événements Planifications, déclencheurs d’événements, déclencheurs de fenêtres coulissantes comme planifications d'intervalle.
CI/CD Modèles ARM + Intégration du dépôt Azure DevOps ou GitHub Pipelines de déploiement intégrés dans Fabric ; promotion au niveau de l’espace de travail (Développement → Test → Production) et intégration du référentiel externe
Security Identités managées, intégration de Key Vault, points de terminaison privés Même modèle de sécurité plus RBAC du workspace Fabric ; intégration de la sécurité OneLake.
Pricing Paiement basé sur l'utilisation d'Azure (par exécution d'activité, déplacement de données et calcul) Basée sur la capacité (SKU Fabric F) sans frais pour les activités externes ni les pipelines, uniquement pour les exécutions d'activités et le transfert des données de pipeline.

Comparaison des activités

Avec Data Factory dans Microsoft Fabric, nous continuons à maintenir un degré élevé de continuité avec Azure Data Factory. Environ 90% d’activités accessibles dans ADF sont déjà disponibles sous Data Factory dans Fabric. Voici une répartition des activités et de leur disponibilité dans ADF et Data Factory dans Fabric :

Activité ADF Data Factory dans Fabric
ADX/KQL Oui Oui
Ajouter une variable Oui Oui
Azure Batch Oui Oui
Azure Databricks Activité notebookActivité jarActivité PythonActivité de travail Activité Azure Databricks
Azure Machine Learning Oui Oui
Exécution par lots Azure Machine Learning Deprecated N/A
Ressource de mise à jour Azure Machine Learning Deprecated N/A
Copier Copier des données activité Copy
Dataflow Gen2 N/A Oui
Supprimer Oui Oui
Pipeline d’exécution/appel Exécuter le pipeline Appeler le pipeline
Carnets en tissu N/A Oui
Échec Oui Oui
Filter Oui Oui
Pour chaque Oui Oui
Functions Azure Function Activité de fonction
Obtenir les métadonnées Oui Oui
HDInsight Activité HiveActivité pigActivité MapReduceActivité SparkActivité de streaming Activité HDInsight
Si condition Oui Oui
Recherche Oui Oui
Flux de données de mappage Oui Dataflow Gen2
Office 365 Outlook N/A Oui
Power Query (ADF uniquement - Mise en forme des flux de données) Deprecated N/A
Scénario Oui Oui
Actualisation du modèle sémantique N/A Oui
Définir une variable Oui Oui
Sproc Oui Oui
SSIS Oui N/A
Procédure stockée Oui Oui
Interrupteur Oui Oui
Activités Synapse Notebook et SJD Oui N/A
Équipes N/A Oui
Jusqu’à Oui Oui
Validation Oui Obtenir les métadonnées & If Condition
Wait Oui Oui
Le Web Oui Oui
Webhook Oui Oui
Gestion des flux de données Oui Dataflow Gen2

Nouvelles activités dans Fabric Data Factory

En plus de maintenir la continuité des activités, Data Factory dans Fabric introduit certaines nouvelles activités pour répondre à vos besoins d’orchestration plus riches. Ces nouvelles activités sont les suivantes :

  1. Outlook : disponible dans Fabric Data Factory pour faciliter l’intégration avec les services Outlook.
  2. Teams : disponible dans Fabric Data Factory pour activer l’orchestration des activités Microsoft Teams.
  3. Actualisation du modèle sémantique : disponible dans Fabric Data Factory pour améliorer les fonctionnalités d’actualisation du modèle sémantique Power BI.
  4. Dataflow Gen2 : disponible dans Fabric Data Factory pour permettre l’orchestration des données avec des fonctionnalités avancées de dataflow.

Pour obtenir la liste de toutes les activités Fabric Data Factory disponibles, consultez la vue d’ensemble de l’activité.

Comparaison des connecteurs

Pour obtenir une comparaison de tous les connecteurs et de leur disponibilité dans Azure Data Factory et Fabric Data Factory, consultez l’article de comparaison des connecteurs.

Runtime d’intégration auto-hébergé (SHIR) et passerelle de données locale (OPDG)

Note

Les services pris en charge par SHIR et ODPG sont différents :

  • Runtime d’intégration auto-hébergé (SHIR) : prend en charge Azure Data Factory, Azure Synapse Analytics, Azure Machine Learning Studio et Azure Purview.
  • Passerelle de données locale (OPDG) : prend en charge Power BI, Power Apps, Power Automate, Azure Analysis Services, Logic Apps, Fabric Dataflow Gen2, Fabric Pipeline, Fabric Copy Job et Fabric Mirroring.
Catégorie Runtime d’intégration auto-hébergé (SHIR) Passerelle de données locale (OPDG)
Services pris en charge - Azure Data Factory
- Azure Machine Learning Studio
- Azure Synapse Analytics
- Azure Purview
- Power BI
- Power Apps
- Power Automate
- Azure Analysis Services
- Logic Apps
- Fabric Dataflow Gen2
- Chaîne de traitement des fabrications
- Tâche de copie de toile
- Mise en miroir de fabric
Installation & Inscription - Inscrit par clé
- S’exécute en mode service
- Inscrit avec un compte Microsoft Entra ID
- Prend en charge le mode utilisateur
Plateforme -Windows
- Image de conteneur prise en charge
- Windows uniquement
- Aucune prise en charge des conteneurs
Prise en charge du proxy - Prise en charge du système et du proxy personnalisé - Prise en charge du proxy personnalisé
Liaison de région - Fixé à la région Data Factory
- Impossible de modifier la région par défaut
- La région peut être modifiée
Relais personnalisé - Non pris en charge -Supporté; les clients peuvent apporter leur propre relais
Partage entre les services - Partagé avec jusqu’à 120 fabriques de données
- Impossible de partager entre les espaces de travail ADF, Synapse, Purview ou Synapse
- Disponible pour tous les services compatibles au sein d’une instance
Haute disponibilité (HAUTE DISPONIBILITÉ) - Jusqu’à 8 nœuds (4 par défaut) - Jusqu’à 10 nœuds
Recovery - Nécessite une réinstallation - Clé de récupération supportée
Équilibrage - Équilibrage de charge au niveau des tâches en fonction du nombre de travailleurs disponibles (processeur + mémoire) - Équilibrage de charge au niveau de la requête
- Options de distribution aléatoire ou Round Robin
Gestionnaire d'identifiants - Stocké localement sur les nœuds SHIR
- Azure Key Vault supporté
- Stocké de manière centralisée dans le service cloud de passerelle
- Aucune intégration de Key Vault
Mise à jour automatique -Supporté - Non pris en charge
Extensibilité du connecteur - Non pris en charge -Supporté
Création interactive -Supporté -Supporté
Liaison privée pour le flux de contrôle -Supporté - Non pris en charge
Contrôle de version - Deux versions par mois ; un push en tant que mise à jour automatique
- Prend en charge les 12 derniers mois de versions
- Une version par mois
- Prend en charge les 6 dernières versions
Limitation du processeur et de la mémoire - Non pris en charge -Supporté
Limites de débit - Aucune limite stricte ; dépendant de la bande passante réseau Limites spécifiques au service :
Power Apps / Power Automate / Logic Apps :
- Écriture : limite de charge utile de 2 Mo
- Lecture : limite de requête de 2 Mo, limite de réponse compressée de 8 Mo
- Limite de l’URL de requête GET : 2 048 caractères
Power BI Direct Query : limite de réponse non compressée de 16 Mo

ADF Managed Virtual Network vs. Fabric Virtual Network Data Gateway

Azure Data Factory (ADF) Managed Virtual Network et Microsoft Fabric Virtual Network (réseau virtuel) Data Gateway vous aident tous deux à vous connecter à des sources de données en toute sécurité, sans les exposer à l’Internet public. Bien que les deux options prennent en charge la connectivité privée pour les charges de travail cloud, elles diffèrent dans la façon dont elles sont configurées, qui les gère et quels services ils prennent en charge.

  • Réseau virtuel managé ADF
    Microsoft possède et gère l’environnement réseau. Vous obtenez une configuration simple, mais vous ne pouvez pas contrôler les paramètres réseau ou les règles de pare-feu.

  • Passerelle de données de réseau virtuel Fabric
    Vous déployez la passerelle à l’intérieur de votre propre réseau virtuel Azure. Cela vous donne un contrôle total sur la mise en réseau, le pare-feu et la mise à l’échelle. Vous décidez comment la passerelle se connecte à vos ressources et gère tous les paramètres réseau.

Utilisez le tableau ci-dessous pour comparer les principales différences et choisir l’option qui correspond à vos besoins de charge de travail et de gouvernance.

Catégorie Réseau virtuel managé ADF Passerelle de données de réseau virtuel Fabric
Services pris en charge Pipelines Azure Data Factory &Synapse. Flux de données Microsoft Fabric Gen2, pipelines de données Fabric, tâche de copie Fabric, mise en miroir Fabric, modèles sémantiques Power BI et rapports paginés Power BI
Propriété du réseau virtuel Réseau virtuel géré par Microsoft (le client ne contrôle pas le réseau). Réseau virtuel géré par le client (le client a un contrôle total).
Points de terminaison privés Autocréé et géré par ADF pour les services pris en charge (Stockage Azure, BASE de données SQL, etc.). Les clients configurent la passerelle de réseau virtuel pour connecter des charges de travail Fabric aux ressources à l’intérieur de leur réseau virtuel.
Contrôle réseau Limité : les clients ne peuvent autoriser que le runtime d’intégration de réseau virtuel à des points de terminaison privés. Contrôle total : le client configure le pare-feu, les règles de groupe de sécurité réseau, le routage dans son propre réseau virtuel.
Installation / Déploiement Aucune installation n’est nécessaire ; entièrement géré par Microsoft à l’intérieur d’un réseau virtuel masqué. Nécessite le déploiement de la passerelle de données de réseau virtuel dans le réseau virtuel du client.
Haute disponibilité Géré par Microsoft, mis à l’échelle automatiquement à l’intérieur du réseau virtuel d’ADF. Commuter en mode réserve lors de l'activation de TTL. Prend en charge la mise à l’échelle et la haute disponibilité (clusters basés sur des nœuds), mais s’exécute à l’intérieur d’un réseau virtuel géré par le client. Prend en charge jusqu’à 7 nœuds.

Fonctionnalités clés de Fabric Data Factory

Dans Fabric Data Factory, la création de votre pipeline, de dataflows et d’autres éléments de Data Factory est incroyablement facile et rapide grâce à l'intégration native avec la fonctionnalité révolutionnaire d'IA Co-Pilot de Microsoft. Avec Copilot pour Data Factory, vous pouvez utiliser le langage naturel pour définir facilement vos projets d’intégration de données.

Intégration de Native Lakehouse et de Data Warehouse

L’un des principaux avantages de Fabric Data Factory est la façon dont il se connecte à vos plateformes de données. Lakehouse et Data Warehouse fonctionnent en tant que sources et destinations dans vos pipelines, ce qui facilite la création de projets de données intégrés.

Capture d'écran montrant les onglets Lakehouse et Data Warehouse Source.

Capture d'écran montrant l’onglet de destination Lakehouse et Data Warehouse.

Notifications par e-mail intelligentes avec Office 365

Avez-vous besoin de garder votre équipe informée ? L’activité Office 365 Outlook vous permet d’envoyer des notifications par e-mail personnalisées sur les exécutions de pipeline, l’état de l’activité et les résultats, avec une configuration simple. Plus de vérification des tableaux de bord constamment ou de l’écriture de code de notification personnalisé.

Capture d'écran montrant l'activité d'Office 365 Outlook.

Expérience de connexion de données simplifiée

L’expérience moderne Get data de Fabric permet de configurer rapidement des pipelines de copie et de créer de nouvelles connexions. Vous passerez moins de temps à configurer et davantage de temps à envoyer vos données là où elles doivent aller.

Capture d'écran montrant une expérience moderne et facile de l'obtention de données.

Capture d'écran montrant comment créer une nouvelle connexion.

Améliorations de la facilité d’utilisation dans l’expérience CI/CD

Dans Fabric, l’expérience CI/CD est beaucoup plus facile et plus flexible que dans Azure Data Factory ou Synapse. Il n’existe aucune connexion entre les modèles CI/CD et ARM dans Fabric, ce qui facilite la sélection de parties individuelles de votre espace de travail Fabric pour l’archivage, l’extraction, la validation et la collaboration. Dans ADF et Synapse, votre seule option pour CI/CD consiste à utiliser votre propre dépôt Git. Toutefois, dans Fabric, vous pouvez éventuellement utiliser la fonctionnalité de pipelines de déploiement intégrés qui ne nécessite pas d’apporter votre propre dépôt Git externe.

Surveillance et analyses de nouvelle génération

L’expérience de supervision dans Fabric Data Factory est l’endroit où vous verrez vraiment la différence. Le hub de surveillance vous donne une vue complète de toutes vos charges de travail, et vous pouvez explorer n’importe quelle activité pour obtenir des insights détaillés. L’analyse inter-espaces de travail est intégrée, ce qui vous permet de voir la vue d’ensemble de votre organisation.

Capture d'écran montrant le hub de supervision et les éléments de Data Factory.

Lorsque vous résolvez les problèmes liés aux activités de copie, vous aurez l’amour de la vue de répartition détaillée. Sélectionnez le bouton Détails de l’exécution (icône lunettes) pour voir exactement ce qui s’est passé. La répartition de durée vous montre combien de temps chaque étape a pris, ce qui facilite l’optimisation des performances.

La capture d'écran montrant les résultats de la surveillance de la copie du pipeline fournit des détails sur l'activité de la copie.

Capture d'écran montrant les détails des données de copie.

Duplication rapide du pipeline

Besoin de créer un pipeline similaire ? La fonctionnalité Enregistrer sous vous permet de dupliquer n'importe quel pipeline existant en quelques secondes. Il est parfait pour créer des versions de développement, tester des variantes ou configurer des flux de travail similaires.

Capture d'écran montrant l'enregistrement sous dans le pipeline Fabric.

Pour plus d’informations, consultez les ressources suivantes :