Freigeben über


Unterschiede zwischen Azure Data Factory und Fabric Data Factory

Data Factory in Microsoft Fabric ist die nächste Generation von Azure Data Factory, die entwickelt wurde, um Ihre komplexesten Datenintegrationsprobleme mit einem einfacheren, leistungsstärkeren Ansatz zu bewältigen.

Dieser Leitfaden hilft Ihnen, die wichtigsten Unterschiede zwischen diesen beiden Diensten zu verstehen, damit Sie die richtige Wahl für Ihr Unternehmen treffen können. Wir führen Sie durch die Neuerungen, was anders ist und welche Vorteile Fabric mit sich bringt.

Fabric Data Factory ist die nächste Generation von Azure Data Factory, die entwickelt wurde, um Datenintegrationsworkflows zu vereinfachen und zu verbessern. In diesem Abschnitt werden die wichtigsten Features und Vorteile von Fabric Data Factory vorgestellt.

Sind Sie bereit, Ihre Migrationsoptionen zu erkunden? Sehen Sie sich unseren Migrationsleitfaden an.

Funktionen nebeneinander vergleichen

Hier erfahren Sie, wie sich die Kernfeatures zwischen Azure Data Factory und Fabric Data Factory stapeln. Wir haben hervorgehoben, was geändert wurde, was neu ist und was gleich bleibt.

Azure Data Factory Data Factory in Fabric Unterschiede
Rohrleitung Rohrleitung Bessere Integration: Pipelines in Fabric arbeiten nahtlos mit Lakehouse, Data Warehouse und anderen Fabric-Diensten direkt aus der Box heraus. Fabric-Pipelines umfassen mehr saaS-basierte Aktivitäten und unterscheiden sich in JSON-Definitionen. Weitere Details finden Sie in unserem Pipeline-Featurevergleich .
Mapping Data Flow Dataflow Gen2 Einfacher zu verwenden: Dataflow Gen2 bietet Ihnen eine einfachere Oberfläche zum Erstellen von Transformationen. Wir fügen Gen2 kontinuierlich mehr Mapping-Datenflussfunktionen hinzu.
activities activities Weitere Aktivitäten kommen: Wir arbeiten daran, alle Ihre bevorzugten ADF-Aktivitäten in Fabric zu bringen. Darüber hinaus erhalten Sie neue Aktivitäten wie die Office 365 Outlook-Aktivität, die in ADF nicht verfügbar sind. Details finden Sie in unserem Aktivitätsvergleich .
Datensatz Nur Verbindungen Einfacherer Ansatz: Keine komplexeren Datasetkonfigurationen. Für Data Factory in Fabric verwenden Sie Verbindungen, um eine Verknüpfung mit Ihren Datenquellen herzustellen und mit der Arbeit zu beginnen. Fabric entfernt Datensätze und definiert Dateneigenschaften inline innerhalb von Aktivitäten.
Verknüpfter Dienst Verbindungen Intuitiver: Verbindungen funktionieren wie verknüpfte Dienste, sind aber einfacher einzurichten und zu verwalten.
Trigger Planen und Dateiereignistrigger Integrierter Scheduler: Verwenden Sie den Scheduler und die Reflexereignisse von Fabric, um Ihre Pipelines automatisch auszuführen. Dateiereignistrigger funktionieren nativ in Fabric ohne zusätzliches Setup. Fabric integriert Trigger in das Aktivatorframework, im Gegensatz zu eigenständigen Triggern von ADF.
Veröffentlichen Speichern und Ausführen Kein Veröffentlichungsschritt: Überspringen Sie in Fabric den Veröffentlichungsschritt vollständig. Wählen Sie einfach "Speichern" aus, um Ihre Arbeit zu speichern, oder wählen Sie "Ausführen" aus, um Die Pipeline sofort zu speichern und auszuführen.
Autoresolve und Azure Integration Runtime Überflüssig Vereinfachte Architektur: Keine Integrationslaufzeiten müssen verwaltet werden. Fabric verarbeitet die Berechnung für Sie.
Selbstgehostete Integration Runtimes Lokales Datengateway Derselbe lokale Zugriff: Stellen Sie mithilfe des vertrauten lokalen Datengateways eine Verbindung mit Ihren lokalen Daten her. Erfahren Sie mehr in unserem lokalen Datenzugriffshandbuch.
Azure-SSIS Integration Runtimes Noch festzulegen Zukünftige Funktionen in Fabric: Wir arbeiten noch an dem Design für die SSIS-Integration in Fabric.
Verwaltete virtuelle Netzwerke und private Endpunkte Bestimmung erforderlich. Zukünftige Funktion in Fabric: Wir arbeiten noch an der Integration für verwaltete virtuelle Netzwerke und private Endpunkte in Fabric.
Ausdruckssprache Ausdruckssprache Gleiche Ausdrücke: Ihr vorhandenes Wissen über Ausdrücke wird direkt übertragen. Die Syntax ist nahezu identisch.
Authentifizierungstypen Authentifizierungstypen Weitere Optionen: Alle ihre beliebten ADF-Authentifizierungsmethoden funktionieren in Fabric, und wir haben neue Authentifizierungstypen hinzugefügt.
CI/CD CI/CD Zu den erweiterten Funktionen über ADF hinaus gehören einfaches Cherry-Picking, die Promotion einzelner Elemente, die Aktivierung von Git-Repositories und integrierte CI/CD-Optionen für SaaS.
ARM-Vorlagenexport/-import Speichern unter Schnelle Duplizierung: Verwenden Sie in Fabric "Speichern unter", um schnell Pipelines für die Entwicklung oder das Testen zu duplizieren.
Überwachung Überwachungshub + Ausführungsverlauf Erweiterte Überwachung: Der Monitoring Hub bietet eine moderne Erfahrung mit arbeitsbereichübergreifenden Einblicken und besseren Drilldownfunktionen.
Fehlersuche Interaktiver Modus Vereinfachtes Debuggen: Fabric beseitigt den Debugmodus von ADF. Sie befinden sich immer im interaktiven Modus.
Änderungen der Datenbank-Erfassung (Change Data Capture, CDC) Kopieraufträge Inkrementelle Datenverschiebung: Fabric verwaltet die inkrementelle Datenverschiebung durch Kopieraufträge anstelle von CDC-Artefakten.
Azure Synapse-Link Spiegelung Datenreplikation: Fabric ersetzt Azure Synapse Link durch Spiegelungsfeatures für die Datenreplikation.
Ausführen der Pipelineaktivität Aktivität „Pipeline aufrufen“ Plattformübergreifender Aufruf: Fabric verbessert die Execute-Pipelineaktivität von ADF durch plattformübergreifende Aufrufe.

Vergleich von Pipeline-Features

Kategorie ADF-Pipelines Fabric-Pipelines
Diensttyp PaaS-Dienst für die Datenintegration SaaS-Dienst für die Datenintegration
Erstellungsumgebung Azure-Portal (ADF Studio) Fabric / PBI-Arbeitsbereich (einheitliche Benutzererfahrung mit Lakehouses, Warehouses usw.)
Pipeline-Orchestrierung Pipelines mit vollem Funktionsumfang mit Aktivitäten, Triggern, Parametern Das gleiche Orchestrierungsmodell, das für Fabric UX neu vorgestellt wurde
Datenverschiebung Kopieren von Aktivitäten, Zuordnen von Datenflüssen, lokale IR-Unterstützung, verwaltetes virtuelles Netzwerk Kopiervorgang, Dataflows Gen2, integrierte Konnektivität zu OneLake- und Fabric-Elemente, lokales Daten-Gateway, virtuelles Netzwerk-Gateway
Rechnen / IR Selbst gehostete, SSIS und Azure IR (für Bewegung + Transformation) Cloudverbindungen, lokale und virtuelles Netzwerkgateway
Datenflüsse Azure Blob, Data Lake Storage, SQL, 100+ Konnektoren Gleiche Konnektoren und native Integration von OneLake, engere Abstimmung der Fabric-Arbeitsbereiche
Überwachung Pipelines und Datenflüsse in ADF Studio mit Ausführung, Triggern, Warnungen Überwachungshub- und Arbeitsbereichsüberwachung mit einheitlichen Ansichten über Pipelines, Datenflüsse, Notizbücher, Datenbanken usw.
Trigger Zeitpläne, Tumbling-Fenster, ereignisbasierte Trigger Zeitpläne, Ereignistrigger, Tumbling-Window-Trigger als Intervallzeitpläne
CI/CD ARM-Vorlagen + Azure DevOps- oder GitHub-Repo-Integration Integrierte Bereitstellungspipelinen in Fabric; Heraufstufung auf Arbeitsbereichsebene (Dev → Test → Production) und externe Repositoryintegration
Sicherheit Verwaltete Identitäten, Key Vault-Integration, private Endpunkte Gleiches Sicherheitsmodell plus Fabric Workspace RBAC; OneLake-Sicherheitsintegration
Pricing Nutzungsbasierte Azure-Abrechnung nach dem Pay-as-you-go-Prinzip (pro Aktivitätsausführung, Datenverschiebung und Rechenleistung) Kapazitätsbasierte Abrechnung (Fabric F-SKU) ohne Gebühren für externe Aktivitäten oder Pipeline-Aktivitäten, Gebühren fallen nur für Aktivitätsausführungen und die Bewegung von Pipelinedaten an.

Aktivitätsvergleich

Mit Data Factory in Microsoft Fabric behalten wir weiterhin ein hohes Maß an Kontinuität mit Azure Data Factory bei. Ungefähr 90% von Aktivitäten, auf die in ADF zugegriffen werden kann, sind bereits unter Data Factory in Fabric verfügbar. Nachfolgend finden Sie eine Übersicht über die Aktivitäten und deren Verfügbarkeit in ADF und Data Factory in Fabric:

Aktivität ADF Data Factory in Fabric
ADX/KQL Y Y
Variable anfügen Y Y
Azure Batch Y Y
Azure Databricks NotizbuchaktivitätJar-AktivitätPython-AktivitätJob-Aktivität Azure Databricks-Aktivität
Azure Machine Learning Y Y
Batchausführung von Azure Machine Learning Deprecated N/A
Azure Machine Learning Update-Ressource Deprecated N/A
Kopieren Kopieren von Daten Kopieraktivität
Dataflow Gen2 N/A Y
Löschen Y Y
Ausführen/Aufrufen Pipeline Pipeline ausführen Pipeline aufrufen
Fabric-Notizbücher N/A Y
Fehler Y Y
Filter Y Y
Für jede(n) Y Y
Funktionen Azure-Funktion Funktionsaktivität
Metadaten abrufen Y Y
HDInsight Hive-AktivitätSchweineaktivitätMapReduce-AktivitätSpark-AktivitätStreaming-Aktivität HDInsight-Aktivität
Wenn-Bedingung Y Y
Suche Y Y
Zuordnungsdatenfluss Y Dataflow Gen2
Office 365 Outlook N/A Y
Power Query (nur ADF – Wrangling-Datenfluss) Deprecated N/A
Skript Y Y
Aktualisierung des semantischen Modells N/A Y
Variable festlegen Y Y
Sproc Y Y
SSIS Y N/A
Gespeicherte Prozedur Y Y
Schalter Y Y
Synapse-Notizbuch- und SJD-Aktivitäten Y N/A
Mannschaften N/A Y
Until Y Y
Validation Y Abrufen von Metadaten und Wenn-Bedingung
Wait Y Y
das Internet Y Y
Webhook Y Y
Datenfluss wrangieren Y Dataflow Gen2

Neue Aktivitäten in Fabric Data Factory

Zusätzlich zur Aufrechterhaltung der Aktivitätskontinuität führt Data Factory in Fabric einige neue Aktivitäten ein, um Ihre umfangreicheren Orchestrierungsanforderungen zu erfüllen. Diese neuen Aktivitäten sind:

  1. Outlook: In Fabric Data Factory verfügbar, um die Integration in Outlook-Dienste zu erleichtern.
  2. Teams: Verfügbar in Fabric Data Factory, um die Orchestrierung von Microsoft Teams-Aktivitäten zu ermöglichen.
  3. Aktualisierung des semantischen Modells: Verfügbar in Fabric Data Factory, um die Aktualisierungsfunktionen des Power BI-Semantikmodells zu verbessern.
  4. Dataflow Gen2: Verfügbar in Fabric Data Factory, um die Daten-Orchestrierung mit erweiterten Dataflow-Funktionen zu ermöglichen.

Eine Liste aller verfügbaren Fabric Data Factory-Aktivitäten finden Sie in der Aktivitätsübersicht.

Verbindervergleich

Einen Vergleich aller Connectors und deren Verfügbarkeit in Azure Data Factory und Fabric Data Factory finden Sie im Connector-Vergleichsartikel.

Self-hosted Integration Runtime (SHIR) vs. On-premises Data Gateway (OPDG)

Hinweis

Die von SHIR und ODPG unterstützten Dienste unterscheiden sich:

  • Self-hosted Integration Runtime (SHIR): Unterstützt Azure Data Factory, Azure Synapse Analytics, Azure Machine Learning Studio und Azure Purview.
  • On-premises Data Gateway (OPDG): Unterstützt Power BI, Power Apps, Power Automate, Azure Analysis Services, Logic Apps, Fabric Dataflow Gen2, Fabric Pipeline, Fabric Copy Job und Fabric Mirroring.
Kategorie Selbstgehostete Integrationslaufzeit (SHIR) Vor-Ort-Datengateway (OPDG)
Unterstützte Dienste – Azure Data Factory
– Azure Machine Learning Studio
– Azure Synapse Analytics
– Azure Purview
Power BI
– Power Apps
– Power Automate
– Azure Analysis Services
- Logik-Apps
- Fabric Dataflow Gen2
- Fabric-Pipeline
- Fabric-Kopieauftrag
- Fabric-Spiegelung
Installation und Registrierung - Registriert nach Schlüssel
- Wird im Dienstmodus ausgeführt
– Registriert mit dem Microsoft Entra ID-Konto
- Unterstützt den Benutzermodus
Plattform – Windows
- Container-Image wird unterstützt
– Nur Windows
- Keine Containerunterstützung
Proxyunterstützung – Unterstützung sowohl des Systems als auch des benutzerdefinierten Proxys - Unterstützung eines benutzerdefinierten Proxys
Regionsbindung - Problem mit der Data Factory-Region behoben
- Standardbereich kann nicht geändert werden
- Region kann geändert werden
Benutzerdefiniertes Relay – Nicht unterstützt -Abgestützt; Kunden können ihr eigenes Relay mitbringen
Gemeinsame Nutzung über Dienste hinweg - Geteilt mit bis zu 120 Datenfabriken
– Kann nicht für ADF-, Synapse-, Purview- oder andere Synapse-Arbeitsbereiche freigegeben werden.
– Verfügbar für alle unterstützten Dienste innerhalb eines Mandanten
Hohe Verfügbarkeit (HA) - Bis zu 8 Knoten (4 Standard) - Bis zu 10 Knoten
Recovery - Erfordert Neuinstallation – Wiederherstellungsschlüssel unterstützt
Lastenausgleich – Lastenausgleich auf Aufgabenebene basierend auf der Anzahl verfügbarer Prozessoren (CPU und Speicher) - Lastenausgleich auf Abfrageebene
- Roundrobin- oder Zufallsverteilungsoptionen
Anmeldedatenbank – Lokal auf SHIR-Knoten gespeichert
– Azure Key Vault unterstützt
– Zentral im Gateway-Clouddienst gespeichert
- Keine Key Vault-Integration
Automatische Aktualisierung -Abgestützt – Nicht unterstützt
Verbindererweiterung – Nicht unterstützt -Abgestützt
Interaktive Dokumenterstellung -Abgestützt -Abgestützt
Private Verknüpfung für den Steuerungsfluss -Abgestützt – Nicht unterstützt
Versionsverwaltung - Zwei Versionen pro Monat; ein Push als AutoUpdate
- Unterstützt die letzten 12 Monate von Veröffentlichungen
- Eine Veröffentlichung pro Monat
- Unterstützt die letzten 6 Versionen
CPU- und Speicherdrosselung – Nicht unterstützt -Abgestützt
Durchsatzgrenzwerte - Keine harte Grenze; abhängig von der Netzwerkbandbreite Dienstspezifische Grenzwerte:
Power Apps / Power Automate / Logic Apps:
- Schreibzugriff: 2-MB Nutzlastlimit
- Lesezugriff: 2-MB Anforderungsgrenze, 8 MB komprimierte Antwortgrenze
- URL-Grenzwert für GET-Anforderung: 2.048 Zeichen
Power BI Direct Query: 16-MB unkomprimierte Antwortbeschränkung

ADF Managed Virtual Network vs. Fabric Virtual Network Data Gateway

Azure Data Factory (ADF) Managed Virtual Network und Microsoft Fabric Virtual Network (virtual network) Data Gateway helfen Ihnen, eine sichere Verbindung mit Datenquellen herzustellen, ohne sie dem öffentlichen Internet verfügbar zu machen. Beide Optionen unterstützen zwar private Konnektivität für Cloudworkloads, unterscheiden sich jedoch darin, wie sie eingerichtet werden, wer sie verwaltet und welche Dienste sie unterstützen.

  • Verwaltetes ADF-VNET
    Microsoft besitzt und verwaltet die Netzwerkumgebung. Sie erhalten ein einfaches Setup, aber Sie können die Netzwerkeinstellungen oder Firewallregeln nicht steuern.

  • Fabric VNET-Datengateway
    Sie stellen das Gateway in Ihrem eigenen virtuellen Azure-Netzwerk bereit. Dadurch erhalten Sie vollständige Kontrolle über Netzwerk, Firewall und Skalierung. Sie entscheiden, wie das Gateway eine Verbindung mit Ihren Ressourcen herstellt und alle Netzwerkeinstellungen verwaltet.

Verwenden Sie die nachstehende Tabelle, um die wichtigsten Unterschiede zu vergleichen und die Option auszuwählen, die Ihren Workload- und Governanceanforderungen entspricht.

Kategorie Von ADF verwaltetes virtuelles Netzwerk Fabric Virtual Network Data Gateway
Unterstützte Dienste Azure Data Factory & Synapse-Pipelines. Microsoft Fabric Dataflow Gen2, Fabric-Datenpipelines, Fabric Copy Job, Fabric Mirroring, Power BI-Semantikmodelle und Power BI-Berichte im Seitenlayout
VNET-Besitz Von Microsoft verwaltetes virtuelles Netzwerk (Der Kunde kontrolliert das Netzwerk nicht). Vom Kunden verwaltetes virtuelles Netzwerk (Kunde hat Vollzugriff).
Private Endpunkte Automatisch erstellt und verwaltet von ADF für unterstützte Dienste (Azure Storage, SQL DB usw.). Kunden konfigurieren virtuelles Netzwerkgateway, um Fabric-Workloads mit Ressourcen innerhalb ihres virtuellen Netzwerks zu verbinden.
Netzwerksteuerung Eingeschränkt – Kunden können nur die Laufzeit der Integration virtueller Netzwerke für private Endpunkte zulassen. Vollzugriff – Der Kunde konfiguriert Firewall, NSG-Regeln, Routing in einem eigenen virtuellen Netzwerk.
Installation/Bereitstellung Keine Installation erforderlich; vollständig von Microsoft in einem verborgenen virtuellen Netzwerk verwaltet. Erfordert die Bereitstellung des virtuellen Netzwerkdatengateways im virtuellen Netzwerk des Kunden.
Hohe Verfügbarkeit Von Microsoft verwaltetes, innerhalb des virtuellen Netzwerks der ADF automatisch skaliertes System. Wechseln Sie zum Reservemodus, wenn Sie TTL aktivieren. Unterstützt Skalierung und HA (knotenbasierte Cluster), wird jedoch innerhalb des vom Kunden verwalteten virtuellen Netzwerks ausgeführt. Unterstützt bis zu 7 Knoten.

Wichtige Features von Fabric Data Factory

In Fabric Data Factory ist das Erstellen Ihrer Pipelines, Datenflüsse und anderer Data Factory-Elemente aufgrund der nahtlosen Integration der bahnbrechenden KI-Features von Microsoft unglaublich einfach und schnell. Mit Copilot für Data Factory können Sie ihre Datenintegrationsprojekte ganz einfach mit natürlicher Sprache definieren.

Native Lakehouse- und Data Warehouse-Integration

Einer der größten Vorteile von Fabric Data Factory ist die Verbindung mit Ihren Datenplattformen. Lakehouse und Data Warehouse funktionieren sowohl als Quellen als auch Ziele in Ihren Pipelines, wodurch es einfach ist, integrierte Datenprojekte zu erstellen.

Screenshot: Registerkarte „Lakehouse- und Data Warehouse -Quelle“.

Screenshot: Registerkarte „Lakehouse- und Data Warehouse -Ziel“.

Intelligente E-Mail-Benachrichtigungen mit Office 365

Müssen Sie Ihr Team auf dem Laufenden halten? Mit der Office 365 Outlook-Aktivität können Sie angepasste E-Mail-Benachrichtigungen zu Pipelineausführungen, Aktivitätsstatus und Ergebnissen senden – alles mit einfacher Konfiguration. Es ist nicht mehr nötig, Dashboards ständig zu überprüfen oder benutzerdefinierten Benachrichtigungscode zu schreiben.

Screenshot: Office 365 Outlook-Aktivität.

Optimiertes Erlebnis der Datenverbindung

Die moderne Benutzeroberfläche zum Abrufen von Daten von Fabric erleichtert das Einrichten von Kopierpipelines und das Erstellen neuer Verbindungen. Sie verbringen weniger Zeit mit der Konfiguration und mehr Zeit damit, Ihre Daten dorthin zu bringen, wo sie benötigt werden.

Screenshot: Moderne und einfache Funktion zum Abrufen von Daten.

Screenshot: Erstellen einer neuen Verbindung.

Verbesserungen bei der benutzerfreundlichen Nutzung von CI/CD

In Fabric ist die CI/CD-Erfahrung viel einfacher und flexibler als in Azure Data Factory oder Synapse. Es gibt keine Verbindung zwischen CI/CD- und ARM-Vorlagen in Fabric, wodurch es super einfach ist, einzelne Teile Ihres Fabric-Arbeitsbereichs für Einchecken, Auschecken, Validierung und Zusammenarbeit zu auswählen. In ADF und Synapse besteht Ihre einzige Option für CI/CD darin, Ihr eigenes Git-Repository zu verwenden. In Fabric können Sie jedoch das integrierte Bereitstellungspipeline-Feature optional verwenden, das nicht erfordert, ein eigenes externes Git-Repository mitzubringen.

Überwachung und Einblicke auf nächster Ebene

Die Überwachungserfahrung in Fabric Data Factory ist der Ort, an dem Sie den Unterschied wirklich sehen. Der Monitoring Hub bietet Ihnen eine vollständige Übersicht über alle Ihre Workloads, und Sie können einen Drilldown zu jeder Aktivität durchführen, um detaillierte Einblicke zu erhalten. Die Arbeitsbereichsübergreifende Analyse ist direkt integriert, sodass Sie das Gesamtbild in Ihrer gesamten Organisation sehen können.

Screenshot: Überwachungshub and die Elemente von Data Factory.

Bei der Fehlerbehebung von Kopieraktivitäten werden Sie von der detaillierten Aufschlüsselungsansicht begeistert sein. Wählen Sie die Schaltfläche "Ausführungsdetails" (das Brillensymbol) aus, um genau zu sehen, was passiert ist. Die Aufschlüsselung "Dauer" zeigt Ihnen, wie lange jede Phase dauerte, wodurch die Leistungsoptimierung vereinfacht wird.

Screenshot: Kopierüberwachungsergebnisse der Pipeline bieten eine detaillierte Aufschlüsselung der Copy-Aktivität.

Screenshot: Details zu „Daten kopieren“.

Schnelle Pipeline-Duplizierung

Müssen Sie eine ähnliche Pipeline erstellen? Mit dem Feature Speichern unter können Sie vorhandene Pipelines in Sekunden duplizieren. Es eignet sich perfekt zum Erstellen von Entwicklungsversionen, Zum Testen von Variationen oder zum Einrichten ähnlicher Workflows.

Screenshot: „Speichern unter“ in einer Fabric-Pipeline.

Weitere Informationen finden Sie in den folgenden Ressourcen: