Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Data Factory in Microsoft Fabric ist die nächste Generation von Azure Data Factory, die entwickelt wurde, um Ihre komplexesten Datenintegrationsprobleme mit einem einfacheren, leistungsstärkeren Ansatz zu bewältigen.
Dieser Leitfaden hilft Ihnen, die wichtigsten Unterschiede zwischen diesen beiden Diensten zu verstehen, damit Sie die richtige Wahl für Ihr Unternehmen treffen können. Wir führen Sie durch die Neuerungen, was anders ist und welche Vorteile Fabric mit sich bringt.
Fabric Data Factory ist die nächste Generation von Azure Data Factory, die entwickelt wurde, um Datenintegrationsworkflows zu vereinfachen und zu verbessern. In diesem Abschnitt werden die wichtigsten Features und Vorteile von Fabric Data Factory vorgestellt.
Sind Sie bereit, Ihre Migrationsoptionen zu erkunden? Sehen Sie sich unseren Migrationsleitfaden an.
Funktionen nebeneinander vergleichen
Hier erfahren Sie, wie sich die Kernfeatures zwischen Azure Data Factory und Fabric Data Factory stapeln. Wir haben hervorgehoben, was geändert wurde, was neu ist und was gleich bleibt.
| Azure Data Factory | Data Factory in Fabric | Unterschiede |
|---|---|---|
| Rohrleitung | Rohrleitung | Bessere Integration: Pipelines in Fabric arbeiten nahtlos mit Lakehouse, Data Warehouse und anderen Fabric-Diensten direkt aus der Box heraus. Fabric-Pipelines umfassen mehr saaS-basierte Aktivitäten und unterscheiden sich in JSON-Definitionen. Weitere Details finden Sie in unserem Pipeline-Featurevergleich . |
| Mapping Data Flow | Dataflow Gen2 | Einfacher zu verwenden: Dataflow Gen2 bietet Ihnen eine einfachere Oberfläche zum Erstellen von Transformationen. Wir fügen Gen2 kontinuierlich mehr Mapping-Datenflussfunktionen hinzu. |
| activities | activities | Weitere Aktivitäten kommen: Wir arbeiten daran, alle Ihre bevorzugten ADF-Aktivitäten in Fabric zu bringen. Darüber hinaus erhalten Sie neue Aktivitäten wie die Office 365 Outlook-Aktivität, die in ADF nicht verfügbar sind. Details finden Sie in unserem Aktivitätsvergleich . |
| Datensatz | Nur Verbindungen | Einfacherer Ansatz: Keine komplexeren Datasetkonfigurationen. Für Data Factory in Fabric verwenden Sie Verbindungen, um eine Verknüpfung mit Ihren Datenquellen herzustellen und mit der Arbeit zu beginnen. Fabric entfernt Datensätze und definiert Dateneigenschaften inline innerhalb von Aktivitäten. |
| Verknüpfter Dienst | Verbindungen | Intuitiver: Verbindungen funktionieren wie verknüpfte Dienste, sind aber einfacher einzurichten und zu verwalten. |
| Trigger | Planen und Dateiereignistrigger | Integrierter Scheduler: Verwenden Sie den Scheduler und die Reflexereignisse von Fabric, um Ihre Pipelines automatisch auszuführen. Dateiereignistrigger funktionieren nativ in Fabric ohne zusätzliches Setup. Fabric integriert Trigger in das Aktivatorframework, im Gegensatz zu eigenständigen Triggern von ADF. |
| Veröffentlichen | Speichern und Ausführen | Kein Veröffentlichungsschritt: Überspringen Sie in Fabric den Veröffentlichungsschritt vollständig. Wählen Sie einfach "Speichern" aus, um Ihre Arbeit zu speichern, oder wählen Sie "Ausführen" aus, um Die Pipeline sofort zu speichern und auszuführen. |
| Autoresolve und Azure Integration Runtime | Überflüssig | Vereinfachte Architektur: Keine Integrationslaufzeiten müssen verwaltet werden. Fabric verarbeitet die Berechnung für Sie. |
| Selbstgehostete Integration Runtimes | Lokales Datengateway | Derselbe lokale Zugriff: Stellen Sie mithilfe des vertrauten lokalen Datengateways eine Verbindung mit Ihren lokalen Daten her. Erfahren Sie mehr in unserem lokalen Datenzugriffshandbuch. |
| Azure-SSIS Integration Runtimes | Noch festzulegen | Zukünftige Funktionen in Fabric: Wir arbeiten noch an dem Design für die SSIS-Integration in Fabric. |
| Verwaltete virtuelle Netzwerke und private Endpunkte | Bestimmung erforderlich. | Zukünftige Funktion in Fabric: Wir arbeiten noch an der Integration für verwaltete virtuelle Netzwerke und private Endpunkte in Fabric. |
| Ausdruckssprache | Ausdruckssprache | Gleiche Ausdrücke: Ihr vorhandenes Wissen über Ausdrücke wird direkt übertragen. Die Syntax ist nahezu identisch. |
| Authentifizierungstypen | Authentifizierungstypen | Weitere Optionen: Alle ihre beliebten ADF-Authentifizierungsmethoden funktionieren in Fabric, und wir haben neue Authentifizierungstypen hinzugefügt. |
| CI/CD | CI/CD | Zu den erweiterten Funktionen über ADF hinaus gehören einfaches Cherry-Picking, die Promotion einzelner Elemente, die Aktivierung von Git-Repositories und integrierte CI/CD-Optionen für SaaS. |
| ARM-Vorlagenexport/-import | Speichern unter | Schnelle Duplizierung: Verwenden Sie in Fabric "Speichern unter", um schnell Pipelines für die Entwicklung oder das Testen zu duplizieren. |
| Überwachung | Überwachungshub + Ausführungsverlauf | Erweiterte Überwachung: Der Monitoring Hub bietet eine moderne Erfahrung mit arbeitsbereichübergreifenden Einblicken und besseren Drilldownfunktionen. |
| Fehlersuche | Interaktiver Modus | Vereinfachtes Debuggen: Fabric beseitigt den Debugmodus von ADF. Sie befinden sich immer im interaktiven Modus. |
| Änderungen der Datenbank-Erfassung (Change Data Capture, CDC) | Kopieraufträge | Inkrementelle Datenverschiebung: Fabric verwaltet die inkrementelle Datenverschiebung durch Kopieraufträge anstelle von CDC-Artefakten. |
| Azure Synapse-Link | Spiegelung | Datenreplikation: Fabric ersetzt Azure Synapse Link durch Spiegelungsfeatures für die Datenreplikation. |
| Ausführen der Pipelineaktivität | Aktivität „Pipeline aufrufen“ | Plattformübergreifender Aufruf: Fabric verbessert die Execute-Pipelineaktivität von ADF durch plattformübergreifende Aufrufe. |
Vergleich von Pipeline-Features
| Kategorie | ADF-Pipelines | Fabric-Pipelines |
|---|---|---|
| Diensttyp | PaaS-Dienst für die Datenintegration | SaaS-Dienst für die Datenintegration |
| Erstellungsumgebung | Azure-Portal (ADF Studio) | Fabric / PBI-Arbeitsbereich (einheitliche Benutzererfahrung mit Lakehouses, Warehouses usw.) |
| Pipeline-Orchestrierung | Pipelines mit vollem Funktionsumfang mit Aktivitäten, Triggern, Parametern | Das gleiche Orchestrierungsmodell, das für Fabric UX neu vorgestellt wurde |
| Datenverschiebung | Kopieren von Aktivitäten, Zuordnen von Datenflüssen, lokale IR-Unterstützung, verwaltetes virtuelles Netzwerk | Kopiervorgang, Dataflows Gen2, integrierte Konnektivität zu OneLake- und Fabric-Elemente, lokales Daten-Gateway, virtuelles Netzwerk-Gateway |
| Rechnen / IR | Selbst gehostete, SSIS und Azure IR (für Bewegung + Transformation) | Cloudverbindungen, lokale und virtuelles Netzwerkgateway |
| Datenflüsse | Azure Blob, Data Lake Storage, SQL, 100+ Konnektoren | Gleiche Konnektoren und native Integration von OneLake, engere Abstimmung der Fabric-Arbeitsbereiche |
| Überwachung | Pipelines und Datenflüsse in ADF Studio mit Ausführung, Triggern, Warnungen | Überwachungshub- und Arbeitsbereichsüberwachung mit einheitlichen Ansichten über Pipelines, Datenflüsse, Notizbücher, Datenbanken usw. |
| Trigger | Zeitpläne, Tumbling-Fenster, ereignisbasierte Trigger | Zeitpläne, Ereignistrigger, Tumbling-Window-Trigger als Intervallzeitpläne |
| CI/CD | ARM-Vorlagen + Azure DevOps- oder GitHub-Repo-Integration | Integrierte Bereitstellungspipelinen in Fabric; Heraufstufung auf Arbeitsbereichsebene (Dev → Test → Production) und externe Repositoryintegration |
| Sicherheit | Verwaltete Identitäten, Key Vault-Integration, private Endpunkte | Gleiches Sicherheitsmodell plus Fabric Workspace RBAC; OneLake-Sicherheitsintegration |
| Pricing | Nutzungsbasierte Azure-Abrechnung nach dem Pay-as-you-go-Prinzip (pro Aktivitätsausführung, Datenverschiebung und Rechenleistung) | Kapazitätsbasierte Abrechnung (Fabric F-SKU) ohne Gebühren für externe Aktivitäten oder Pipeline-Aktivitäten, Gebühren fallen nur für Aktivitätsausführungen und die Bewegung von Pipelinedaten an. |
Aktivitätsvergleich
Mit Data Factory in Microsoft Fabric behalten wir weiterhin ein hohes Maß an Kontinuität mit Azure Data Factory bei. Ungefähr 90% von Aktivitäten, auf die in ADF zugegriffen werden kann, sind bereits unter Data Factory in Fabric verfügbar. Nachfolgend finden Sie eine Übersicht über die Aktivitäten und deren Verfügbarkeit in ADF und Data Factory in Fabric:
| Aktivität | ADF | Data Factory in Fabric |
|---|---|---|
| ADX/KQL | Y | Y |
| Variable anfügen | Y | Y |
| Azure Batch | Y | Y |
| Azure Databricks | Notizbuchaktivität • Jar-Aktivität • Python-Aktivität • Job-Aktivität | Azure Databricks-Aktivität |
| Azure Machine Learning | Y | Y |
| Batchausführung von Azure Machine Learning | Deprecated | N/A |
| Azure Machine Learning Update-Ressource | Deprecated | N/A |
| Kopieren | Kopieren von Daten | Kopieraktivität |
| Dataflow Gen2 | N/A | Y |
| Löschen | Y | Y |
| Ausführen/Aufrufen Pipeline | Pipeline ausführen | Pipeline aufrufen |
| Fabric-Notizbücher | N/A | Y |
| Fehler | Y | Y |
| Filter | Y | Y |
| Für jede(n) | Y | Y |
| Funktionen | Azure-Funktion | Funktionsaktivität |
| Metadaten abrufen | Y | Y |
| HDInsight | Hive-Aktivität • Schweineaktivität • MapReduce-Aktivität • Spark-Aktivität • Streaming-Aktivität | HDInsight-Aktivität |
| Wenn-Bedingung | Y | Y |
| Suche | Y | Y |
| Zuordnungsdatenfluss | Y | Dataflow Gen2 |
| Office 365 Outlook | N/A | Y |
| Power Query (nur ADF – Wrangling-Datenfluss) | Deprecated | N/A |
| Skript | Y | Y |
| Aktualisierung des semantischen Modells | N/A | Y |
| Variable festlegen | Y | Y |
| Sproc | Y | Y |
| SSIS | Y | N/A |
| Gespeicherte Prozedur | Y | Y |
| Schalter | Y | Y |
| Synapse-Notizbuch- und SJD-Aktivitäten | Y | N/A |
| Mannschaften | N/A | Y |
| Until | Y | Y |
| Validation | Y | Abrufen von Metadaten und Wenn-Bedingung |
| Wait | Y | Y |
| das Internet | Y | Y |
| Webhook | Y | Y |
| Datenfluss wrangieren | Y | Dataflow Gen2 |
Neue Aktivitäten in Fabric Data Factory
Zusätzlich zur Aufrechterhaltung der Aktivitätskontinuität führt Data Factory in Fabric einige neue Aktivitäten ein, um Ihre umfangreicheren Orchestrierungsanforderungen zu erfüllen. Diese neuen Aktivitäten sind:
- Outlook: In Fabric Data Factory verfügbar, um die Integration in Outlook-Dienste zu erleichtern.
- Teams: Verfügbar in Fabric Data Factory, um die Orchestrierung von Microsoft Teams-Aktivitäten zu ermöglichen.
- Aktualisierung des semantischen Modells: Verfügbar in Fabric Data Factory, um die Aktualisierungsfunktionen des Power BI-Semantikmodells zu verbessern.
- Dataflow Gen2: Verfügbar in Fabric Data Factory, um die Daten-Orchestrierung mit erweiterten Dataflow-Funktionen zu ermöglichen.
Eine Liste aller verfügbaren Fabric Data Factory-Aktivitäten finden Sie in der Aktivitätsübersicht.
Verbindervergleich
Einen Vergleich aller Connectors und deren Verfügbarkeit in Azure Data Factory und Fabric Data Factory finden Sie im Connector-Vergleichsartikel.
Self-hosted Integration Runtime (SHIR) vs. On-premises Data Gateway (OPDG)
Hinweis
Die von SHIR und ODPG unterstützten Dienste unterscheiden sich:
- Self-hosted Integration Runtime (SHIR): Unterstützt Azure Data Factory, Azure Synapse Analytics, Azure Machine Learning Studio und Azure Purview.
- On-premises Data Gateway (OPDG): Unterstützt Power BI, Power Apps, Power Automate, Azure Analysis Services, Logic Apps, Fabric Dataflow Gen2, Fabric Pipeline, Fabric Copy Job und Fabric Mirroring.
| Kategorie | Selbstgehostete Integrationslaufzeit (SHIR) | Vor-Ort-Datengateway (OPDG) |
|---|---|---|
| Unterstützte Dienste | – Azure Data Factory – Azure Machine Learning Studio – Azure Synapse Analytics – Azure Purview |
Power BI – Power Apps – Power Automate – Azure Analysis Services - Logik-Apps - Fabric Dataflow Gen2 - Fabric-Pipeline - Fabric-Kopieauftrag - Fabric-Spiegelung |
| Installation und Registrierung | - Registriert nach Schlüssel - Wird im Dienstmodus ausgeführt |
– Registriert mit dem Microsoft Entra ID-Konto - Unterstützt den Benutzermodus |
| Plattform | – Windows - Container-Image wird unterstützt |
– Nur Windows - Keine Containerunterstützung |
| Proxyunterstützung | – Unterstützung sowohl des Systems als auch des benutzerdefinierten Proxys | - Unterstützung eines benutzerdefinierten Proxys |
| Regionsbindung | - Problem mit der Data Factory-Region behoben - Standardbereich kann nicht geändert werden |
- Region kann geändert werden |
| Benutzerdefiniertes Relay | – Nicht unterstützt | -Abgestützt; Kunden können ihr eigenes Relay mitbringen |
| Gemeinsame Nutzung über Dienste hinweg | - Geteilt mit bis zu 120 Datenfabriken – Kann nicht für ADF-, Synapse-, Purview- oder andere Synapse-Arbeitsbereiche freigegeben werden. |
– Verfügbar für alle unterstützten Dienste innerhalb eines Mandanten |
| Hohe Verfügbarkeit (HA) | - Bis zu 8 Knoten (4 Standard) | - Bis zu 10 Knoten |
| Recovery | - Erfordert Neuinstallation | – Wiederherstellungsschlüssel unterstützt |
| Lastenausgleich | – Lastenausgleich auf Aufgabenebene basierend auf der Anzahl verfügbarer Prozessoren (CPU und Speicher) | - Lastenausgleich auf Abfrageebene - Roundrobin- oder Zufallsverteilungsoptionen |
| Anmeldedatenbank | – Lokal auf SHIR-Knoten gespeichert – Azure Key Vault unterstützt |
– Zentral im Gateway-Clouddienst gespeichert - Keine Key Vault-Integration |
| Automatische Aktualisierung | -Abgestützt | – Nicht unterstützt |
| Verbindererweiterung | – Nicht unterstützt | -Abgestützt |
| Interaktive Dokumenterstellung | -Abgestützt | -Abgestützt |
| Private Verknüpfung für den Steuerungsfluss | -Abgestützt | – Nicht unterstützt |
| Versionsverwaltung | - Zwei Versionen pro Monat; ein Push als AutoUpdate - Unterstützt die letzten 12 Monate von Veröffentlichungen |
- Eine Veröffentlichung pro Monat - Unterstützt die letzten 6 Versionen |
| CPU- und Speicherdrosselung | – Nicht unterstützt | -Abgestützt |
| Durchsatzgrenzwerte | - Keine harte Grenze; abhängig von der Netzwerkbandbreite | Dienstspezifische Grenzwerte: Power Apps / Power Automate / Logic Apps: - Schreibzugriff: 2-MB Nutzlastlimit - Lesezugriff: 2-MB Anforderungsgrenze, 8 MB komprimierte Antwortgrenze - URL-Grenzwert für GET-Anforderung: 2.048 Zeichen Power BI Direct Query: 16-MB unkomprimierte Antwortbeschränkung |
ADF Managed Virtual Network vs. Fabric Virtual Network Data Gateway
Azure Data Factory (ADF) Managed Virtual Network und Microsoft Fabric Virtual Network (virtual network) Data Gateway helfen Ihnen, eine sichere Verbindung mit Datenquellen herzustellen, ohne sie dem öffentlichen Internet verfügbar zu machen. Beide Optionen unterstützen zwar private Konnektivität für Cloudworkloads, unterscheiden sich jedoch darin, wie sie eingerichtet werden, wer sie verwaltet und welche Dienste sie unterstützen.
Verwaltetes ADF-VNET
Microsoft besitzt und verwaltet die Netzwerkumgebung. Sie erhalten ein einfaches Setup, aber Sie können die Netzwerkeinstellungen oder Firewallregeln nicht steuern.Fabric VNET-Datengateway
Sie stellen das Gateway in Ihrem eigenen virtuellen Azure-Netzwerk bereit. Dadurch erhalten Sie vollständige Kontrolle über Netzwerk, Firewall und Skalierung. Sie entscheiden, wie das Gateway eine Verbindung mit Ihren Ressourcen herstellt und alle Netzwerkeinstellungen verwaltet.
Verwenden Sie die nachstehende Tabelle, um die wichtigsten Unterschiede zu vergleichen und die Option auszuwählen, die Ihren Workload- und Governanceanforderungen entspricht.
| Kategorie | Von ADF verwaltetes virtuelles Netzwerk | Fabric Virtual Network Data Gateway |
|---|---|---|
| Unterstützte Dienste | Azure Data Factory & Synapse-Pipelines. | Microsoft Fabric Dataflow Gen2, Fabric-Datenpipelines, Fabric Copy Job, Fabric Mirroring, Power BI-Semantikmodelle und Power BI-Berichte im Seitenlayout |
| VNET-Besitz | Von Microsoft verwaltetes virtuelles Netzwerk (Der Kunde kontrolliert das Netzwerk nicht). | Vom Kunden verwaltetes virtuelles Netzwerk (Kunde hat Vollzugriff). |
| Private Endpunkte | Automatisch erstellt und verwaltet von ADF für unterstützte Dienste (Azure Storage, SQL DB usw.). | Kunden konfigurieren virtuelles Netzwerkgateway, um Fabric-Workloads mit Ressourcen innerhalb ihres virtuellen Netzwerks zu verbinden. |
| Netzwerksteuerung | Eingeschränkt – Kunden können nur die Laufzeit der Integration virtueller Netzwerke für private Endpunkte zulassen. | Vollzugriff – Der Kunde konfiguriert Firewall, NSG-Regeln, Routing in einem eigenen virtuellen Netzwerk. |
| Installation/Bereitstellung | Keine Installation erforderlich; vollständig von Microsoft in einem verborgenen virtuellen Netzwerk verwaltet. | Erfordert die Bereitstellung des virtuellen Netzwerkdatengateways im virtuellen Netzwerk des Kunden. |
| Hohe Verfügbarkeit | Von Microsoft verwaltetes, innerhalb des virtuellen Netzwerks der ADF automatisch skaliertes System. Wechseln Sie zum Reservemodus, wenn Sie TTL aktivieren. | Unterstützt Skalierung und HA (knotenbasierte Cluster), wird jedoch innerhalb des vom Kunden verwalteten virtuellen Netzwerks ausgeführt. Unterstützt bis zu 7 Knoten. |
Wichtige Features von Fabric Data Factory
In Fabric Data Factory ist das Erstellen Ihrer Pipelines, Datenflüsse und anderer Data Factory-Elemente aufgrund der nahtlosen Integration der bahnbrechenden KI-Features von Microsoft unglaublich einfach und schnell. Mit Copilot für Data Factory können Sie ihre Datenintegrationsprojekte ganz einfach mit natürlicher Sprache definieren.
Native Lakehouse- und Data Warehouse-Integration
Einer der größten Vorteile von Fabric Data Factory ist die Verbindung mit Ihren Datenplattformen. Lakehouse und Data Warehouse funktionieren sowohl als Quellen als auch Ziele in Ihren Pipelines, wodurch es einfach ist, integrierte Datenprojekte zu erstellen.
Intelligente E-Mail-Benachrichtigungen mit Office 365
Müssen Sie Ihr Team auf dem Laufenden halten? Mit der Office 365 Outlook-Aktivität können Sie angepasste E-Mail-Benachrichtigungen zu Pipelineausführungen, Aktivitätsstatus und Ergebnissen senden – alles mit einfacher Konfiguration. Es ist nicht mehr nötig, Dashboards ständig zu überprüfen oder benutzerdefinierten Benachrichtigungscode zu schreiben.
Optimiertes Erlebnis der Datenverbindung
Die moderne Benutzeroberfläche zum Abrufen von Daten von Fabric erleichtert das Einrichten von Kopierpipelines und das Erstellen neuer Verbindungen. Sie verbringen weniger Zeit mit der Konfiguration und mehr Zeit damit, Ihre Daten dorthin zu bringen, wo sie benötigt werden.
Verbesserungen bei der benutzerfreundlichen Nutzung von CI/CD
In Fabric ist die CI/CD-Erfahrung viel einfacher und flexibler als in Azure Data Factory oder Synapse. Es gibt keine Verbindung zwischen CI/CD- und ARM-Vorlagen in Fabric, wodurch es super einfach ist, einzelne Teile Ihres Fabric-Arbeitsbereichs für Einchecken, Auschecken, Validierung und Zusammenarbeit zu auswählen. In ADF und Synapse besteht Ihre einzige Option für CI/CD darin, Ihr eigenes Git-Repository zu verwenden. In Fabric können Sie jedoch das integrierte Bereitstellungspipeline-Feature optional verwenden, das nicht erfordert, ein eigenes externes Git-Repository mitzubringen.
Überwachung und Einblicke auf nächster Ebene
Die Überwachungserfahrung in Fabric Data Factory ist der Ort, an dem Sie den Unterschied wirklich sehen. Der Monitoring Hub bietet Ihnen eine vollständige Übersicht über alle Ihre Workloads, und Sie können einen Drilldown zu jeder Aktivität durchführen, um detaillierte Einblicke zu erhalten. Die Arbeitsbereichsübergreifende Analyse ist direkt integriert, sodass Sie das Gesamtbild in Ihrer gesamten Organisation sehen können.
Bei der Fehlerbehebung von Kopieraktivitäten werden Sie von der detaillierten Aufschlüsselungsansicht begeistert sein. Wählen Sie die Schaltfläche "Ausführungsdetails" (das Brillensymbol) aus, um genau zu sehen, was passiert ist. Die Aufschlüsselung "Dauer" zeigt Ihnen, wie lange jede Phase dauerte, wodurch die Leistungsoptimierung vereinfacht wird.
Schnelle Pipeline-Duplizierung
Müssen Sie eine ähnliche Pipeline erstellen? Mit dem Feature Speichern unter können Sie vorhandene Pipelines in Sekunden duplizieren. Es eignet sich perfekt zum Erstellen von Entwicklungsversionen, Zum Testen von Variationen oder zum Einrichten ähnlicher Workflows.
Verwandte Inhalte
Weitere Informationen finden Sie in den folgenden Ressourcen: