Udostępnij przez


Różnice między usługami Azure Data Factory i Fabric Data Factory

Usługa Data Factory w usłudze Microsoft Fabric to kolejna generacja usługi Azure Data Factory, utworzona w celu obsługi najbardziej złożonych wyzwań związanych z integracją danych przy użyciu prostszego, bardziej zaawansowanego podejścia.

Ten przewodnik pomaga zrozumieć kluczowe różnice między tymi dwoma usługami, dzięki czemu możesz dokonać odpowiedniego wyboru dla przedsiębiorstwa. Omówimy nowości, różnice i zalety usługi Fabric.

Usługa Fabric Data Factory to kolejna generacja usługi Azure Data Factory zaprojektowana w celu uproszczenia i ulepszenia przepływów pracy integracji danych. W tej sekcji przedstawiono najważniejsze funkcje i zalety usługi Fabric Data Factory.

Chcesz zapoznać się z opcjami migracji? Zapoznaj się z naszym przewodnikiem migracji.

Porównaj funkcje obok siebie

Poniżej przedstawiono sposób stosu podstawowych funkcji między usługą Azure Data Factory i usługą Fabric Data Factory. Podkreśliliśmy, co się zmieniło, co nowego i co pozostaje takie same.

Azure Data Factory Fabryka danych w sieci szkieletowej Co się różni
rurociąg rurociąg Lepsza integracja: Potoki w Fabric bezproblemowo współpracują z usługami Lakehouse, Data Warehouse i innymi usługami Fabric od razu po zainstalowaniu. Potoki sieci szkieletowej obejmują więcej działań opartych na modelu SaaS i różnią się definicjami JSON. Aby uzyskać więcej informacji, zobacz porównanie funkcji potoku .
Mapowanie przepływu danych Przepływ danych Gen2 Łatwiejsze w użyciu: przepływ danych Gen2 zapewnia prostsze środowisko tworzenia przekształceń. Cały czas dodajemy więcej funkcji przepływu danych mapowania do usługi Gen2.
Działania Działania Więcej działań wkrótce: Pracujemy nad przeniesieniem wszystkich Twoich ulubionych działań z usługi ADF do Fabric. Ponadto otrzymujesz nowe funkcje, takie jak działanie Office 365 Outlook, które nie jest dostępne w ADF. Zobacz nasze porównanie działań , aby uzyskać szczegółowe informacje.
Zestaw danych Tylko połączenia Prostsze podejście: Nie ma bardziej złożonych konfiguracji zestawów danych. W przypadku Data Factory w Fabric używaj połączeń do łączenia się ze źródłami danych i rozpoczęcia pracy. Fabric eliminuje zestawy danych, definiując właściwości danych bezpośrednio wewnątrz działań.
Połączona usługa Połączenia Bardziej intuicyjne: Połączenia działają jak połączone usługi, ale są łatwiejsze do skonfigurowania i zarządzania.
Wyzwalacze Wyzwalacze zdarzeń harmonogramu i plików Wbudowane planowanie: użyj harmonogramu Fabric i zdarzeń Reflex, aby automatycznie uruchamiać potoki. Wyzwalacze zdarzeń plików działają natywnie w Fabric bez dodatkowej konfiguracji. Fabric integruje wyzwalacze z frameworkiem Activator, w przeciwieństwie do autonomicznych wyzwalaczy usługi ADF.
Publikowanie Zapisywanie i uruchamianie Brak kroku publikowania: w usłudze Fabric całkowicie pomiń krok publikowania. Wystarczy wybrać pozycję Zapisz, aby zapisać pracę, lub wybrać pozycję Uruchom, aby zapisać i natychmiast wykonać potok.
Autoresolve i Azure Integration Runtime Nie jest wymagany Uproszczona architektura: nie trzeba zarządzać środowiskami Integration Runtime. "Fabric zarządza obliczeniami za ciebie."
Własne środowiska Integration Runtime Lokalna brama danych Ten sam dostęp lokalny: połącz się z danymi lokalnymi przy użyciu znanej lokalnej bramy danych. Dowiedz się więcej w naszym przewodniku po dostępie do danych lokalnych.
Środowiska Azure-SSIS Integration Runtime Do ustalenia Przyszłe możliwości w Fabric: nadal pracujemy nad projektem integracji SSIS w Fabric.
Zarządzane sieci wirtualne i prywatne punkty końcowe Do ustalenia. Przyszłe możliwości w Fabric: nadal pracujemy nad integracją z zarządzanymi sieciami wirtualnymi i prywatnymi punktami końcowymi w ramach Fabric.
Język wyrażeń Język wyrażeń Te same wyrażenia: istniejące wyrażenia bezpośrednio przenoszą wiedzę. Składnia jest prawie identyczna.
Typy uwierzytelniania Rodzaje uwierzytelniania Więcej opcji: Wszystkie popularne metody uwierzytelniania usługi ADF działają w Fabric, a także dodaliśmy nowe typy uwierzytelniania.
ciągła integracja/ciągłe wdrażanie ciągła integracja/ciągłe wdrażanie Ulepszone możliwości poza usługą ADF obejmują łatwe wybieranie elementów, podwyższanie poziomu poszczególnych elementów, włączanie repozytorium Git i wbudowane opcje ciągłej integracji/ciągłego wdrażania SaaS.
Eksportowanie/importowanie szablonu ARM Zapisz jako Szybkie duplikowanie: W Fabric użyj polecenia "Zapisz jako", aby szybko duplikować przepływy na potrzeby rozwoju lub testowania.
Monitorowanie Centrum monitorowania i historia uruchamiania Zaawansowane monitorowanie: Centrum monitorowania oferuje nowoczesne środowisko ze szczegółowymi informacjami między obszarami roboczymi i lepszymi możliwościami zagłębiania się w szczegóły.
Debugowanie Tryb interaktywny Uproszczone debugowanie: Fabric eliminuje tryb debugowania ADF. Zawsze jesteś w trybie interaktywnym.
Przechwytywanie zmian danych (CDC) Zadania kopiowania Przenoszenie danych przyrostowych: Fabric zarządza przyrostowym przenoszeniem danych za pośrednictwem zadań kopiowania zamiast artefaktów CDC.
Azure Synapse Link Odwzorowywanie Replikacja danych: sieć szkieletowa zastępuje usługę Azure Synapse Link funkcjami dublowania na potrzeby replikacji danych.
Wykonywanie działania potoku Uruchom działanie potoku Wywołanie międzyplatformowe: sieć szkieletowa zwiększa działanie Potok wykonywania usługi ADF za pomocą wywołania międzyplatformowego.

Porównanie funkcji potoku

Kategoria Potoki ADF Potoki sieci szkieletowej
Typ usługi Usługa PaaS integracji danych Usługa SaaS integracji danych
Środowisko do tworzenia treści Azure portal (ADF Studio) Platforma/obszar roboczy Power BI (ujednolicone środowisko użytkownika z Lakehouses, magazynami danych itp.)
Orkiestracja potoku Potoki w pełni funkcjonalne z działaniami, wyzwalaczami, parametrami Ten sam model orkiestracji, przemyślany na nowo dla interfejsu użytkownika Fabric.
Przenoszenie danych Kopiowanie danych, mapowanie przepływów danych, obsługa lokalnego IR, zarządzana sieć wirtualna Działanie kopiowania, przepływy danych Gen2, wbudowana łączność z OneLake i elementami Fabric, lokalna brama danych, brama sieci wirtualnej
Środowisko obliczeniowe/środowisko IR Lokalnie hostowane, SSIS i Azure IR (do przenoszenia i przekształcania) Połączenia w chmurze, lokalne i brama sieci wirtualnej
Przepływy danych Azure Blob, Data Lake Storage, SQL, 100+ łączniki Te same łączniki i natywna integracja OneLake, ściślejsza integracja obszaru roboczego Fabric
Monitorowanie Potoki i przepływy danych w programie ADF Studio z przebiegami, wyzwalaczami, alertami Monitorowanie Centrum Monitoringu i obszaru roboczego z ujednoliconymi widokami w różnych potokach, przepływach danych, notesach, bazach danych itp.
Wyzwalacze Harmonogramy, okna przesuwne, wyzwalacze oparte na zdarzeniach Harmonogramy, wyzwalacze zdarzeń, wyzwalacze okien przesuwnych jako harmonogramy interwałowe
ciągła integracja/ciągłe wdrażanie Szablony usługi ARM i integracja z usługą Azure DevOps lub repozytorium GitHub Wbudowane potoki wdrażania w Fabric; promocja na poziomie obszaru roboczego (Deweloperskie → Test → Produkcja) i integracja zewnętrznego repozytorium
Zabezpieczenia Tożsamości zarządzane, integracja z Key Vault, prywatne punkty końcowe Ten sam model zabezpieczeń plus RBAC w obszarze roboczym Fabric; Integracja zabezpieczeń z OneLake
Pricing Płatność zgodnie z rzeczywistym poziomem wykorzystania na platformie Azure (na podstawie uruchamiania działań, przenoszenia danych i mocy obliczeniowej) Jednostka SKU oparta na pojemności (Fabric F SKU) bez opłat za działania zewnętrzne lub aktywności związane z potokami, jedynie za uruchomienia działań i przenoszenie danych w potokach.

Porównanie działań

Dzięki usłudze Data Factory w usłudze Microsoft Fabric nadal utrzymujemy wysoki stopień ciągłości pracy z usługą Azure Data Factory. Około 90% działań dostępnych w usłudze ADF jest już dostępnych w Data Factory w Fabric. Poniżej przedstawiono podział działań i ich dostępność w usługach ADF i Data Factory w Fabric.

Activity ADF Fabryka danych w sieci szkieletowej
ADX/KQL Y Y
Dołącz zmienną Y Y
Azure Batch Y Y
Azure Databricks Działanie notebookaUruchomienie JAR-aDziałanie PythonaProces zadania Działanie usługi Azure Databricks
Azure Machine Learning Y Y
Wykonywanie wsadowe w usłudze Azure Machine Learning Deprecated N/A
Zasób aktualizacji usługi Azure Machine Learning Deprecated N/A
Kopiuj Kopiowanie danych działanie Kopiuj
Przepływ danych Gen2 N/A Y
Usuń Y Y
Uruchomienie/Wywołanie Pipeline'u Wykonywanie pipeline Wywołaj potok
Notesy sieci szkieletowej N/A Y
Fail Y Y
Filter Y Y
Dla każdego Y Y
Functions Funkcja platformy Azure Działanie funkcji
Pobieranie metadanych Y Y
HDInsight Aktywność HiveAktywność PigAktywność MapReduceAktywność SparkAktywność przesyłania strumieniowego Działanie usługi HDInsight
Instrukcja warunkowa if Y Y
Szukaj Y Y
Przepływ mapowania danych Y Przepływ danych Gen2
Office 365 Outlook N/A Y
Power Query (tylko usługa ADF — uzdatnianie przepływu danych) Deprecated N/A
Skrypt Y Y
Odświeżenie modelu semantycznego N/A Y
Ustaw zmienną Y Y
Sproc Y Y
SSIS Y N/A
procedura składowana Y Y
Przełącznik Y Y
Działania Synapse Notebook i SJD Y N/A
Zespoły N/A Y
Aż do Y Y
Validation Y Pobieranie metadanych i konstrukcja if
Wait Y Y
sieć Web Y Y
Webhook Y Y
Zarządzanie przepływem danych Y Przepływ danych Gen2

Nowe działania w usłudze Fabric Data Factory

Oprócz utrzymania ciągłości działania, Data Factory w Fabric wprowadza nowe działania, aby sprostać bardziej rozbudowanym potrzebom orkiestracji. Te nowe działania to:

  1. Outlook: dostępna w usłudze Fabric Data Factory w celu ułatwienia integracji z usługami Outlook.
  2. Zespoły: dostępne w usłudze Fabric Data Factory w celu umożliwienia orkiestracji działań usługi Microsoft Teams.
  3. Odświeżanie modelu semantycznego: dostępne w usłudze Fabric Data Factory, aby zwiększyć możliwości odświeżania modelu semantycznego usługi Power BI.
  4. Dataflow Gen2: dostępna w usłudze Fabric Data Factory w celu umożliwienia orkiestracji danych dzięki zaawansowanym funkcjom przepływu danych.

Aby uzyskać listę wszystkich dostępnych działań usługi Fabric Data Factory, zobacz Omówienie działania.

Porównanie łączników

Porównanie wszystkich łączników i ich dostępności w usługach Azure Data Factory i Fabric Data Factory można znaleźć w artykule Porównanie łączników.

Self-hosted Integration Runtime (SHIR) a lokalna brama danych (OPDG)

Uwaga / Notatka

Usługi obsługiwane przez SHIR i ODPG są różne:

  • Self-hosted Integration Runtime (SHIR): obsługuje usługi Azure Data Factory, Azure Synapse Analytics, Azure Machine Learning Studio i Azure Purview.
  • Lokalna brama danych (OPDG): obsługuje usługę Power BI, usługę Power Apps, usługę Power Automate, usługę Azure Analysis Services, usługę Logic Apps, przepływ danych Fabric Gen2, potok Fabric, zadanie kopiowania Fabric i odbicie Fabric.
Kategoria Samodzielnie hostowane środowisko uruchomieniowe integracji (Self-hosted Integration Runtime, SHIR) Lokalna brama danych (OPDG)
Obsługiwane usługi — Azure Data Factory
— Azure Machine Learning Studio
— Azure Synapse Analytics
— Azure Purview
— Power BI
— Power Apps
— Power Automate
— Azure Analysis Services
- Logic Apps
- Przepływ danych Fabric Gen2
— Potok sieci szkieletowej
- Zadanie kopiowania sieci szkieletowej
- Dublowanie Fabric w sieci
Instalacja i rejestracja - Zarejestrowane z użyciem klucza
- Działa w trybie usługi
— Zarejestrowane przy użyciu konta Microsoft Entra ID
- Obsługuje tryb użytkownika
Platform -Windows
— Obsługiwany obraz kontenera
— Tylko system Windows
— Brak obsługi kontenerów
Obsługa serwera proxy — Obsługa zarówno systemu, jak i niestandardowego serwera proxy - Obsługa niestandardowego serwera proxy
Powiązanie regionu Poprawiono z przypisaniem do regionu usługi Data Factory
— Nie można zmienić regionu domyślnego
- Region można zmienić
Przekaźnik niestandardowy - Nie obsługiwane - Obsługiwane; klienci mogą przywieźć swój własny przekaźnik
Udostępnianie między usługami — Udostępnione maksymalnie 120 fabrykom danych
— Nie można udostępniać ich w obszarach roboczych usług ADF, Synapse, Purview lub Synapse
— Dostępne dla wszystkich obsługiwanych usług w ramach klienta
Wysoka dostępność (HA) - Do 8 węzłów (domyślnie 4) - Maksymalnie 10 węzłów
Recovery — Wymaga ponownej instalacji — Obsługiwany klucz odzyskiwania
Równoważenie obciążenia - Równoważenie obciążenia na poziomie zadania na podstawie dostępnej liczby pracowników (procesor i pamięć) - Równoważenie obciążenia na poziomie zapytania
- Opcje działania okrężnego lub dystrybucji losowej
Magazyn poświadczeń - Przechowywane lokalnie w węzłach SHIR
— Obsługiwana usługa Azure Key Vault
Centralnie przechowywane w usłudze chmury Gateway
— Brak integracji z usługą Key Vault
Automatyczna aktualizacja - Obsługiwane - Nie obsługiwane
Rozszerzalność łącznika - Nie obsługiwane - Obsługiwane
Tworzenie interakcyjne - Obsługiwane - Obsługiwane
Usługa Private Link dla przepływu sterowania - Obsługiwane - Nie obsługiwane
Wersjonowanie - Dwie wersje miesięcznie; jedna dostarczana jako autoaktualizacja
— Obsługuje ostatnie 12 miesięcy wydań
- Jedna wersja miesięcznie
- Obsługuje ostatnie 6 wydań
Ograniczanie wydajności procesora i pamięci - Nie obsługiwane - Obsługiwane
Limity przepływności - Brak twardego limitu; zależne od przepustowości sieci Limity specyficzne dla usługi:
Power Apps / Power Automate / Logic Apps:
- Zapisz: limit ładunku 2 MB
- Odczyt: limit żądań 2 MB, limit odpowiedzi skompresowanej 8 MB
- Limit adresów URL żądania GET: 2048 znaków
Zapytanie bezpośrednie usługi Power BI: limit odpowiedzi nieskompresowany 16 MB

Zarządzana sieć wirtualna ADF a brama danych sieci wirtualnej Fabric

Usługa Azure Data Factory (ADF) zarządzana sieć wirtualna i brama danych usługi Microsoft Fabric Virtual Network (sieć wirtualna) ułatwiają bezpieczne łączenie się ze źródłami danych bez ujawniania ich publicznemu Internetowi. Chociaż obie opcje obsługują łączność prywatną dla obciążeń w chmurze, różnią się one sposobem ich konfigurowania, kto nimi zarządza i które usługi obsługują.

  • Zarządzana sieć wirtualna ADF
    Firma Microsoft jest właścicielem środowiska sieciowego i zarządza nim. Uzyskasz prostą konfigurację, ale nie możesz kontrolować ustawień sieci ani reguł zapory.

  • Brama danych Fabric VNET
    Bramę należy wdrożyć w ramach własnej sieci wirtualnej platformy Azure. Zapewnia to pełną kontrolę nad siecią, zaporą i skalowaniem. Decydujesz, jak brama łączy się z Twoimi zasobami i zarządzasz wszystkimi ustawieniami sieci.

Skorzystaj z poniższej tabeli, aby porównać główne różnice i wybrać opcję pasującą do potrzeb związanych z obciążeniem i zarządzaniem.

Kategoria Zarządzana wirtualna sieć ADF Brama danych sieci wirtualnej Fabric
Obsługiwane usługi Potoki usługi Azure Data Factory i Synapse. Przepływ danych usługi Microsoft Fabric Gen2, potoki danych Fabric, zadanie kopiowania Fabric, dublowanie Fabric, modele semantyczne usługi Power BI i raporty stronicowane usługi Power BI
Własność sieci wirtualnej Zarządzana przez firmę Microsoft sieć wirtualna (klient nie kontroluje sieci). Zarządzana przez klienta sieć wirtualna (klient ma pełną kontrolę).
Prywatne punkty końcowe Automatycznie tworzone i zarządzane przez ADF dla obsługiwanych usług (Azure Storage, SQL DB itp.). Klienci konfigurują bramę sieci wirtualnej, aby połączyć obciążenia Fabric z zasobami wewnątrz swojej sieci wirtualnej.
Kontrolka sieci Ograniczone — klienci mogą zezwalać tylko na dodawanie środowiska Integration Runtime sieci wirtualnej do prywatnych punktów końcowych. Pełna kontrola — klient konfiguruje zaporę, reguły grupy zabezpieczeń sieciowych, trasowanie we własnej sieci wirtualnej.
Instalacja/wdrożenie Nie jest wymagana instalacja; w pełni zarządzana przez firmę Microsoft wewnątrz ukrytej sieci wirtualnej. Wymaga wdrożenia bramy danych sieci wirtualnej w sieci wirtualnej klienta.
Wysoka dostępność Zarządzane przez firmę Microsoft, automatycznie skalowane wewnątrz sieci wirtualnej usługi ADF. Przełącz na tryb zapasowy podczas włączania TTL. Obsługuje skalowanie i wysoką dostępność (klastry oparte na węzłach), ale działa w sieci wirtualnej zarządzanej przez klienta. Obsługa maksymalnie 7 węzłów.

Najważniejsze funkcje usługi Fabric Data Factory

W usłudze Fabric Data Factory tworzenie potoków, przepływów danych i innych elementów Data Factory jest niezwykle łatwe i szybkie dzięki bezpośredniej integracji z przełomową funkcją AI Co-Pilot firmy Microsoft. Dzięki aplikacji Copilot for Data Factory można łatwo definiować projekty integracji danych przy użyciu języka naturalnego.

Integracja z usługą Native Lakehouse i magazynem danych

Jedną z największych zalet usługi Fabric Data Factory jest sposób łączenia się z platformami danych. Usługa Lakehouse i Data Warehouse działają zarówno jako źródła, jak i miejsca docelowe w potokach, co ułatwia tworzenie zintegrowanych projektów danych.

Zrzut ekranu przedstawiający kartę Źródła magazynu danych i lakehouse.

Zrzut ekranu przedstawiający kartę miejsca docelowego magazynu danych i lakehouse.

Inteligentne powiadomienia e-mail z usługą Office 365

Czy chcesz, aby Twój zespół był na bieżąco? Działanie usługi Office 365 Outlook umożliwia wysyłanie dostosowanych powiadomień e-mail dotyczących przebiegów potoku, stanu działania i wyników — wszystko to z prostą konfiguracją. Nie ma więcej sprawdzania pulpitów nawigacyjnych stale ani pisania niestandardowego kodu powiadomień.

Zrzut ekranu przedstawiający działanie usługi Office 365 Outlook.

Usprawnione połączenie danych

Nowoczesna platforma Pobierz dane w Fabric umożliwia szybkie konfigurowanie potoków kopiowania i tworzenie nowych połączeń. Będziesz poświęcać mniej czasu na konfigurowanie i więcej czasu na przesyłanie danych do odpowiedniego miejsca.

Zrzut ekranu przedstawiający nowoczesne i łatwe środowisko pobierania danych.

Zrzut ekranu przedstawiający sposób tworzenia nowego połączenia.

Ulepszenia łatwości użycia w środowisku ciągłej integracji/ciągłego wdrażania

W sieci szkieletowej środowisko ciągłej integracji/ciągłego wdrażania jest znacznie łatwiejsze i bardziej elastyczne niż w usłudze Azure Data Factory lub Synapse. W usłudze Fabric nie ma połączenia między CI/CD a szablonami ARM, co pozwala na bardzo łatwe wybieranie poszczególnych części obszaru roboczego Fabric do zameldowania, wymeldowania, walidacji i współpracy. W usługach ADF i Synapse jedyną opcją ciągłej integracji/ciągłego wdrażania jest użycie własnego repozytorium Git. Jednak w usłudze Fabric możesz opcjonalnie użyć wbudowanej funkcji potoków wdrażania, która nie wymaga wprowadzenia własnego zewnętrznego repozytorium Git.

Monitorowanie i wnioski na wyższym poziomie

Środowisko monitorowania w usłudze Fabric Data Factory to miejsce, w którym naprawdę zobaczysz różnicę. Centrum monitorowania zapewnia pełny widok wszystkich obciążeń i możesz przejść do szczegółów dowolnego działania w celu uzyskania szczegółowych informacji. Analiza między obszarami roboczymi jest wbudowana, dzięki czemu można zobaczyć ogólny obraz w całej organizacji.

Zrzut ekranu przedstawiający centrum monitorowania i elementy usługi Data Factory.

Podczas rozwiązywania problemów z działaniami kopiowania na pewno docenisz szczegółowy widok analizy. Wybierz przycisk Szczegóły przebiegu (ikona okularów), aby zobaczyć dokładnie, co się stało. Podział czasu trwania pokazuje, jak długo trwał każdy etap, co ułatwia optymalizację wydajności.

Zrzut ekranu przedstawiający wyniki monitorowania kopiowania potoku zawiera szczegółowe informacje o działaniu kopiowania.

Zrzut ekranu przedstawiający szczegóły kopiowania danych.

Szybkie duplikowanie przepływu danych

Potrzebujesz utworzyć podobny pipeline? Funkcja Zapisz jako umożliwia duplikowanie dowolnego istniejącego potoku w sekundach. Doskonale nadaje się do tworzenia wersji deweloperskich, testowania odmian lub konfigurowania podobnych przepływów pracy.

Zrzut ekranu przedstawiający zapisywanie w potoku sieci szkieletowej.

Aby uzyskać więcej informacji, zobacz następujące zasoby: