Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Usługa Data Factory w usłudze Microsoft Fabric to kolejna generacja usługi Azure Data Factory, utworzona w celu obsługi najbardziej złożonych wyzwań związanych z integracją danych przy użyciu prostszego, bardziej zaawansowanego podejścia.
Ten przewodnik pomaga zrozumieć kluczowe różnice między tymi dwoma usługami, dzięki czemu możesz dokonać odpowiedniego wyboru dla przedsiębiorstwa. Omówimy nowości, różnice i zalety usługi Fabric.
Usługa Fabric Data Factory to kolejna generacja usługi Azure Data Factory zaprojektowana w celu uproszczenia i ulepszenia przepływów pracy integracji danych. W tej sekcji przedstawiono najważniejsze funkcje i zalety usługi Fabric Data Factory.
Chcesz zapoznać się z opcjami migracji? Zapoznaj się z naszym przewodnikiem migracji.
Porównaj funkcje obok siebie
Poniżej przedstawiono sposób stosu podstawowych funkcji między usługą Azure Data Factory i usługą Fabric Data Factory. Podkreśliliśmy, co się zmieniło, co nowego i co pozostaje takie same.
| Azure Data Factory | Fabryka danych w sieci szkieletowej | Co się różni |
|---|---|---|
| rurociąg | rurociąg | Lepsza integracja: Potoki w Fabric bezproblemowo współpracują z usługami Lakehouse, Data Warehouse i innymi usługami Fabric od razu po zainstalowaniu. Potoki sieci szkieletowej obejmują więcej działań opartych na modelu SaaS i różnią się definicjami JSON. Aby uzyskać więcej informacji, zobacz porównanie funkcji potoku . |
| Mapowanie przepływu danych | Przepływ danych Gen2 | Łatwiejsze w użyciu: przepływ danych Gen2 zapewnia prostsze środowisko tworzenia przekształceń. Cały czas dodajemy więcej funkcji przepływu danych mapowania do usługi Gen2. |
| Działania | Działania | Więcej działań wkrótce: Pracujemy nad przeniesieniem wszystkich Twoich ulubionych działań z usługi ADF do Fabric. Ponadto otrzymujesz nowe funkcje, takie jak działanie Office 365 Outlook, które nie jest dostępne w ADF. Zobacz nasze porównanie działań , aby uzyskać szczegółowe informacje. |
| Zestaw danych | Tylko połączenia | Prostsze podejście: Nie ma bardziej złożonych konfiguracji zestawów danych. W przypadku Data Factory w Fabric używaj połączeń do łączenia się ze źródłami danych i rozpoczęcia pracy. Fabric eliminuje zestawy danych, definiując właściwości danych bezpośrednio wewnątrz działań. |
| Połączona usługa | Połączenia | Bardziej intuicyjne: Połączenia działają jak połączone usługi, ale są łatwiejsze do skonfigurowania i zarządzania. |
| Wyzwalacze | Wyzwalacze zdarzeń harmonogramu i plików | Wbudowane planowanie: użyj harmonogramu Fabric i zdarzeń Reflex, aby automatycznie uruchamiać potoki. Wyzwalacze zdarzeń plików działają natywnie w Fabric bez dodatkowej konfiguracji. Fabric integruje wyzwalacze z frameworkiem Activator, w przeciwieństwie do autonomicznych wyzwalaczy usługi ADF. |
| Publikowanie | Zapisywanie i uruchamianie | Brak kroku publikowania: w usłudze Fabric całkowicie pomiń krok publikowania. Wystarczy wybrać pozycję Zapisz, aby zapisać pracę, lub wybrać pozycję Uruchom, aby zapisać i natychmiast wykonać potok. |
| Autoresolve i Azure Integration Runtime | Nie jest wymagany | Uproszczona architektura: nie trzeba zarządzać środowiskami Integration Runtime. "Fabric zarządza obliczeniami za ciebie." |
| Własne środowiska Integration Runtime | Lokalna brama danych | Ten sam dostęp lokalny: połącz się z danymi lokalnymi przy użyciu znanej lokalnej bramy danych. Dowiedz się więcej w naszym przewodniku po dostępie do danych lokalnych. |
| Środowiska Azure-SSIS Integration Runtime | Do ustalenia | Przyszłe możliwości w Fabric: nadal pracujemy nad projektem integracji SSIS w Fabric. |
| Zarządzane sieci wirtualne i prywatne punkty końcowe | Do ustalenia. | Przyszłe możliwości w Fabric: nadal pracujemy nad integracją z zarządzanymi sieciami wirtualnymi i prywatnymi punktami końcowymi w ramach Fabric. |
| Język wyrażeń | Język wyrażeń | Te same wyrażenia: istniejące wyrażenia bezpośrednio przenoszą wiedzę. Składnia jest prawie identyczna. |
| Typy uwierzytelniania | Rodzaje uwierzytelniania | Więcej opcji: Wszystkie popularne metody uwierzytelniania usługi ADF działają w Fabric, a także dodaliśmy nowe typy uwierzytelniania. |
| ciągła integracja/ciągłe wdrażanie | ciągła integracja/ciągłe wdrażanie | Ulepszone możliwości poza usługą ADF obejmują łatwe wybieranie elementów, podwyższanie poziomu poszczególnych elementów, włączanie repozytorium Git i wbudowane opcje ciągłej integracji/ciągłego wdrażania SaaS. |
| Eksportowanie/importowanie szablonu ARM | Zapisz jako | Szybkie duplikowanie: W Fabric użyj polecenia "Zapisz jako", aby szybko duplikować przepływy na potrzeby rozwoju lub testowania. |
| Monitorowanie | Centrum monitorowania i historia uruchamiania | Zaawansowane monitorowanie: Centrum monitorowania oferuje nowoczesne środowisko ze szczegółowymi informacjami między obszarami roboczymi i lepszymi możliwościami zagłębiania się w szczegóły. |
| Debugowanie | Tryb interaktywny | Uproszczone debugowanie: Fabric eliminuje tryb debugowania ADF. Zawsze jesteś w trybie interaktywnym. |
| Przechwytywanie zmian danych (CDC) | Zadania kopiowania | Przenoszenie danych przyrostowych: Fabric zarządza przyrostowym przenoszeniem danych za pośrednictwem zadań kopiowania zamiast artefaktów CDC. |
| Azure Synapse Link | Odwzorowywanie | Replikacja danych: sieć szkieletowa zastępuje usługę Azure Synapse Link funkcjami dublowania na potrzeby replikacji danych. |
| Wykonywanie działania potoku | Uruchom działanie potoku | Wywołanie międzyplatformowe: sieć szkieletowa zwiększa działanie Potok wykonywania usługi ADF za pomocą wywołania międzyplatformowego. |
Porównanie funkcji potoku
| Kategoria | Potoki ADF | Potoki sieci szkieletowej |
|---|---|---|
| Typ usługi | Usługa PaaS integracji danych | Usługa SaaS integracji danych |
| Środowisko do tworzenia treści | Azure portal (ADF Studio) | Platforma/obszar roboczy Power BI (ujednolicone środowisko użytkownika z Lakehouses, magazynami danych itp.) |
| Orkiestracja potoku | Potoki w pełni funkcjonalne z działaniami, wyzwalaczami, parametrami | Ten sam model orkiestracji, przemyślany na nowo dla interfejsu użytkownika Fabric. |
| Przenoszenie danych | Kopiowanie danych, mapowanie przepływów danych, obsługa lokalnego IR, zarządzana sieć wirtualna | Działanie kopiowania, przepływy danych Gen2, wbudowana łączność z OneLake i elementami Fabric, lokalna brama danych, brama sieci wirtualnej |
| Środowisko obliczeniowe/środowisko IR | Lokalnie hostowane, SSIS i Azure IR (do przenoszenia i przekształcania) | Połączenia w chmurze, lokalne i brama sieci wirtualnej |
| Przepływy danych | Azure Blob, Data Lake Storage, SQL, 100+ łączniki | Te same łączniki i natywna integracja OneLake, ściślejsza integracja obszaru roboczego Fabric |
| Monitorowanie | Potoki i przepływy danych w programie ADF Studio z przebiegami, wyzwalaczami, alertami | Monitorowanie Centrum Monitoringu i obszaru roboczego z ujednoliconymi widokami w różnych potokach, przepływach danych, notesach, bazach danych itp. |
| Wyzwalacze | Harmonogramy, okna przesuwne, wyzwalacze oparte na zdarzeniach | Harmonogramy, wyzwalacze zdarzeń, wyzwalacze okien przesuwnych jako harmonogramy interwałowe |
| ciągła integracja/ciągłe wdrażanie | Szablony usługi ARM i integracja z usługą Azure DevOps lub repozytorium GitHub | Wbudowane potoki wdrażania w Fabric; promocja na poziomie obszaru roboczego (Deweloperskie → Test → Produkcja) i integracja zewnętrznego repozytorium |
| Zabezpieczenia | Tożsamości zarządzane, integracja z Key Vault, prywatne punkty końcowe | Ten sam model zabezpieczeń plus RBAC w obszarze roboczym Fabric; Integracja zabezpieczeń z OneLake |
| Pricing | Płatność zgodnie z rzeczywistym poziomem wykorzystania na platformie Azure (na podstawie uruchamiania działań, przenoszenia danych i mocy obliczeniowej) | Jednostka SKU oparta na pojemności (Fabric F SKU) bez opłat za działania zewnętrzne lub aktywności związane z potokami, jedynie za uruchomienia działań i przenoszenie danych w potokach. |
Porównanie działań
Dzięki usłudze Data Factory w usłudze Microsoft Fabric nadal utrzymujemy wysoki stopień ciągłości pracy z usługą Azure Data Factory. Około 90% działań dostępnych w usłudze ADF jest już dostępnych w Data Factory w Fabric. Poniżej przedstawiono podział działań i ich dostępność w usługach ADF i Data Factory w Fabric.
| Activity | ADF | Fabryka danych w sieci szkieletowej |
|---|---|---|
| ADX/KQL | Y | Y |
| Dołącz zmienną | Y | Y |
| Azure Batch | Y | Y |
| Azure Databricks | Działanie notebooka • Uruchomienie JAR-a • Działanie Pythona • Proces zadania | Działanie usługi Azure Databricks |
| Azure Machine Learning | Y | Y |
| Wykonywanie wsadowe w usłudze Azure Machine Learning | Deprecated | N/A |
| Zasób aktualizacji usługi Azure Machine Learning | Deprecated | N/A |
| Kopiuj | Kopiowanie danych | działanie Kopiuj |
| Przepływ danych Gen2 | N/A | Y |
| Usuń | Y | Y |
| Uruchomienie/Wywołanie Pipeline'u | Wykonywanie pipeline | Wywołaj potok |
| Notesy sieci szkieletowej | N/A | Y |
| Fail | Y | Y |
| Filter | Y | Y |
| Dla każdego | Y | Y |
| Functions | Funkcja platformy Azure | Działanie funkcji |
| Pobieranie metadanych | Y | Y |
| HDInsight | Aktywność Hive • Aktywność Pig • Aktywność MapReduce • Aktywność Spark • Aktywność przesyłania strumieniowego | Działanie usługi HDInsight |
| Instrukcja warunkowa if | Y | Y |
| Szukaj | Y | Y |
| Przepływ mapowania danych | Y | Przepływ danych Gen2 |
| Office 365 Outlook | N/A | Y |
| Power Query (tylko usługa ADF — uzdatnianie przepływu danych) | Deprecated | N/A |
| Skrypt | Y | Y |
| Odświeżenie modelu semantycznego | N/A | Y |
| Ustaw zmienną | Y | Y |
| Sproc | Y | Y |
| SSIS | Y | N/A |
| procedura składowana | Y | Y |
| Przełącznik | Y | Y |
| Działania Synapse Notebook i SJD | Y | N/A |
| Zespoły | N/A | Y |
| Aż do | Y | Y |
| Validation | Y | Pobieranie metadanych i konstrukcja if |
| Wait | Y | Y |
| sieć Web | Y | Y |
| Webhook | Y | Y |
| Zarządzanie przepływem danych | Y | Przepływ danych Gen2 |
Nowe działania w usłudze Fabric Data Factory
Oprócz utrzymania ciągłości działania, Data Factory w Fabric wprowadza nowe działania, aby sprostać bardziej rozbudowanym potrzebom orkiestracji. Te nowe działania to:
- Outlook: dostępna w usłudze Fabric Data Factory w celu ułatwienia integracji z usługami Outlook.
- Zespoły: dostępne w usłudze Fabric Data Factory w celu umożliwienia orkiestracji działań usługi Microsoft Teams.
- Odświeżanie modelu semantycznego: dostępne w usłudze Fabric Data Factory, aby zwiększyć możliwości odświeżania modelu semantycznego usługi Power BI.
- Dataflow Gen2: dostępna w usłudze Fabric Data Factory w celu umożliwienia orkiestracji danych dzięki zaawansowanym funkcjom przepływu danych.
Aby uzyskać listę wszystkich dostępnych działań usługi Fabric Data Factory, zobacz Omówienie działania.
Porównanie łączników
Porównanie wszystkich łączników i ich dostępności w usługach Azure Data Factory i Fabric Data Factory można znaleźć w artykule Porównanie łączników.
Self-hosted Integration Runtime (SHIR) a lokalna brama danych (OPDG)
Uwaga / Notatka
Usługi obsługiwane przez SHIR i ODPG są różne:
- Self-hosted Integration Runtime (SHIR): obsługuje usługi Azure Data Factory, Azure Synapse Analytics, Azure Machine Learning Studio i Azure Purview.
- Lokalna brama danych (OPDG): obsługuje usługę Power BI, usługę Power Apps, usługę Power Automate, usługę Azure Analysis Services, usługę Logic Apps, przepływ danych Fabric Gen2, potok Fabric, zadanie kopiowania Fabric i odbicie Fabric.
| Kategoria | Samodzielnie hostowane środowisko uruchomieniowe integracji (Self-hosted Integration Runtime, SHIR) | Lokalna brama danych (OPDG) |
|---|---|---|
| Obsługiwane usługi | — Azure Data Factory — Azure Machine Learning Studio — Azure Synapse Analytics — Azure Purview |
— Power BI — Power Apps — Power Automate — Azure Analysis Services - Logic Apps - Przepływ danych Fabric Gen2 — Potok sieci szkieletowej - Zadanie kopiowania sieci szkieletowej - Dublowanie Fabric w sieci |
| Instalacja i rejestracja | - Zarejestrowane z użyciem klucza - Działa w trybie usługi |
— Zarejestrowane przy użyciu konta Microsoft Entra ID - Obsługuje tryb użytkownika |
| Platform | -Windows — Obsługiwany obraz kontenera |
— Tylko system Windows — Brak obsługi kontenerów |
| Obsługa serwera proxy | — Obsługa zarówno systemu, jak i niestandardowego serwera proxy | - Obsługa niestandardowego serwera proxy |
| Powiązanie regionu | Poprawiono z przypisaniem do regionu usługi Data Factory — Nie można zmienić regionu domyślnego |
- Region można zmienić |
| Przekaźnik niestandardowy | - Nie obsługiwane | - Obsługiwane; klienci mogą przywieźć swój własny przekaźnik |
| Udostępnianie między usługami | — Udostępnione maksymalnie 120 fabrykom danych — Nie można udostępniać ich w obszarach roboczych usług ADF, Synapse, Purview lub Synapse |
— Dostępne dla wszystkich obsługiwanych usług w ramach klienta |
| Wysoka dostępność (HA) | - Do 8 węzłów (domyślnie 4) | - Maksymalnie 10 węzłów |
| Recovery | — Wymaga ponownej instalacji | — Obsługiwany klucz odzyskiwania |
| Równoważenie obciążenia | - Równoważenie obciążenia na poziomie zadania na podstawie dostępnej liczby pracowników (procesor i pamięć) | - Równoważenie obciążenia na poziomie zapytania - Opcje działania okrężnego lub dystrybucji losowej |
| Magazyn poświadczeń | - Przechowywane lokalnie w węzłach SHIR — Obsługiwana usługa Azure Key Vault |
Centralnie przechowywane w usłudze chmury Gateway — Brak integracji z usługą Key Vault |
| Automatyczna aktualizacja | - Obsługiwane | - Nie obsługiwane |
| Rozszerzalność łącznika | - Nie obsługiwane | - Obsługiwane |
| Tworzenie interakcyjne | - Obsługiwane | - Obsługiwane |
| Usługa Private Link dla przepływu sterowania | - Obsługiwane | - Nie obsługiwane |
| Wersjonowanie | - Dwie wersje miesięcznie; jedna dostarczana jako autoaktualizacja — Obsługuje ostatnie 12 miesięcy wydań |
- Jedna wersja miesięcznie - Obsługuje ostatnie 6 wydań |
| Ograniczanie wydajności procesora i pamięci | - Nie obsługiwane | - Obsługiwane |
| Limity przepływności | - Brak twardego limitu; zależne od przepustowości sieci | Limity specyficzne dla usługi: Power Apps / Power Automate / Logic Apps: - Zapisz: limit ładunku 2 MB - Odczyt: limit żądań 2 MB, limit odpowiedzi skompresowanej 8 MB - Limit adresów URL żądania GET: 2048 znaków Zapytanie bezpośrednie usługi Power BI: limit odpowiedzi nieskompresowany 16 MB |
Zarządzana sieć wirtualna ADF a brama danych sieci wirtualnej Fabric
Usługa Azure Data Factory (ADF) zarządzana sieć wirtualna i brama danych usługi Microsoft Fabric Virtual Network (sieć wirtualna) ułatwiają bezpieczne łączenie się ze źródłami danych bez ujawniania ich publicznemu Internetowi. Chociaż obie opcje obsługują łączność prywatną dla obciążeń w chmurze, różnią się one sposobem ich konfigurowania, kto nimi zarządza i które usługi obsługują.
Zarządzana sieć wirtualna ADF
Firma Microsoft jest właścicielem środowiska sieciowego i zarządza nim. Uzyskasz prostą konfigurację, ale nie możesz kontrolować ustawień sieci ani reguł zapory.Brama danych Fabric VNET
Bramę należy wdrożyć w ramach własnej sieci wirtualnej platformy Azure. Zapewnia to pełną kontrolę nad siecią, zaporą i skalowaniem. Decydujesz, jak brama łączy się z Twoimi zasobami i zarządzasz wszystkimi ustawieniami sieci.
Skorzystaj z poniższej tabeli, aby porównać główne różnice i wybrać opcję pasującą do potrzeb związanych z obciążeniem i zarządzaniem.
| Kategoria | Zarządzana wirtualna sieć ADF | Brama danych sieci wirtualnej Fabric |
|---|---|---|
| Obsługiwane usługi | Potoki usługi Azure Data Factory i Synapse. | Przepływ danych usługi Microsoft Fabric Gen2, potoki danych Fabric, zadanie kopiowania Fabric, dublowanie Fabric, modele semantyczne usługi Power BI i raporty stronicowane usługi Power BI |
| Własność sieci wirtualnej | Zarządzana przez firmę Microsoft sieć wirtualna (klient nie kontroluje sieci). | Zarządzana przez klienta sieć wirtualna (klient ma pełną kontrolę). |
| Prywatne punkty końcowe | Automatycznie tworzone i zarządzane przez ADF dla obsługiwanych usług (Azure Storage, SQL DB itp.). | Klienci konfigurują bramę sieci wirtualnej, aby połączyć obciążenia Fabric z zasobami wewnątrz swojej sieci wirtualnej. |
| Kontrolka sieci | Ograniczone — klienci mogą zezwalać tylko na dodawanie środowiska Integration Runtime sieci wirtualnej do prywatnych punktów końcowych. | Pełna kontrola — klient konfiguruje zaporę, reguły grupy zabezpieczeń sieciowych, trasowanie we własnej sieci wirtualnej. |
| Instalacja/wdrożenie | Nie jest wymagana instalacja; w pełni zarządzana przez firmę Microsoft wewnątrz ukrytej sieci wirtualnej. | Wymaga wdrożenia bramy danych sieci wirtualnej w sieci wirtualnej klienta. |
| Wysoka dostępność | Zarządzane przez firmę Microsoft, automatycznie skalowane wewnątrz sieci wirtualnej usługi ADF. Przełącz na tryb zapasowy podczas włączania TTL. | Obsługuje skalowanie i wysoką dostępność (klastry oparte na węzłach), ale działa w sieci wirtualnej zarządzanej przez klienta. Obsługa maksymalnie 7 węzłów. |
Najważniejsze funkcje usługi Fabric Data Factory
W usłudze Fabric Data Factory tworzenie potoków, przepływów danych i innych elementów Data Factory jest niezwykle łatwe i szybkie dzięki bezpośredniej integracji z przełomową funkcją AI Co-Pilot firmy Microsoft. Dzięki aplikacji Copilot for Data Factory można łatwo definiować projekty integracji danych przy użyciu języka naturalnego.
Integracja z usługą Native Lakehouse i magazynem danych
Jedną z największych zalet usługi Fabric Data Factory jest sposób łączenia się z platformami danych. Usługa Lakehouse i Data Warehouse działają zarówno jako źródła, jak i miejsca docelowe w potokach, co ułatwia tworzenie zintegrowanych projektów danych.
Inteligentne powiadomienia e-mail z usługą Office 365
Czy chcesz, aby Twój zespół był na bieżąco? Działanie usługi Office 365 Outlook umożliwia wysyłanie dostosowanych powiadomień e-mail dotyczących przebiegów potoku, stanu działania i wyników — wszystko to z prostą konfiguracją. Nie ma więcej sprawdzania pulpitów nawigacyjnych stale ani pisania niestandardowego kodu powiadomień.
Usprawnione połączenie danych
Nowoczesna platforma Pobierz dane w Fabric umożliwia szybkie konfigurowanie potoków kopiowania i tworzenie nowych połączeń. Będziesz poświęcać mniej czasu na konfigurowanie i więcej czasu na przesyłanie danych do odpowiedniego miejsca.
Ulepszenia łatwości użycia w środowisku ciągłej integracji/ciągłego wdrażania
W sieci szkieletowej środowisko ciągłej integracji/ciągłego wdrażania jest znacznie łatwiejsze i bardziej elastyczne niż w usłudze Azure Data Factory lub Synapse. W usłudze Fabric nie ma połączenia między CI/CD a szablonami ARM, co pozwala na bardzo łatwe wybieranie poszczególnych części obszaru roboczego Fabric do zameldowania, wymeldowania, walidacji i współpracy. W usługach ADF i Synapse jedyną opcją ciągłej integracji/ciągłego wdrażania jest użycie własnego repozytorium Git. Jednak w usłudze Fabric możesz opcjonalnie użyć wbudowanej funkcji potoków wdrażania, która nie wymaga wprowadzenia własnego zewnętrznego repozytorium Git.
Monitorowanie i wnioski na wyższym poziomie
Środowisko monitorowania w usłudze Fabric Data Factory to miejsce, w którym naprawdę zobaczysz różnicę. Centrum monitorowania zapewnia pełny widok wszystkich obciążeń i możesz przejść do szczegółów dowolnego działania w celu uzyskania szczegółowych informacji. Analiza między obszarami roboczymi jest wbudowana, dzięki czemu można zobaczyć ogólny obraz w całej organizacji.
Podczas rozwiązywania problemów z działaniami kopiowania na pewno docenisz szczegółowy widok analizy. Wybierz przycisk Szczegóły przebiegu (ikona okularów), aby zobaczyć dokładnie, co się stało. Podział czasu trwania pokazuje, jak długo trwał każdy etap, co ułatwia optymalizację wydajności.
Szybkie duplikowanie przepływu danych
Potrzebujesz utworzyć podobny pipeline? Funkcja Zapisz jako umożliwia duplikowanie dowolnego istniejącego potoku w sekundach. Doskonale nadaje się do tworzenia wersji deweloperskich, testowania odmian lub konfigurowania podobnych przepływów pracy.
Treści powiązane
Aby uzyskać więcej informacji, zobacz następujące zasoby: