Udostępnij przez


Pozyskiwanie danych do magazynu przy użyciu potoków

Dotyczy:✅ Magazyn w Microsoft Fabric

Z tego artykułu dowiesz się, jak używać działania Zadania kopiowania w potokach usługi Data Factory.

  • Potoki oferują alternatywę dla używania polecenia COPY za pomocą graficznego interfejsu użytkownika.
  • Pipeline to logiczne grupowanie działań, które razem wykonują zadanie przetwarzania danych.
  • Potoki umożliwiają zarządzanie wszystkimi działaniami ETL (wyodrębnianie, przekształcanie i ładowanie) w jednym miejscu, zamiast zarządzać każdym z nich osobno.

Uwaga

Niektóre funkcje usługi Azure Data Factory nie są dostępne w usłudze Microsoft Fabric. Jednak koncepcje są wymienne. Więcej informacji na temat usługi Azure Data Factory i potoków można uzyskać w temacie Pipelines and activities in Azure Data Factory and Azure Synapse Analytics (Potoki i działania w usługach Azure Data Factory i Azure Synapse Analytics). Zobacz Szybki start: tworzenie pierwszego potoku w celu skopiowania danych.

Utwórz zadanie kopiowania

Aby utworzyć nowe zadanie kopiowania, wykonaj następujące kroki.

  1. Na ekranie głównym obszaru roboczego wybierz przycisk + Nowy element . W sekcji Pobieranie danych wybierz pozycję Kopiuj zadanie.

  2. W oknie dialogowym Nowe zadanie kopiowania wprowadź nazwę nowego potoku i wybierz pozycję Utwórz. Zostanie otwarte nowe okno Zadanie kopiowania .

  3. Wybierz źródło danych z katalogu OneLake.

  4. Na stronie Wybieranie danych wyświetl podgląd wybranego zestawu danych. Po przejrzeniu danych wybierz pozycję Dalej.

  5. Na stronie Wybieranie miejsca docelowego danych wybierz żądany magazyn w katalogu OneLake.

  6. Strona Wybieranie trybu zadania kopiowania umożliwia skonfigurowanie sposobu kopiowania danych: pełnej kopii lub przyrostowych kopii, które wykonują tylko kolejne kopie po zmianie danych źródłowych.

    Na razie wybierz pozycję Pełna kopia. W przypadku innych źródeł danych i scenariuszy można przyrostowo ładować dane w miarę aktualizowania źródła danych.

  7. Tabele docelowe można dostosować przy użyciu nazwy żądanego schematu docelowego i nazwy tabeli. Podaj nazwy schematów i tabel zgodne z żądaną konwencją nazewnictwa. Po zakończeniu wprowadzania zmian wybierz pozycję Dalej.

    Zrzut ekranu przedstawiający stronę Mapa do miejsca docelowego okna zadania kopiowania. Miejsce docelowe to dbo.NYC_taxi.

  8. Opcjonalnie, aby zmodyfikować mapowania kolumn, wybierz pozycję Edytuj mapowanie kolumn. Nazwy kolumn źródłowych można mapować na nowe nazwy, typy danych lub pomijać kolumny kolumn źródłowych.

    Zrzut ekranu przedstawiający opcje ładowania danych do istniejącej tabeli lub utworzenia nowego.

    Po zakończeniu przeglądania mapowań kolumn wybierz pozycję Dalej.

  9. Strona Przeglądanie i zapisywanie jest podsumowaniem nowego zadania kopiowania.

    Przejrzyj podsumowanie i opcje, a następnie wybierz pozycję Zapisz i uruchom.

  10. Zostajesz przekierowany do obszaru graficznego potoku, gdzie nowa aktywność zadania kopiowania z Źródłem i Miejscem docelowym jest już skonfigurowana dla Ciebie. W przypadku wybrania opcji Rozpocznij transfer danych natychmiast na poprzedniej stronie zadanie kopiowania zostanie uruchomione natychmiast, gdy będzie gotowe do uruchomienia.

  11. Stan pipeline'u można monitorować w okienku Wyniki.

  12. Po kilku sekundach potok zakończy się pomyślnie. Po powrocie do magazynu możesz wybrać tabelę, aby wyświetlić podgląd danych i potwierdzić zakończenie operacji kopiowania.

Następny krok

Opcje pozyskiwania danych

Inne sposoby pozyskiwania danych do magazynu obejmują: