Udostępnij przez


Używanie przepływu danych w potoku

W tym samouczku utworzysz potok, aby przenieść dane OData ze źródła Northwind do miejsca docelowego Lakehouse i wysłać powiadomienie e-mail po zakończeniu potoku.

Wymagania wstępne

Aby rozpocząć pracę, należy spełnić następujące wymagania wstępne:

  • Upewnij się, że masz obszar roboczy z włączoną usługą Microsoft Fabric, który nie jest domyślnym obszarem Mój obszar roboczy.

Tworzenie usługi Lakehouse

Aby rozpocząć, musisz najpierw utworzyć jezioro. Lakehouse to usługa data lake, która jest zoptymalizowana pod kątem analizy. W tym samouczku utworzysz magazyn lakehouse, który jest używany jako miejsce docelowe dla przepływu danych.

  1. Przejdź do obszaru roboczego z obsługą sieci szkieletowej.

    Zrzut ekranu przedstawiający obszar roboczy z włączoną obsługą sieci szkieletowej, który został podkreślony.

  2. Wybierz pozycję Lakehouse w menu tworzenia.

    Zrzut ekranu przedstawiający menu tworzenia z wyróżnioną pozycją

  3. Wprowadź nazwę dla jeziora.

  4. Wybierz pozycję Utwórz.

Teraz utworzono magazyn lakehouse i możesz teraz skonfigurować przepływ danych.

Utwórz przepływ danych

Przepływ danych to transformacja danych wielokrotnego użytku, która może być używana w potoku. W tym samouczku utworzysz przepływ danych, który pobiera dane ze źródła OData i zapisuje dane w miejscu docelowym usługi Lakehouse.

  1. Przejdź do obszaru roboczego z obsługą sieci szkieletowej.

    Zrzut ekranu przedstawiający obszar roboczy z włączoną siecią szkieletową.

  2. Wybierz pozycję Dataflow Gen2 w menu tworzenia.

    Zrzut ekranu przedstawiający wybór przepływu danych Gen2 w nowym menu.

  3. Pozyskiwanie danych ze źródła OData.

    1. Wybierz pozycję Pobierz dane, a następnie wybierz pozycję Więcej.

      Zrzut ekranu przedstawiający menu Pobierz dane z wyróżnieniem Więcej.

    2. W obszarze Wybierz źródło danych wyszukaj pozycję OData, a następnie wybierz łącznik OData.

      Zrzut ekranu przedstawiający menu Pobierz dane z wyróżnieniem OData.

    3. Wprowadź adres URL źródła OData. Na potrzeby tego samouczka użyj przykładowej usługi OData.

    4. Wybierz Dalej.

    5. Wybierz jednostkę, którą chcesz pozyskać. W tym samouczku użyj jednostki Orders .

      Zrzut ekranu przedstawiający podgląd OData.

    6. Wybierz pozycję Utwórz.

Po pozyskaniu danych ze źródła OData możesz skonfigurować miejsce docelowe usługi Lakehouse.

Aby pozyskać dane do miejsca docelowego lakehouse:

  1. Wybierz pozycję Dodaj miejsce docelowe danych.

  2. Wybierz pozycję Lakehouse.

    Zrzut ekranu przedstawiający menu Dodaj miejsce docelowe danych wyjściowych z wyróżnieniem lakehouse.

  3. Skonfiguruj połączenie, którego chcesz użyć do nawiązania połączenia z usługą Lakehouse. Ustawienia domyślne są poprawne.

  4. Wybierz Dalej.

  5. Przejdź do obszaru roboczego, w którym utworzono magazyn lakehouse.

  6. Wybierz usługę Lakehouse utworzoną w poprzednich krokach.

    Zrzut ekranu przedstawiający wybrany jezioro.

  7. Potwierdź nazwę tabeli.

  8. Wybierz Dalej.

  9. Potwierdź metodę aktualizacji i wybierz pozycję Zapisz ustawienia.

    Zrzut ekranu przedstawiający metody aktualizacji z wybraną pozycją .

  10. Opublikuj przepływ danych.

    Ważne

    Po utworzeniu pierwszego przepływu danych Gen2 w obszarze roboczym elementy usługi Lakehouse i Warehouse są aprowizowane wraz z powiązanymi punktami końcowymi i semantycznymi modelami analizy SQL. Te elementy są współużytkowane przez wszystkie przepływy danych w obszarze roboczym i są wymagane, aby przepływ danych Gen2 działał, nie powinien być usuwany i nie jest przeznaczony do bezpośredniego użycia przez użytkowników. Elementy są szczegółami implementacji usługi Dataflow Gen2. Elementy nie są widoczne w obszarze roboczym, ale mogą być dostępne w innych środowiskach, takich jak notes, punkt końcowy SQL, usługa Lakehouse i magazyn. Elementy można rozpoznać według ich prefiksu w nazwie. Prefiks elementów to "Przepływy danychStaging".

Po wprowadzeniu danych do miejsca docelowego Lakehouse, możesz skonfigurować potok.

Stwórz potok

Pipeline to ciąg operacji, który może służyć do automatyzowania przetwarzania danych. W tym samouczku utworzysz potok, który uruchamia przepływ danych Gen2 utworzony w poprzedniej procedurze.

  1. Wróć do strony przeglądu obszaru roboczego i w menu tworzenia wybierz pozycję Potoki.

    Zrzut ekranu przedstawiający wybór pipeline'u.

  2. Podaj nazwę rury.

  3. Wybierz działanie Przepływ danych.

    Zrzut ekranu przedstawiający podkreślone działanie przepływu danych.

  4. Wybierz przepływ danych utworzony w poprzedniej procedurze na liście rozwijanej Przepływ danych w obszarze Ustawienia.

    Zrzut ekranu przedstawiający listę rozwijaną przepływu danych.

  5. Dodaj działanie usługi Office 365 Outlook.

    Zrzut ekranu przedstawiający sposób wybierania działania usługi Office 365 Outlook.

  6. Skonfiguruj działanie usługi Office 365 Outlook w celu wysyłania powiadomień e-mail.

    1. Uwierzytelnij się przy użyciu konta usługi Office 365.

    2. Wybierz adres e-mail, do którego chcesz wysłać powiadomienie.

    3. Wprowadź temat wiadomości e-mail.

    4. Wprowadź treść wiadomości e-mail.

      Zrzut ekranu przedstawiający ustawienia działania usługi Office 365 Outlook.

Uruchamianie i planowanie pipeline'u

W tej części uruchomisz i zaplanujesz pipeline. Ten harmonogram umożliwia uruchamianie potoku w ustalonym czasie.

  1. Przejdź do swojego obszaru roboczego.

  2. Otwórz rozwijaną listę rurociągu utworzonego w poprzedniej procedurze, a następnie wybierz pozycję Harmonogram.

    Zrzut ekranu przedstawiający menu potoku z podkreślony harmonogramem.

  3. W obszarze Zaplanowane uruchamianie wybierz pozycję Włączone.

    Zrzut ekranu przedstawiający zaplanowany przebieg ustawiony na wartość Włączone.

  4. Podaj harmonogram, którego chcesz użyć do uruchomienia potoku.

    1. Powtarzaj, na przykład codziennie lub co minutę.
    2. Po wybraniu opcji Codziennie możesz również wybrać pozycję Godzina.
    3. Rozpocznij od określonej daty.
    4. Koniec w określonej dacie.
    5. Wybierz strefę czasową.
  5. Wybierz pozycję Zastosuj , aby zastosować zmiany.

Utworzono potok uruchamiany zgodnie z harmonogramem, który odświeża dane w Lakehouse i wysyła powiadomienie e-mail. Stan potoku danych można sprawdzić, przechodząc do Monitor Hub. Możesz również sprawdzić stan pipeline'u, przechodząc do pozycji Pipeline i wybierając kartę Historia wykonywania w menu rozwijanym.

W tym przykładzie pokazano, jak używać przepływu danych w potoku z usługą Data Factory w usłudze Microsoft Fabric. W tym samouczku omówiono:

  • Utwórz przepływ danych.
  • Utwórz potok wywołujący przepływ danych.
  • Uruchom i zaplanuj swój rurociąg.

Następnie przejdź dalej, aby dowiedzieć się więcej na temat monitorowania przebiegów potoku.