Udostępnij przez


Ładowanie danych do dedykowanej puli SQL

W tym artykule dowiesz się, jak pobierać dane z konta magazynu usługi Azure Data Lake Gen 2 do dedykowanej puli SQL w usłudze Azure Synapse Analytics.

Wymagania wstępne

  • Subskrypcja platformy Azure: jeśli nie masz subskrypcji platformy Azure, przed rozpoczęciem utwórz bezpłatne konto platformy Azure.
  • Konto usługi Azure Storage: Azure Data Lake Storage Gen 2 jest używany jako źródłowy magazyn danych. Jeśli nie masz konta magazynowego, zobacz sekcję Utwórz konto usługi Azure Storage, aby uzyskać instrukcje dotyczące jego tworzenia.
  • Azure Synapse Analytics: używasz dedykowanej puli SQL jako magazynu danych typu sink.

Tworzenie połączonych usług

W Azure Synapse Analytics połączona usługa to miejsce, gdzie definiujesz informacje o połączeniach do innych usług. W tej sekcji dodasz połączoną usługę Azure Synapse Analytics i Azure Data Lake Storage Gen2.

  1. Otwórz środowisko użytkownika usługi Azure Synapse Analytics i przejdź do karty Zarządzanie .
  2. W obszarze Połączenia zewnętrzne wybierz pozycję Połączone usługi.
  3. Aby dodać połączoną usługę, wybierz pozycję Nowy.
  4. Wybierz kafelek Azure Data Lake Storage Gen2 z listy i wybierz pozycję Kontynuuj.
  5. Wprowadź poświadczenia uwierzytelniania. Klucz konta, podmiot usługi i tożsamość zarządzana to obecnie obsługiwane typy uwierzytelniania. Wybierz pozycję Testuj połączenie, aby sprawdzić, czy poświadczenia są poprawne. Po zakończeniu wybierz pozycję Utwórz.
  6. Powtórz kroki 3–5, ale zamiast usługi Azure Data Lake Storage Gen2 wybierz kafelek usługi Azure Synapse Analytics i wprowadź odpowiednie poświadczenia połączenia. W przypadku usługi Azure Synapse Analytics obecnie obsługiwane są: uwierzytelnianie SQL, tożsamość zarządzana oraz jednostka usługi.

Utwórz pipeline

Potok danych zawiera logiczny przepływ informacji na potrzeby wykonywania zestawu działań. W tej sekcji utworzysz potok zawierający zadanie kopiowania, które kopiuje dane z usługi ADLS Gen2 do dedykowanej bazy danych SQL.

  1. Przejdź do karty Integracja . Wybierz ikonę znaku plus obok nagłówka potoków i wybierz pozycję Potok.
  2. W obszarze Przenoszenie i przekształcanie w okienku działań przeciągnij pozycję Kopiuj dane na kanwę potoku.
  3. Wybierz działanie kopiowania i przejdź do karty Źródło . Wybierz pozycję Nowy , aby utworzyć nowy źródłowy zestaw danych.
  4. Wybierz usługę Azure Data Lake Storage Gen2 jako magazyn danych i wybierz pozycję Kontynuuj.
  5. Wybierz pozycję DelimitedText jako format i wybierz pozycję Kontynuuj.
  6. W panelu właściwości zestawu wybierz utworzoną usługę połączoną ADLS. Określ ścieżkę pliku danych źródłowych i określ, czy pierwszy wiersz ma nagłówek. Możesz zaimportować schemat z magazynu plików lub przykładowego pliku. Po zakończeniu wybierz OK.
  7. Przejdź do karty Ujście . Wybierz pozycję Nowy , aby utworzyć nowy zestaw danych ujścia.
  8. Wybierz pozycję Azure Synapse Analytics jako magazyn danych i wybierz pozycję Kontynuuj.
  9. W panelu właściwości zestawu wybierz utworzoną połączoną usługę Azure Synapse Analytics. Jeśli piszesz do istniejącej tabeli, wybierz ją z listy rozwijanej. W przeciwnym razie zaznacz pole Edytuj i wprowadź nazwę nowej tabeli. Po zakończeniu wybierz przycisk OK
  10. Jeśli tworzysz tabelę, włącz opcję Automatyczne tworzenie tabeli w polu opcji tabeli.

Debugowanie i publikowanie pipelinie

Po zakończeniu konfigurowania potoku możesz przeprowadzić debugowanie przed opublikowaniem artefaktów, aby sprawdzić, czy wszystko jest poprawne.

  1. Aby debugować potok, wybierz Debuguj na pasku narzędzi. Stan działania potoku jest wyświetlany na karcie Dane wyjściowe w dolnej części okna.
  2. Po tym, jak uda się pomyślnie uruchomić potok, na górnym pasku narzędzi wybierz pozycję Opublikuj Wszystko. Ta akcja powoduje opublikowanie jednostek (zestawów danych i potoków) utworzonych w usłudze Synapse Analytics.
  3. Poczekaj na wyświetlenie komunikatu Pomyślnie opublikowano. Aby wyświetlić komunikaty powiadomień, wybierz przycisk dzwonka w prawym górnym rogu.

Uruchom i monitoruj potok danych

W tym kroku ręcznie wyzwolisz pipeline opublikowany w poprzednim kroku.

  1. Wybierz pozycję Dodaj wyzwalacz na pasku narzędzi, a następnie wybierz pozycję Wyzwól teraz. Na stronie Uruchamianie potoku kliknij Zakończ.
  2. Przejdź do karty Monitor znajdującej się na lewym pasku bocznym. Widzisz uruchomienie potoku, które zostało zainicjowane wyzwalaczem ręcznym. Za pomocą linków w kolumnie Akcje możesz wyświetlić szczegóły działań i ponownie uruchomić pipeline.
  3. Aby zobaczyć działania powiązane z uruchomieniem potoku, wybierz link Wyświetl uruchomienia działań w kolumnie Akcje. W tym przykładzie istnieje tylko jedno działanie, dlatego na liście jest widoczny tylko jeden wpis. Aby uzyskać szczegółowe informacje na temat operacji kopiowania, wybierz link Szczegóły (ikona okularów) w kolumnie Akcje . Wybierz Runy potoku u góry, żeby wrócić do widoku Runy potoku. Aby odświeżyć widok, wybierz pozycję Odśwież.
  4. Sprawdź, czy dane są poprawnie zapisywane w dedykowanej puli SQL.

Następne kroki

Aby uzyskać więcej informacji na temat integracji danych dla usługi Azure Synapse Analytics, zobacz artykuł Pozyskiwanie danych do usługi Azure Data Lake Storage Gen2 .