Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
W tym artykule dowiesz się, jak pobierać dane z konta magazynu usługi Azure Data Lake Gen 2 do dedykowanej puli SQL w usłudze Azure Synapse Analytics.
Wymagania wstępne
- Subskrypcja platformy Azure: jeśli nie masz subskrypcji platformy Azure, przed rozpoczęciem utwórz bezpłatne konto platformy Azure.
- Konto usługi Azure Storage: Azure Data Lake Storage Gen 2 jest używany jako źródłowy magazyn danych. Jeśli nie masz konta magazynowego, zobacz sekcję Utwórz konto usługi Azure Storage, aby uzyskać instrukcje dotyczące jego tworzenia.
-
Azure Synapse Analytics: używasz dedykowanej puli SQL jako magazynu danych typu sink.
- Jeśli nie masz istniejącego obszaru roboczego usługi Synapse, zobacz Tworzenie obszaru roboczego usługi Synapse
- Jeśli nie masz istniejącej dedykowanej puli SQL. Zobacz Tworzenie dedykowanej puli SQL.
Tworzenie połączonych usług
W Azure Synapse Analytics połączona usługa to miejsce, gdzie definiujesz informacje o połączeniach do innych usług. W tej sekcji dodasz połączoną usługę Azure Synapse Analytics i Azure Data Lake Storage Gen2.
- Otwórz środowisko użytkownika usługi Azure Synapse Analytics i przejdź do karty Zarządzanie .
- W obszarze Połączenia zewnętrzne wybierz pozycję Połączone usługi.
- Aby dodać połączoną usługę, wybierz pozycję Nowy.
- Wybierz kafelek Azure Data Lake Storage Gen2 z listy i wybierz pozycję Kontynuuj.
- Wprowadź poświadczenia uwierzytelniania. Klucz konta, podmiot usługi i tożsamość zarządzana to obecnie obsługiwane typy uwierzytelniania. Wybierz pozycję Testuj połączenie, aby sprawdzić, czy poświadczenia są poprawne. Po zakończeniu wybierz pozycję Utwórz.
- Powtórz kroki 3–5, ale zamiast usługi Azure Data Lake Storage Gen2 wybierz kafelek usługi Azure Synapse Analytics i wprowadź odpowiednie poświadczenia połączenia. W przypadku usługi Azure Synapse Analytics obecnie obsługiwane są: uwierzytelnianie SQL, tożsamość zarządzana oraz jednostka usługi.
Utwórz pipeline
Potok danych zawiera logiczny przepływ informacji na potrzeby wykonywania zestawu działań. W tej sekcji utworzysz potok zawierający zadanie kopiowania, które kopiuje dane z usługi ADLS Gen2 do dedykowanej bazy danych SQL.
- Przejdź do karty Integracja . Wybierz ikonę znaku plus obok nagłówka potoków i wybierz pozycję Potok.
- W obszarze Przenoszenie i przekształcanie w okienku działań przeciągnij pozycję Kopiuj dane na kanwę potoku.
- Wybierz działanie kopiowania i przejdź do karty Źródło . Wybierz pozycję Nowy , aby utworzyć nowy źródłowy zestaw danych.
- Wybierz usługę Azure Data Lake Storage Gen2 jako magazyn danych i wybierz pozycję Kontynuuj.
- Wybierz pozycję DelimitedText jako format i wybierz pozycję Kontynuuj.
- W panelu właściwości zestawu wybierz utworzoną usługę połączoną ADLS. Określ ścieżkę pliku danych źródłowych i określ, czy pierwszy wiersz ma nagłówek. Możesz zaimportować schemat z magazynu plików lub przykładowego pliku. Po zakończeniu wybierz OK.
- Przejdź do karty Ujście . Wybierz pozycję Nowy , aby utworzyć nowy zestaw danych ujścia.
- Wybierz pozycję Azure Synapse Analytics jako magazyn danych i wybierz pozycję Kontynuuj.
- W panelu właściwości zestawu wybierz utworzoną połączoną usługę Azure Synapse Analytics. Jeśli piszesz do istniejącej tabeli, wybierz ją z listy rozwijanej. W przeciwnym razie zaznacz pole Edytuj i wprowadź nazwę nowej tabeli. Po zakończeniu wybierz przycisk OK
- Jeśli tworzysz tabelę, włącz opcję Automatyczne tworzenie tabeli w polu opcji tabeli.
Debugowanie i publikowanie pipelinie
Po zakończeniu konfigurowania potoku możesz przeprowadzić debugowanie przed opublikowaniem artefaktów, aby sprawdzić, czy wszystko jest poprawne.
- Aby debugować potok, wybierz Debuguj na pasku narzędzi. Stan działania potoku jest wyświetlany na karcie Dane wyjściowe w dolnej części okna.
- Po tym, jak uda się pomyślnie uruchomić potok, na górnym pasku narzędzi wybierz pozycję Opublikuj Wszystko. Ta akcja powoduje opublikowanie jednostek (zestawów danych i potoków) utworzonych w usłudze Synapse Analytics.
- Poczekaj na wyświetlenie komunikatu Pomyślnie opublikowano. Aby wyświetlić komunikaty powiadomień, wybierz przycisk dzwonka w prawym górnym rogu.
Uruchom i monitoruj potok danych
W tym kroku ręcznie wyzwolisz pipeline opublikowany w poprzednim kroku.
- Wybierz pozycję Dodaj wyzwalacz na pasku narzędzi, a następnie wybierz pozycję Wyzwól teraz. Na stronie Uruchamianie potoku kliknij Zakończ.
- Przejdź do karty Monitor znajdującej się na lewym pasku bocznym. Widzisz uruchomienie potoku, które zostało zainicjowane wyzwalaczem ręcznym. Za pomocą linków w kolumnie Akcje możesz wyświetlić szczegóły działań i ponownie uruchomić pipeline.
- Aby zobaczyć działania powiązane z uruchomieniem potoku, wybierz link Wyświetl uruchomienia działań w kolumnie Akcje. W tym przykładzie istnieje tylko jedno działanie, dlatego na liście jest widoczny tylko jeden wpis. Aby uzyskać szczegółowe informacje na temat operacji kopiowania, wybierz link Szczegóły (ikona okularów) w kolumnie Akcje . Wybierz Runy potoku u góry, żeby wrócić do widoku Runy potoku. Aby odświeżyć widok, wybierz pozycję Odśwież.
- Sprawdź, czy dane są poprawnie zapisywane w dedykowanej puli SQL.
Następne kroki
Aby uzyskać więcej informacji na temat integracji danych dla usługi Azure Synapse Analytics, zobacz artykuł Pozyskiwanie danych do usługi Azure Data Lake Storage Gen2 .