Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Dotyczy:✅ Magazyn w systemie Microsoft Fabric
Ten samouczek przeprowadzi Cię przez proces konfigurowania dbt i wdrażania pierwszego projektu do Fabric Warehouse.
Introduction
Struktura open source dbt (Data Build Tool) upraszcza przekształcanie danych i inżynierię analiz. Koncentruje się on na przekształceniach opartych na języku SQL w warstwie analizy, traktując język SQL jako kod. Usługa dbt obsługuje kontrolę wersji, modułyzację, testowanie i dokumentację.
Adapter dbt dla Microsoft Fabric może być używany do tworzenia projektów dbt, które można następnie wdrożyć w magazynie danych Fabric.
Możesz również zmienić platformę docelową projektu dbt, po prostu zmieniając adapter, na przykład projekt utworzony dla dedykowanej puli SQL usługi Azure Synapse można uaktualnić w ciągu kilku sekund do magazynu danych Fabric.
Wymagania wstępne dotyczące adaptera dbt dla usługi Microsoft Fabric
Postępuj zgodnie z tą listą, aby zainstalować i skonfigurować wymagania wstępne dla dbt.
Najnowsza wersja adaptera dbt-fabric z repozytorium PyPI (Python Package Index) przy użyciu
pip install dbt-fabric.pip install dbt-fabricNote
pip install dbt-fabricZmieniającpip install dbt-fabricnapip install dbt-synapsei korzystając z poniższych instrukcji, możesz zainstalować adapter dbt dla dedykowanej puli SQL Synapse.Upewnij się, że funkcja dbt-fabric i jej zależności są zainstalowane przy użyciu
pip listpolecenia :pip listZ tego polecenia powinna zostać zwrócona długa lista pakietów i bieżących wersji.
Jeśli jeszcze go nie masz, utwórz magazyn. W tym ćwiczeniu możesz użyć pojemności próbnej: utwórz bezpłatną wersję próbną usługi Microsoft Fabric, utwórz obszar roboczy, a następnie utwórz magazyn.
Rozpocznij pracę z adapterem dbt-fabric
W tym samouczku jest używany program Visual Studio Code, ale możesz użyć wybranego preferowanego narzędzia.
Sklonuj projekt demonstracyjny dbt jaffle_shop na maszynę.
- Repozytorium można sklonować za pomocą wbudowanej kontroli źródła programu Visual Studio Code.
- Możesz na przykład użyć
git clonepolecenia :
git clone https://github.com/dbt-labs/jaffle-shop-classic.gitjaffle_shopOtwórz folder projektu w programie Visual Studio Code.
Jeśli utworzono już magazyn, możesz pominąć rejestrację.
Utwórz plik
profiles.yml. Dodaj następującą konfigurację doprofiles.yml. Ten plik konfiguruje połączenie z Twoim magazynem w usłudze Microsoft Fabric za pomocą adaptera dbt-fabric.config: partial_parse: true jaffle_shop: target: fabric-dev outputs: fabric-dev: authentication: CLI database: <put the database name here> driver: ODBC Driver 18 for SQL Server host: <enter your SQL analytics endpoint here> schema: dbo threads: 4 type: fabricNote
Aby przełączyć adapter bazy danych na usługę Azure Synapse Analytics, zmień
typezfabricnasynapse, jeśli jest to pożądane. Istniejąca platforma danych dowolnego projektu dbt może zostać zaktualizowana poprzez zmianę adaptera bazy danych. Aby uzyskać więcej informacji, zobacz listę obsługiwanych platform danych dbt.Uwierzytelnij się na platformie Azure w terminalu programu Visual Studio Code.
- Uruchom polecenie
az loginw terminalu programu Visual Studio Code, jeśli używasz uwierzytelniania interfejsu wiersza polecenia platformy Azure. - W przypadku uwierzytelniania jednostki usługi lub innego identyfikatora Entra firmy Microsoft (dawniej Azure Active Directory) w usłudze Microsoft Fabric zapoznaj się z tematem dbt (Data Build Tool) setup i dbt Resource Configurations (Konfiguracja zasobów dbt). Aby uzyskać więcej informacji, zobacz Microsoft Entra authentication as an alternative to SQL authentication in Microsoft Fabric (Uwierzytelnianie entra firmy Microsoft jako alternatywa dla uwierzytelniania SQL w usłudze Microsoft Fabric).
- Uruchom polecenie
Teraz możesz przetestować łączność. Aby przetestować łączność z magazynem, uruchom polecenie
dbt debugw terminalu programu Visual Studio Code.dbt debugWszystkie testy zostały pomyślnie przeszły, co oznacza, że można połączyć magazyn przy użyciu adaptera dbt-fabric z projektu dbt
jaffle_shop.Teraz nadszedł czas, aby sprawdzić, czy karta działa, czy nie. Najpierw uruchom polecenie
dbt seed, aby wstawić przykładowe dane do magazynu.Uruchom polecenie
dbt run, aby uruchomić modele zdefiniowane w projekcie demo dbt.dbt runUruchom polecenie
dbt test, aby zweryfikować dane względem niektórych testów.dbt test
Teraz wdrożono projekt dbt w magazynie danych Fabric.
Przenieś się między różnymi magazynami
Proste przenoszenie projektu dbt między różnymi magazynami. Projekt dbt w dowolnym obsługiwanym magazynie można szybko migrować przy użyciu tego trzyetapowego procesu:
Zainstaluj nowy adapter. Aby uzyskać więcej informacji i pełne instrukcje instalacji, zobacz dbt adaptery.
typeZaktualizuj właściwość wprofiles.ymlpliku.Skompiluj projekt.
dbt w usłudze Fabric Data Factory
W przypadku integracji z platformą Apache Airflow popularny system zarządzania przepływami pracy dbt staje się zaawansowanym narzędziem do organizowania przekształceń danych. Funkcje planowania i zarządzania zadaniami Airflow umożliwiają zespołom danych automatyzację przebiegów dbt. Zapewnia regularne aktualizacje danych i utrzymuje spójny przepływ danych wysokiej jakości na potrzeby analizy i raportowania. To połączone podejście, wykorzystując wiedzę na temat transformacji dbt z zarządzaniem przepływami pracy firmy Airflow, zapewnia wydajne i niezawodne potoki, co ostatecznie prowadzi do szybszych i bardziej szczegółowych decyzji opartych na danych.
Apache Airflow to platforma typu open source używana do programowego tworzenia, planowania i monitorowania złożonych przepływów pracy danych. Umożliwia zdefiniowanie zestawu zadań nazywanych operatorami, które można połączyć w skierowane grafy acykliczne (DAG) do reprezentowania potoków.
Aby uzyskać więcej informacji na temat operacjonalizacji bazy danych w magazynie, zobacz Przekształcanie danych przy użyciu bazy danych za pomocą usługi Data Factory w usłudze Microsoft Fabric.
Considerations
Ważne kwestie, które należy wziąć pod uwagę podczas korzystania z adaptera dbt-fabric:
Przejrzyj bieżące ograniczenia dotyczące magazynowania danych w usłudze Microsoft Fabric.
Fabric obsługuje uwierzytelnianie Microsoft Entra ID (dawniej Azure Active Directory) dla tożsamości użytkowników i jednostek usługi. Zalecanym trybem uwierzytelniania do interaktywnej pracy w magazynie jest interfejs wiersza polecenia (interfejsy wiersza polecenia) i używanie jednostek usługi do automatyzacji.
Przejrzyj polecenia języka T-SQL (Transact-SQL) nieobsługiwane w usłudze Fabric Data Warehouse.
Niektóre polecenia języka T-SQL są obsługiwane przez adapter dbt-fabric przy użyciu
Create Table as Select(CTAS),DROP, iCREATEpoleceń, takich jakALTER TABLE ADD/ALTER/DROP COLUMN,MERGE,TRUNCATE,sp_rename.Przejrzyj nieobsługiwane typy danych , aby dowiedzieć się więcej o obsługiwanych i nieobsługiwanych typach danych.
Można zgłaszać problemy dotyczące adaptera dbt-fabric na GitHubie, odwiedzając stronę Problemy · microsoft/dbt-fabric · GitHub.