Udostępnij przez


lokalne narzędzia programistyczne

Usługa Databricks udostępnia ekosystem narzędzi ułatwiających opracowywanie aplikacji i rozwiązań integrujących się z usługą Azure Databricks oraz programowo zarządzać zasobami i danymi usługi Databricks.

Ten artykuł zawiera omówienie tych narzędzi i zaleceń dotyczących najlepszych narzędzi dla typowych scenariuszy deweloperskich.

Jakie narzędzia zapewnia usługa Databricks do tworzenia aplikacji lokalnie?

Poniższa tabela zawiera listę narzędzi deweloperskich udostępnianych przez usługę Databricks.

Narzędzie opis
Uwierzytelnianie i autoryzacja Skonfiguruj uwierzytelnianie i autoryzację dla narzędzi, skryptów i aplikacji do pracy z usługą Azure Databricks.
Databricks Connect Nawiąż połączenie z usługą Azure Databricks przy użyciu popularnych zintegrowanych środowisk projektowych (IDE), takich jak PyCharm, IntelliJ IDEA, Eclipse, RStudio i JupyterLab.
Jeśli używasz programu Visual Studio Code, usługa Databricks zaleca rozszerzenie usługi Databricks dla programu Visual Studio Code, które jest oparte na programie Databricks Connect, ponieważ udostępnia dodatkowe funkcje umożliwiające łatwiejsze konfigurowanie.
Rozszerzenie usługi Databricks dla programu Visual Studio Code Połącz się ze zdalnymi obszarami roboczymi usługi Azure Databricks z zintegrowanego środowiska projektowego (IDE) programu Visual Studio Code .
Wtyczka PyCharm Databricks Skonfiguruj połączenie ze zdalnym obszarem roboczym usługi Databricks i uruchom pliki w klastrach usługi Databricks z poziomu rozwiązania PyCharm. Ta wtyczka jest opracowywana i dostarczana przez firmę JetBrains we współpracy z usługą Databricks.
Zestawy SDK usługi Databricks Automatyzowanie usługi Azure Databricks z bibliotek kodu napisanych dla popularnych języków, takich jak Python, Java, Go i R. Zamiast wysyłać wywołania interfejsu API REST bezpośrednio przy użyciu narzędzia curl lub Postman, użyj zestawu SDK do interakcji z usługą Databricks przy użyciu wybranego języka programowania. Zestawy SDK usługi Databricks obsługują kompletny interfejs API REST i udostępniają inne funkcje, w tym ujednolicone uwierzytelnianie i stronicowanie, które ułatwiają ich używanie i rozszerzanie na wiele scenariuszy.
Sterowniki i narzędzia SQL Połącz się z usługą Azure Databricks, aby uruchamiać polecenia i skrypty SQL, programowo korzystać z usługi Azure Databricks i integrować funkcje SQL usługi Azure Databricks z aplikacjami napisanymi w popularnych językach, takich jak Python, Go, JavaScript i TypeScript.
Interfejs wiersza polecenia usługi Databricks Uzyskaj dostęp do funkcji usługi Azure Databricks przy użyciu interfejsu wiersza polecenia usługi Databricks. Interfejs wiersza polecenia opakowuje interfejs API REST usługi Databricks, więc zamiast wysyłać wywołania interfejsu API REST bezpośrednio przy użyciu narzędzia curl lub Postman, użyj interfejsu wiersza polecenia usługi Databricks do interakcji z usługą Databricks.
Pakiety zasobów usługi Databricks Implementowanie standardowych rozwiązań dotyczących programowania, testowania i wdrażania (CI/CD) dla danych i projektów sztucznej inteligencji usługi Azure Databricks przy użyciu pakietów zasobów usługi Databricks.
Dostawca narzędzia Terraform usługi Databricks i narzędzie Terraform CDKTF dla usługi Databricks Aprowizuj infrastrukturę i zasoby usługi Azure Databricks przy użyciu narzędzia Terraform.
narzędzia CI/CD Zintegruj popularne systemy i platformy CI/CD, takie jak GitHub Actions, Jenkins i Apache Airflow.

Napiwek

Możesz również połączyć wiele dodatkowych popularnych narzędzi innych firm z klastrami i magazynami SQL w celu uzyskania dostępu do danych w usłudze Azure Databricks. Aby uzyskać więcej informacji, zobacz Partnerów technologicznych.

Którego narzędzia dewelopera należy używać?

W poniższej tabeli przedstawiono zalecenia dotyczące narzędzi usługi Databricks dla typowych scenariuszy deweloperskich.

Narzędzie Zalecenie dotyczące użycia
Rozszerzenie usługi Databricks dla programu Visual Studio Code
Wtyczka PyCharm Databricks
W przypadku innych IDE, użyj Databricks CLI z Databricks Connect
  • Interaktywne programowanie i debugowanie z lokalnego środowiska IDE
Interfejs wiersza polecenia usługi Databricks
  • Bezpośrednia interakcja z usługą Databricks z wiersza polecenia
  • Skrypty powłokowe
  • Eksperymentowanie
  • Bezpośrednie wywoływanie interfejsu API REST
  • Zarządzanie profilami uwierzytelniania lokalnego
  • Synchronizowanie kodu ze środowiska IDE do obszaru roboczego usługi Databricks
Pakiety zasobów Databricks (funkcja interfejsu wiersza polecenia)
  • Zarządzanie przepływami pracy i wdrażanie projektów w usłudze Databricks
  • Stosuj najlepsze praktyki CI/CD
  • Wersja współdzielona, współautorstwo, wspólne wdrażanie zasobów i aktywów jako jedna jednostka.
  • Obsługuje najbardziej typowe zasoby
Dostawca narzędzia Terraform usługi Databricks
  • Infrastruktura jako kod, ciągła integracja/ciągłe wdrażanie
  • Zarządzaj i twórz obszary robocze, katalogi, magazyny metadanych i egzekwuj uprawnienia.
  • Gwarancja przenośności środowiska i odzyskiwania po awarii
  • Wiele obsługiwanych zasobów
Databricks Python SDK
Databricks Java SDK
Databricks Go SDK
Databricks R SDK
  • Projektowanie aplikacji
  • Integracja z istniejącymi systemami wdrażania
  • Tworzenie niestandardowych przepływów pracy usługi Databricks i nowych usług internetowych
Sterowniki SQL
  • Uruchamianie poleceń SQL i skryptów z aplikacji klienckich
Databricks API REST
  • Automatyzowanie procesów, w których zestaw SDK w preferowanym języku programowania jest niedostępny
  • Tylko zaawansowane scenariusze
  • Prawie wszystkie zasoby usługi Databricks są dostępne