Udostępnij przez


Ustawienia możliwości sterownika dla sterownika JDBC usługi Databricks (Simba)

Uwaga

Ta strona dotyczy wersji sterownika JDBC usługi Databricks poniżej wersji 3. Aby uzyskać informacje o sterowniku JDBC usługi Databricks w wersji 3 lub nowszej, zobacz Sterownik JDBC usługi Databricks.

Na tej stronie opisano sposób konfigurowania specjalnych i zaawansowanych ustawień możliwości sterowników dla sterownika JDBC usługi Databricks.

Sterownik JDBC usługi Databricks udostępnia następujące specjalne i zaawansowane ustawienia możliwości sterownika.

Obsługa zapytań ANSI SQL-92 w JDBC

Starsze sterowniki Spark JDBC akceptują zapytania SQL w dialektze ANSI SQL-92 i tłumaczą je na język SQL usługi Databricks przed wysłaniem ich do serwera.

Jeśli aplikacja generuje usługę Databricks SQL bezpośrednio lub używa składni innej niż ANSI SQL-92 specyficznej dla usługi Azure Databricks, ustaw wartość UseNativeQuery=1 w konfiguracji połączenia. To ustawienie przekazuje dosłowne zapytania SQL do usługi Azure Databricks bez tłumaczenia.

domyślny wykaz i schemat

Aby określić domyślny wykaz i schemat, dodaj ConnCatalog=<catalog-name>;ConnSchema=<schema-name> do adresu URL połączenia JDBC.

Tagi zapytań na potrzeby śledzenia

Ważne

Ta funkcja jest dostępna w prywatnej wersji zapoznawczej. Aby zażądać dostępu, skontaktuj się z zespołem ds. kont.

Dołącz tagi klucz-wartość do swoich zapytań SQL na potrzeby śledzenia i analizy. Tagi zapytań są wyświetlane w system.query.history tabeli na potrzeby identyfikacji i analizy zapytań.

Aby dodać tagi zapytań do połączenia, dołącz ssp_query_tags parametr do adresu URL połączenia JDBC:

jdbc:databricks://<server-hostname>:443;httpPath=<http-path>;ssp_query_tags=key1:value1,key2:value2

Zdefiniuj tagi zapytania jako pary klucz-wartość rozdzielane przecinkami, gdzie każdy klucz i wartość są oddzielone dwukropkiem. Na przykład key1:value1,key2:value2.

Wyodrębnianie dużych wyników zapytania w JDBC

Aby osiągnąć najlepszą wydajność podczas wyodrębniania dużych wyników zapytania, użyj najnowszej wersji sterownika JDBC, która zawiera następujące optymalizacje.

Serializacja strzałek w JDBC

Sterownik JDBC w wersji 2.6.16 lub nowszej obsługuje zoptymalizowany format serializacji wyników zapytania, który używa Apache Arrow.

Pobieranie z chmury w JDBC

Sterownik JDBC w wersji 2.6.19 lub nowszej obsługuje funkcję Cloud Fetch, która pobiera wyniki zapytań za pośrednictwem magazynu w chmurze skonfigurowanego we wdrożeniu usługi Azure Databricks.

Po uruchomieniu zapytania usługa Azure Databricks przekazuje wyniki do wewnętrznej lokalizacji magazynu DBFS jako pliki zserializowane w formacie Arrow o rozmiarze do 20 MB. Po zakończeniu zapytania sterownik wysyła żądania pobierania, a usługa Azure Databricks zwraca sygnatury dostępu współdzielonego do przekazanych plików. Następnie sterownik używa tych adresów URL do pobierania wyników bezpośrednio z systemu plików DBFS.

Pobieranie w chmurze dotyczy tylko wyników zapytań większych niż 1 MB. Sterownik pobiera mniejsze wyniki bezpośrednio z usługi Azure Databricks.

Usługa Azure Databricks automatycznie zbiera zebrane pliki, oznaczając je do usunięcia po 24 godzinach i trwale usuwając je po dodatkowych 24 godzinach.

Aby dowiedzieć się więcej na temat architektury pobierania z chmury, zobacz Jak osiągnęliśmy łączność o wysokiej przepustowości za pomocą narzędzi do analizy biznesowej.

Włącz rejestrowanie

Aby włączyć rejestrowanie w sterowniku JDBC, ustaw LogLevel właściwość na wartość między 1 (tylko poważne zdarzenia) i 6 (wszystkie działania sterownika). LogPath Ustaw właściwość na pełną ścieżkę folderu, w którym chcesz zapisać pliki dziennika.

Aby uzyskać więcej informacji, zobacz Konfigurowanie rejestrowania w przewodniku sterowników JDBC Databricks.