注
このページは、バージョン 3 より前の Databricks JDBC ドライバー バージョンに適用されます。 Databricks JDBC ドライバー バージョン 3 以降については、 Databricks JDBC Driver を参照してください。
このページでは、 Databricks JDBC Driver の特別な高度なドライバー機能設定を構成する方法について説明します。
Databricks JDBC ドライバーには、次の特殊で高度なドライバー機能設定が用意されています。
- JDBC での ANSI SQL-92 クエリのサポート
- デフォルトのカタログとスキーマ
- 追跡用のクエリ タグ
- JDBCで大きなクエリ結果を抽出する
- JDBC での矢印のシリアル化
- JDBC での Cloud Fetch
- ログを有効にする
JDBC での ANSI SQL-92 クエリのサポート
従来の Spark JDBC ドライバーは、ANSI SQL-92 言語で SQL クエリを受け入れ、それらを Databricks SQL に変換してからサーバーに送信します。
アプリケーションで Databricks SQL が直接生成される場合、または Azure Databricks に固有の ANSI SQL-92 以外の構文を使用している場合は、接続構成で UseNativeQuery=1 設定します。 この設定では、SQL クエリが翻訳なしで Azure Databricks に逐語的に渡されます。
デフォルトのカタログとスキーマ
デフォルトのカタログとスキーマを指定するには、JDBC 接続 URL に ConnCatalog=<catalog-name>;ConnSchema=<schema-name> を追加します。
追跡用のクエリ タグ
Important
この機能は、プライベート プレビューにあります。 アクセス権を要求するには、アカウント チームにお問い合わせください。
追跡と分析のために、SQL クエリにキー値タグをアタッチします。 クエリタグは、クエリの識別と分析のために system.query.history テーブルに表示されます。
接続にクエリ タグを追加するには、JDBC 接続 URL に ssp_query_tags パラメーターを含めます。
jdbc:databricks://<server-hostname>:443;httpPath=<http-path>;ssp_query_tags=key1:value1,key2:value2
クエリ タグをコンマ区切りのキーと値のペアとして定義します。各キーと値はコロンで区切られます。 たとえば、「 key1:value1,key2:value2 」のように入力します。
JDBCで大きなクエリ結果を抽出する
大きなクエリ結果を抽出するときに最高のパフォーマンスを得るには、次の最適化を含む最新バージョンの JDBC ドライバーを使用します。
JDBC での矢印のシリアル化
JDBC ドライバー バージョン 2.6.16 以降では、 Apache Arrow を使用した最適化されたクエリ結果のシリアル化形式がサポートされています。
JDBC での Cloud Fetch
JDBC ドライバー バージョン 2.6.19 以降では、Cloud Fetch がサポートされています。Cloud Fetch は、Azure Databricks デプロイで構成されたクラウド ストレージを介してクエリ結果をフェッチする機能です。
クエリを実行すると、Azure Databricks は、最大 20 MB の方向シリアル化されたファイルとして、結果を内部 DBFS ストレージの場所 にアップロードします。 クエリが完了すると、ドライバーはフェッチ要求を送信し、Azure Databricks はアップロードされたファイルに Shared Access Signature を返します。 その後、ドライバーはこれらの URL を使用して、DBFS から直接結果をダウンロードします。
クラウド フェッチは、1 MB を超えるクエリ結果にのみ適用されます。 ドライバーは、Azure Databricks から直接小さな結果を取得します。
Azure Databricks では、蓄積されたファイルが自動的にガベージ コレクションされ、24 時間後に削除対象としてマークされ、さらに 24 時間後に完全に削除されます。
Cloud Fetch アーキテクチャの詳細については、「 BI ツールで高帯域幅接続を実現した方法」を参照してください。
ログ記録を有効にする
JDBC ドライバーでログ記録を有効にするには、 LogLevel プロパティを 1 (重大なイベントのみ) と 6 (すべてのドライバー アクティビティ) の間の値に設定します。
LogPath プロパティを、ログ ファイルを保存するフォルダーの完全なパスに設定します。
詳細については、Databricks JDBC ドライバー ガイドの 「ログ記録の構成」 を参照してください。