Databricks ODBC 驱动程序的驱动程序功能设置 (Simba)

本页介绍如何为 Databricks ODBC 驱动程序配置特殊和高级驱动程序功能设置。

Databricks ODBC 驱动程序提供以下特殊和高级驱动程序功能设置。

在 ODBC 中设置初始架构

ODBC 驱动程序允许通过将 Schema=<schema-name> 设置为连接配置来指定架构。 这相当于运行 USE <schema-name>

用于跟踪的查询标记

重要

此功能以个人预览版提供。 若要请求访问权限,请联系你的帐户团队。

将键值标记附加到 SQL 查询以进行跟踪和分析。 查询标记显示在 system.query.history 表中,用于查询标识和分析。

若要将查询标记添加到连接,请在 ssp_query_tags ODBC 连接配置中包含参数:

将查询标记定义为逗号分隔的键值对,其中每个键和值都用冒号分隔。 例如,ssp_query_tags=team:engineering,env:prod

ODBC 中的 ANSI SQL-92 查询支持

旧版 Spark ODBC 驱动程序接受 ANSI SQL-92 方言中的 SQL 查询,并在将其发送到服务器之前将其转换为 Databricks SQL。

如果应用程序直接生成 Databricks SQL,或使用特定于 Azure Databricks 的非 ANSI SQL-92 语法,请在连接配置中设置 UseNativeQuery=1 。 此设置将 SQL 查询逐字传递到 Azure Databricks,而无需翻译。

在 ODBC 中提取大型查询结果

若要在提取大型查询结果时获得最佳性能,请使用最新版本的 ODBC 驱动程序,其中包括以下优化。

ODBC 中的 Arrow 序列化

ODBC 驱动程序版本 2.6.15 和更高版本支持使用 Apache Arrow 的优化查询结果序列化格式。

ODBC 中的云提取

ODBC 驱动程序版本 2.6.17 及更高版本支持 Cloud Fetch,该功能通过 Azure Databricks 部署中配置的云存储提取查询结果。

运行查询时,Azure Databricks 会将结果作为最大 20 MB 的箭头序列化文件上传到内部 DBFS 存储位置 。 查询完成后,驱动程序会发送提取请求,Azure Databricks 将 共享访问签名 返回到上传的文件。 然后,驱动程序使用这些 URL 直接从 DBFS 下载结果。

Cloud Fetch 仅适用于大于 1 MB 的查询结果。 驱动程序直接从 Azure Databricks 检索较小的结果。

Azure Databricks 会自动清理积累的文件,将其标记为将在 24 小时后删除,并在另一个 24 小时后永久删除这些文件。

若要详细了解云提取体系结构,请参阅我们如何通过 BI 工具实现高带宽连接

启用日志记录

若要在 ODBC 驱动程序中启用日志记录,请将LogLevel属性设置为(仅严重事件)和1(所有驱动程序活动)之间的6值。 将 LogPath 属性设置为要保存日志文件的文件夹的完整路径。

有关详细信息,请参阅 Configuring LoggingDatabricks ODBC 驱动程序指南中的部分。