Azure Databricks

注释

此连接器由 Databricks 拥有和提供。

概要

条目 DESCRIPTION
发布状态 一般可用性
产品 Power BI (语义模型)
Power BI (数据流)
Fabric(Dataflow Gen2)
支持的身份验证类型 Azure Active Directory
个人访问令牌
用户名/密码

注释

适用于 Power BI 的 Azure Databricks 连接器现在支持 箭头数据库连接(ADBC) 驱动程序。 此功能现在通过预览提供。 在此处了解详细信息。

支持的功能

  • 进口
  • DirectQuery (Power BI 语义模型)

从 Power Query Desktop 连接到 Databricks (AWS、Azure 或 GCP)

若要从 Power Query Desktop 连接到 Databricks,请执行以下步骤:

  1. 在“获取数据”体验中,搜索 Databricks 以列出 Azure Databricks 的 Databricks 连接器。 除非 Databricks 代表另有说明,否则请对所有 Databricks SQL 数据仓库数据使用 Azure Databricks 连接器。

    从 Databricks Cloud 获取数据。

  2. 为 Databricks SQL Warehouse 提供 服务器主机名HTTP 路径。 有关查找“服务器主机名”和“HTTP 路径”的说明,请参阅 配置 Databricks ODBC 和 JDBC 驱动程序。 相应地输入此信息。 您可以选择性地在 高级选项下提供默认目录和/或数据库。 选择“确定”以继续。

    指定 Databricks SQL 仓库。

  3. 提供凭据以向 Databricks SQL Warehouse 进行身份验证。 可选择的凭证有三种:

    • Databricks 客户端凭据。 有关生成 Databricks OAuth M2M 客户端凭据的说明,请参阅 Databricks OAuth M2M

    • 个人访问令牌(可用于 AWS、Azure 或 GCP)。 有关生成个人访问令牌(PAT)的说明,请参阅 个人访问令牌

    • Azure Active Directory(仅适用于 Azure)。 使用浏览器弹出窗口登录到组织帐户。

      指定适当的令牌。

    注释

    输入特定 Databricks SQL Warehouse 的凭据后,Power BI Desktop 会缓存这些凭据,并在后续连接尝试中重复使用这些凭据。 可以通过“文件”>“选项和设置”>“数据源设置”来修改这些凭据。 详细信息:更改身份验证方法

  4. 成功连接后,导航器 会显示群集上可用的数据。 可以选择 转换数据 来使用 Power Query 转换数据,或者选择 加载 将数据加载到 Power Query Desktop。

    将 Databricks Cloud 数据加载到桌面应用的 Power Query 导航器的图像。

从 Power Query Online 连接到 Databricks 数据

若要从 Power Query Online 连接到 Databricks,请执行以下步骤:

  1. 在获取数据体验中选择 Azure Databricks 选项。 不同的应用可以通过不同的方式访问 Power Query Online 来获取数据体验。 有关如何从应用获取 Power Query Online 的“获取数据”体验的详细信息,请转到从何处获取数据的位置

    使用搜索框筛选可用的 Databricks 连接器。 除非 Databricks 代表另有说明,否则请对所有 Databricks SQL 数据仓库数据使用 Azure Databricks 连接器。

    Databricks 连接器的图像。

  2. 输入 Databricks SQL Warehouse 的 服务器主机名HTTP 路径。 有关查找“服务器主机名”和“HTTP 路径”的说明,请参阅 配置 Databricks ODBC 和 JDBC 驱动程序。 您可以选择性地在 高级选项下提供默认目录和/或数据库。

    连接设置和凭据。

  3. 提供凭据以向 Databricks SQL Warehouse 进行身份验证。 可选择的凭证有三种:

    • 用户名/密码(可用于 AWS 或 GCP)。 如果组织/帐户使用 2FA/MFA,则此选项不可用。
    • 帐户密钥(可用于 AWS、Azure 或 GCP)。 有关生成个人访问令牌(PAT)的说明,请参阅 个人访问令牌
    • Azure Active Directory(仅适用于 Azure)。 使用浏览器弹出窗口登录到组织帐户。
  4. 成功连接后,导航器 会出现,并显示服务器上的可用数据。 在导航器中选择数据。 然后选择下一步以在 Power Query 中转换数据。

    将 Databricks Cloud 数据加载到联机应用的 Power Query 导航器的图像。

Arrow数据库连接驱动程序连接器实现(预览版)

可以使用 Power BI 中 Azure Databricks 连接器的 Arrow Database Connectivity (ADBC) 驱动程序。 随着我们继续对此连接器的增强和添加新功能,建议升级到最新版本以试用 并提交产品反馈

要切换到 ADBC 驱动程序:

  1. 在 Power BI 中打开所需的仪表板。
  2. 选择转换数据
  3. “查询”选项部分选择“高级编辑器”。
  4. 指定 Implementation="2.0" 以用于 ADBC。
    let
        Source = Databricks.Catalogs("adb-<workspace-id>.<random-number>.azuredatabricks.net", "/sql/1.0/warehouses/<sql-warehouse-id>",
            [Catalog=null, Database=null, EnableAutomaticProxyDiscovery=null, Implementation="2.0"]),
        powerbi_Database = Source{[Name="powerbi",Kind="Database"]}[Data],
        default_Schema = powerbi_Database{[Name="default",Kind="Schema"]}[Data],
        dashboard_data_Table = default_Schema{[Name="dashboard_data",Kind="Table"]}[Data]
    in
        dashboard_data_Table
    

局限性

  • Azure Databricks 连接器支持 Web 代理。 但是,不支持 .pac 文件中定义的自动代理设置。
  • 在 Azure Databricks 连接器中, Databricks.Query 数据源不支持与 Power BI 语义模型的 DirectQuery 模式结合使用。