在 Microsoft Foundry 中使用 OneLake 文件

使用 Microsoft OneLake 作为 Microsoft Foundry 的知识源。 可以直接安全地从 Foundry 连接到 OneLake,为存储在 OneLake 中的非结构化文件和半结构化文件编制索引(包括通过快捷方式到达的文件),然后将该索引内容用作 Foundry 中代理内的知识源。

通过此集成,您可以将代理以已驻留在 OneLake 中的同一企业数据为基础,而无需在单独的 AI 特定存储中创建新的文件副本。 权限和治理机制通过用于分析工作负荷的 OneLake 和 Fabric 控件实施。

先决条件

  • Fabric 中的湖屋。 如果您没有数据湖屋,请按照使用 OneLake 创建数据湖屋中的步骤进行操作。

    • 在 Lakehouse 的 Files 文件夹中的文件。
  • Foundry 项目。 如果没有项目,请按照 “创建项目”中的步骤作。

  • 基本层或更高版本的 Azure AI 搜索服务。 如果您没有,请按照 创建 Azure AI 搜索服务中的步骤进行操作。

    • 搜索服务必须与 Fabric 工作区位于同一租户中。

    • 在本文中,你将为搜索服务创建并分配一个托管标识。 若要创建托管标识,你必须是所有者或用户访问管理员角色。 若要分配角色,你必须是所有者、用户访问管理员、基于角色的访问控制管理员或具有 Microsoft.Authorization/roleAssignments/write 权限的自定义角色的成员。

为 OneLake 文件中的数据编制索引

使用 Azure AI 搜索配置 OneLake 文件索引器,使 Lakehouse 数据可搜索为知识源。

查看 来自 OneLake 文件和快捷方式的索引数据中的先决条件 > 先决条件

然后,按照 OneLake 文件和快捷方式中的“索引数据和授予权限”中系统托管标识的步骤操作。

在 Foundry 中创建 OneLake 连接

  1. 登录到 Microsoft Foundry

    确保 New Foundry 开关处于 开启。 本文中的步骤请参阅 Microsoft Foundry (new)

    显示“新建 Foundry”切换设置为“开”的屏幕截图。

  2. 打开要处理的项目。

  3. 从导航菜单中选择构建,然后从左窗格中选择知识

    显示从“Foundry Build”菜单中选择“知识”选项卡的屏幕截图。

  4. 选择 AI 搜索资源。

    显示将代理连接到 Azure AI 搜索资源的屏幕截图。

  5. 选择“ 创建知识库”。

  6. 选择 Microsoft OneLake 作为知识类型。 选择 连接

  7. 提供 Fabric 工作区 ID 和 Lakehouse ID。

    可以通过 Lakehouse URL 检索到这两个 ID:https://app.powerbi.com/groups/<WORKSPACE_ID>/lakehouses/<LAKEHOUSE_ID>

    该屏幕截图展示如何提供工作区和 Lakehouse ID 来创建 OneLake 信息源。

  8. 选择 创建

  9. 选择“ 保存知识库”。