你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

在 Microsoft Foundry(经典版,预览)门户中创建标准和高级内容理解任务。

假设你有不同类型的文件(例如文档、图像、音频或视频),并且你想要从它们自动提取关键信息。 借助内容理解,可以创建一个任务来组织数据处理,定义一个字段架构,该架构指定要提取或生成的信息,然后生成分析器。 分析器将成为可以集成到应用程序或工作流中的 API 终结点。

本指南介绍如何在 Microsoft Foundry(经典)门户中使用内容理解标准和专业模式来生成和测试从数据中提取结构化信息的自定义分析器。

注释

Foundry(经典)门户使用预览API(2025-05-01-preview)。

在标准模式和专业模式之间进行选择(预览版)

内容理解为不同方案提供了两种模式:

  • 标准模式 - 非常适合使用直接字段提取处理单个文件。 如果需要从单个文档、图像、音频或视频文件中提取结构化数据,而无需跨文件分析或复杂的推理要求,请使用标准模式。

  • Pro 模式 - 专为需要多步骤推理和跨文件分析的高级方案而设计。 需要以下条件时使用 Pro 模式:

    • 在单个请求中处理多个输入文件
    • 跨不同文档应用推理以验证、扩充或聚合数据
    • 使用参考数据(知识库)指导提取和验证
    • 执行超越简单字段提取的复杂多步骤分析

有关为方案选择哪种模式的详细指南,请参阅 Azure 内容理解标准和专业模式(预览版)。

注释

Pro 模式是仅在此预览版 API 版本(2025-05-01-preview)中提供的预览功能。 对于标准模式,可以转换到 GA API(2025-11-01),只需进行最少的更改。 请参阅 GA 迁移指南

先决条件

要开始使用,请确保你拥有以下资源和权限:

  • 一份 Azure 订阅。 如果还没有 Azure 订阅,可以创建一个免费帐户

  • 受支持区域中的 Foundry 项目。 有关支持区域的完整列表,请查看 语言和区域支持。 请参阅下面的说明,了解如何创建第一个项目。

创建第一个项目

若要在 Foundry 门户中开始使用内容理解,请按照以下步骤创建项目。 项目允许你在生成自定义 AI 应用时组织工作并保存状态。 所有与内容理解相关的工作都在项目中进行。

  1. Foundry 门户的主页中,选择右上角的“新建”。

  2. Foundry 支持两种项目类型: Foundry resourceAI hub resource。 这两种项目类型都适用于内容理解。 对于最新体验,请使用 Foundry resource. 有关项目类型的更多上下文,请参阅 为 Foundry 创建项目

    • 如果要创建 Foundry 项目,请选择 Advanced options 并选择 受支持的区域

    • 如果要创建基于中心的项目,请选择或创建中心以继续。 确保中心位于 受支持的区域中。 如果没有中心或中心不在受支持的区域中,请选择下拉列表顶部的选项以创建新中心并填写所需的输入。

创建由内容理解标准模式支持的单文件任务

按照以下步骤在 Foundry 中创建自定义任务。 使用此任务生成第一个分析器。

  1. 转到 Foundry 的主页。
  2. 选择项目。 可能需要选择“ 查看所有资源 ”才能查看项目。
  3. 从左侧导航窗格中选择 内容理解
  4. 选择+ 新建
  5. 选择后可创建一个使用内容理解标准模式的 Single-file task。 有关哪种模式适合你的方案的详细信息,请查看 Foundry Tools pro 和标准模式(预览版)中的 Azure 内容理解
  6. 输入任务的名称。 (可选)输入说明并更改其他设置。
  7. 选择 创建

创建第一个分析器

配置所有内容后,即可生成第一个分析器。

创建单文件内容理解任务时,首先上传数据示例并生成字段架构。 架构是可自定义的框架,允许分析器从数据中提取见解。 在此示例中,将创建架构以从发票文档中提取密钥数据,但可以引入任何类型的数据,步骤保持不变。 有关受支持的文件类型的完整列表,请参阅输入文件限制

  1. 上传 发票文档的示例文件 或与方案相关的任何其他数据。

    用户体验中上传步骤的屏幕截图。

  2. 接下来,内容理解服务会基于内容类型建议分析器模板。 请查看内容理解提供的分析器模板,获取为每个模态提供的所有模板的完整列表。 对于此示例,请选择“文档分析”,生成你自己的针对发票方案定制的架构。 使用自己的数据时,请选择最符合需求的分析器模板,或创建自己的模板。 有关可用模板的完整列表,请参阅分析器模板

  3. 选择 创建

    分析器模板的屏幕截图。

  4. 接下来,将字段添加到架构,以反映要生成的所有输出。

    • 指定简单明了的字段名称。 一些示例字段可能包括 vendorNameitemsprice

    • 指示每个字段的值类型(字符串、日期、数字、列表、组)。 若要了解详细信息,请参阅支持的字段类型

    • [可选] 提供字段说明来解释所需行为,包括任何异常或规则。

    • 指定为每个字段生成值的方法。

      有关如何定义字段架构的最佳做法,请参阅 内容理解的最佳做法。 构建架构可能需要几分钟时间。

  5. 架构准备好测试后,选择“ 保存”。 你可以随时返回并根据需要进行更改。

    已完成的架构的屏幕截图。

  6. 完成架构后,内容理解现在会生成示例数据的输出。 在此步骤中,可以添加更多数据来测试分析器的准确性,或根据需要更改架构。

    架构测试步骤的屏幕截图。

  7. 如果对输出的质量感到满意,请选择 “生成分析器”。 此操作将创建一个可以集成到你自己的应用程序中的分析器 ID,使你能够从代码调用分析器。

    生成的分析器的屏幕截图。

你已成功生成第一个内容理解分析器,并已准备好开始从数据中提取见解。 请查看快速入门:内容理解 REST API 以利用 REST API 调用分析器。

共享项目

若要共享创建和管理访问权限的项目,请转到管理中心。 可以在项目的导航窗格底部找到它:

查找管理中心位置的屏幕截图。

在管理中心,可以管理用户并分配单个角色:

管理中心的“项目用户”部分的屏幕截图。

后续步骤