你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

使用内容理解工作室对数据进行分类和路由

通过 Content Understanding Studio,可以创建自定义分类工作流,以将数据路由到正确的自定义分析器。 使用路由,可以将多个不同的数据流输入到同一管道中,并确保数据始终路由到最佳分析器。

先决条件

要开始使用,请确保你拥有以下资源和权限:

  • 一份 Azure 订阅。 如果还没有 Azure 订阅,可以创建一个免费帐户
  • 拥有 Azure 订阅后,请在 Azure 门户中创建 Microsoft Foundry 资源 。 请务必在 受支持的区域中创建它。
    • 此资源在门户中的“Foundry”>“Foundry”下列出。
  • 为内容理解资源设置默认模型部署。 默认设置将创建与用于内容理解请求的 Foundry 模型的连接。 选择下列方法之一:
    1. 转到 “内容理解设置”页
    2. 选择左上角的“+ 添加资源”按钮
    3. 选择要使用的 Foundry 资源,然后单击“下一步”,然后单击“保存”
      • 选中“如果没有可用的默认值,请确保为所需模型启用自动部署”。 确保资源已用所需的 GPT-4.1、GPT-4.1-mini 和 text-embedding-3-large 型模进行完整设置。 不同的预生成分析器需要不同的模型。
    通过执行这些步骤,可以在 Foundry 资源中设置内容理解模型和 Foundry 模型之间的连接。

登录到内容理解工作室

转到 Content Understanding Studio 门户 并使用凭据登录。 可以在 Foundry Tools Studio 体验中识别经典 Azure 文档智能。 内容理解在所有模式(文档、图像、视频和音频)中扩展了您在文档智能中所熟悉的内容和字段提取功能。 选择此选项可以试用新的内容理解体验,以获取服务的所有多模式功能。

创建自定义类别

使用自定义类别可将数据路由到特定分析器,以便根据数据类型获得最佳输出。 本指南介绍如何根据提供的客户端对发票文档进行分类。 不同客户的文档可能具有不同的结构,这取决于正在执行的独特业务协议。 此分类工作流可确保使用正确的上下文分析文档。 为成功路由数据,可能需要创建自定义分析器,以便根据具体情况指引数据流向相应分析器。 有关生成自定义分析器的详细信息,请参阅 在内容理解工作室中创建和改进自定义分析器

  1. 从新项目开始:若要开始创建自定义分类工作流,请选择主页上的 “创建项目 ”。

  2. 选择项目类型:对于此方案,请选择相应的选项Classify and route with custom categories。 若要详细了解如何为内容和字段提取创建自定义分析器,请参阅 在 Content Understanding Studio 中创建和改进自定义分析器

  3. 上传数据:若要开始分类,请上传一段示例数据。

  4. 创建路由规则:在 “路由规则 ”选项卡下,选择 Add category。 为类别指定名称和说明,并选择一个分析器来对应于该路由。 例如,如果要分析来自多个客户端(每个客户端都需要自定义架构)的发票,则可以路由到为该特定发票类型生成的自定义分析器。 借助该工具,可以预览每个分析器的架构,以确保你拥有正确的架构。

    用于分类的路由 UX 的屏幕截图。

  5. 测试分类工作流:自定义路由规则准备好进行测试时,选择 “运行分析 ”以查看数据规则的输出。 可以选择上传其他示例数据片段进行测试,以查看它如何使用多个不同的规则执行。

    内容理解工作室的屏幕截图,其中突出显示了“测试”按钮。

  6. 生成分类分析器:如果对输出感到满意,请选择页面顶部的 “生成分析器 ”按钮。 为分析器命名并选择“ 保存”。

  7. 使用分类分析器:现在你有一个可以通过 REST API 在自己的应用程序中使用的分析器终结点。

后续步骤