你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

文档智能的工作室体验

此内容适用于:选中标记v4.0 (GA) | 以前的版本:蓝色复选标记v3.1 (GA)蓝色复选标记v3.0 (GA)

Foundry Tools Studio 中的 Azure 文档智能是一种联机工具,可用于直观浏览、了解、训练和集成文档智能中的功能并将其集成到应用程序中。 工作室提供了一个平台,可用于试验不同的文档智能模型。 还可以通过交互方式对返回的数据进行采样,而无需编写代码。 您可使用工作室体验来:

  • 详细了解文档智能中的不同功能。
  • 使用文档智能资源测试示例文档的模型或上传自己的文档。
  • 试验不同的加载项和预览功能,以根据需要调整输出。
  • 训练自定义分类模型以对文档进行分类。
  • 训练自定义提取模型以从文档中提取字段。
  • 获取要集成到应用程序中的语言特定 SDK 的示例代码。

目前,功能将从 Document Intelligence Studio 迁移到新的 Foundry 门户。 这两个工作室提供的功能存在一些差异,这决定了哪个工作室适合你的用例。

选择正确的工作室体验

目前,有两个工作室用于生成和验证文档智能模型: Foundry 门户文档智能工作室。 随着体验迁移到新的 Foundry 门户,一些体验现在在两个工作室中都可以使用。 其他体验和模型仅在其中一个工作室中可用。

以下指南可帮助你根据需要选择工作室体验。 所有预构建模型常规提取模型在两个工作室中均可用。

何时使用文档智能工作室

文档智能工作室包含 2024 年 11 月或之前发布的所有功能。 对于任何 v2.1、v3.0、v3.1 功能,请继续使用文档智能工作室。

文档智能工作室提供用于标记、训练和验证自定义模型的可视化体验。 对于自定义文档字段提取模型,请使用文档智能工作室来处理模板和神经网络模型。 只能在文档智能工作室上训练和使用自定义分类模型。 如果要从版本 v3.0、v3.1 和 v4.0 试用正式发布版本的模型,请使用文档智能工作室。

何时使用 Foundry 门户

从 Foundry 开始,尝试 2024-11-30 版本中的任何预生成文档模型,包括读取或布局等常规提取模型。

详细了解文档智能工作室

要详细了解每个工作室以及如何开始已使用,请使用以下选项卡选择工作室体验。

重要

对于主权云区域,文档智能工作室提供不同的 URL:

文档智能工作室支持文档智能 v3.0 及更高的 API 版本来进行模型分析和自定义模型训练。 支持以前训练的带有标记数据的 v2.1 模型,但不支持 v2.1 模型训练。 有关从 v2.1 迁移到 v3.0 的信息,请参阅 REST API 迁移指南

使用文档智能工作室快速入门,以开始使用文档分析或预生成模型分析文档。 使用语言特定的 SDK 之一生成自定义模型,并在应用程序中引用这些模型。

文档智能模型支持

使用帮助向导、标记界面、训练步骤和可视化效果来了解每个功能的工作原理。

  • 阅读:通过示例文档或你自己的文档试用文档智能工作室阅读功能。 提取文本行、字词、检测到的语言和手写样式(如果检测到)。 有关详细信息,请参阅阅读
  • 布局:使用示例文档或你自己的文档试用文档智能布局功能。 提取文本、表、选择标记和结构信息。 有关详细信息,请参阅布局概述
  • 预生成模型:使用文档智能的预生成模型,可以在应用和流中添加智能文档处理,而无需训练和生成自己的模型。 例如,从文档智能发票功能开始。 有关详细信息,请参阅模型概述
  • 自定义提取模型:使用文档智能工作室自定义模型功能,可从使用你的数据训练和按你的表单和文档定制的模型字段和值。 要从多个表单类型中提取数据,请创建独立的自定义模型。 还可以合并两个或多个自定义模型并创建组合模型。 使用示例文档测试自定义模型,并通过迭代改进模型。 有关详细信息,请参阅自定义模型概述
  • 自定义分类模型:文档分类是文档智能支持的新方案。 文档分类器 API 支持分类和拆分应用场景。 训练分类模型以标识应用程序支持的不同类型的文档。 分类模型的输入文件可以包含多个文档,并在关联的页面范围内对每个文档进行分类。 要了解详细信息,请参阅自定义分类模型
  • 附加功能:文档智能支持更复杂的分析功能。 通过在每个模型页面上使用“分析选项”,可以启用和禁用这些可选功能。 提供四个附加功能:highResolutionformulafontbarcode extraction。 要了解详细信息,请参阅附加功能