你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

Azure Vision 在 Foundry Tools 中的新功能

了解 Azure 视觉中的新增功能。查看此页以实时跟进新功能、增强功能、修补程序和文档更新。

2025 年 8 月

人脸活体检测服务 v1.3-preview.1 API 版本

v1.3-preview.1 公共预览版引入了新的安全增强功能：

滥用检测 - 添加内置风险评估（包括基于 IP 的检查），以帮助识别和标记可能具有欺诈性的活体检测会话。这样就能提前干预高风险场景，例如标识验证或帐户加入。了解详细信息。

有关完整详细信息，请查看 API 参考。

对活体检测 API 的网络隔离支持

活体检测 API 现在支持禁用来自客户端应用程序的调用的公共网络访问，确保仅在受信任的网络边界内处理请求。此功能适用于受支持的 API 版本，对于受监管或高安全环境尤其有价值。了解详细信息。

人脸活体检测客户端 SDK 1.4.1 版本

1.4.1 版本改进了活体检测 SDK 的分发和 CI/CD 集成。

公共包装器 SDK 现已在 npm (JavaScript/Web)、Maven Central (Android) 和 GitHub 存储库 (iOS xcframework) 中提供，通过 GitHub Dependabot 或 Renovate 等工具实现更轻松的集成和自动化依赖项监视。
简化的封闭资产访问 - 现在，开发人员无需运行本地脚本，而是可调用专用 API，使用其 Azure 人脸资源终结点和 API 密钥获取访问令牌，让自动化生成更容易设置。

有关特定于平台的详细信息、示例和迁移指南，请参阅完整的 SDK 发行说明。

2025 年 2 月

人脸活体客户端 SDK 1.1.0 版本

活体客户端 SDK 已发布 1.1.0

此更新包括一些改进：

头部轮次方案的超时增加，为最终用户提供更多的时间来完成流程。
修复了 iOS 和 Android SDK，以解决 Microsoft Intune 移动应用程序管理 SDK 的兼容性问题。
与安全性相关的修补程序/改进。

有关详细信息，请参阅 SDK 发行说明。

2025 年 1 月

人脸活体检测正式版

人脸活体检测功能现已正式发布（正式版）。

服务器端 API：人脸 API v1.2
客户端 SDK：Foundry Tools SDK 1.0.0 中的 Azure 视觉

此 SDK 允许开发人员利用本机移动应用程序和 Web 浏览器应用程序的人脸活体检查，将其用于身份验证场景。

新 SDK 支持被动模式和被动-主动模式。混合被动-主动模式旨在仅在照明条件不佳的情况下要求主动运动，同时在最佳照明中使用被动活体检查的速度和效率。

有关详细信息，请参阅 SDK 发行说明。

图像分析 4.0 预览版 API 弃用

2025 年 3 月 31 日，图像分析 4.0 预览版 API 将停用。在该日期之前，需要将 Azure 映像分析工作负载迁移到映像分析 4.0 GA API。

我们鼓励你尽快进行迁移，以便使用改进功能，例如多模式嵌入、同步 OCR、人员检测、图像标记、智能裁剪、描述文字、密集描述和图像对象检测等等。以下图像分析 4.0 预览版 API 将于 2025 年 3 月 31 日停用：

2022-07-31-preview
2022-10-12-preview
2023-02-01-preview
2023-04-01-preview
2023-07-01-preview
v4.0-preview.1

从 2025 年 1 月 10 日起，以下功能将在预览版 API 版本停用后停止供应，并从工作室体验中移除：

模型自定义
背景移除
产品识别

要确保模型顺利运行，请转换到现已正式发布的 Azure AI 自定义视觉。自定义视觉可提供与这些即将停用的功能相似的功能。

2024 年 8 月

新的可检测人脸属性

在最新的 Detection 03 模型中可以使用眼镜、遮挡、模糊和曝光属性。有关更多详细信息，请参阅指定人脸检测模型。

2024 年 5 月

新的人脸 SDK 1.0.0-beta.1（中断性变更）

1.0.0-beta.1 版本中的人脸 SDK 经过重新设计，可以更好地满足 Azure SDK 的指导方针和设计原则。支持的语言包括 C#、Python、Java 和 JavaScript。按照快速入门开始使用。

2024 年 2 月

多模式嵌入 GA：新的多语言模型

多模式嵌入 API 已更新，现已正式发布。新的 2024-02-01 API 包括一个支持通过 102 种语言进行文本搜索的新模型。初始的纯英文模型仍然可用，但不能与同一搜索索引中的新模型组合使用。如果你使用纯英文模型对文本和图像进行了矢量化，则这些矢量将与多语言文本和图像矢量不兼容。

有关受支持语言的列表，请参阅语言支持页。

2024 年 1 月

新的图像分析 SDK 1.0.0-beta.1（中断性变更）

图像分析 SDK 在版本 1.0.0-beta.1 中重写，以便更好地与其他 Azure SDK 保持一致。所有 API 都已更改。有关如何使用新 SDK 的信息，请参阅更新后的快速入门、示例和操作指南。

主要更改：

SDK 现在会调用正式版计算机视觉 REST API (2023-10-01)，而不是预览版计算机视觉 REST API (2023-04-01-preview)。
添加了对 JavaScript 的支持。
不再支持 C++。
SDK 不再支持使用自定义模型的图像分析和图像分段（背景移除），因为计算机视觉 REST API (2023-10-01) 尚不支持它们。若要使用其中任一功能，请直接调用计算机视觉 REST API (2023-04-01-preview)（分别使用 Analyze 和 Segment 操作）。

2023 年 11 月

分析图像 4.0 正式发布

图像分析 4.0 REST API 现已正式发布。按照分析图像 4.0 快速入门开始使用。

图像分析的其他功能（如模型自定义、后台移除和多模式嵌入）仍处于公共预览状态。

用于活体检测的人脸客户端 SDK

人脸活体 SDK 支持在用户移动设备或边缘设备上进行活体检测。它适用于 Android 的 Java/Kotlin 以及 iOS 的 Swift/Objective-C。

我们的运行情况检测服务在 iBeta 级别 1 和级别 2 呈现攻击检测 (PAD) 测试中实现了 0% 渗透率，由 NIST/NVLAP 认可的实验室进行，并符合 ISO/IEC 30107-3 PAD 国际标准。

2023 年 9 月

弃用已过时的计算机视觉 API 版本

计算机视觉 API 版本 1.0、2.0、3.0 和 3.1 将于 2026 年 9 月 13 日停用。在此日期之后，开发人员将无法对这些 API 发出 API 调用。我们建议所有受影响的客户尽早在方便的时候，遵循此快速入门将其工作负载迁移到正式发布的计算机视觉 3.2 API。此外，客户应考虑迁移到图像分析 4.0 API（预览版），该版本提供最新且卓异的图像分析功能。

如有任何问题，请访问我们的 Q&A。

2023 年 5 月

图像分析 4.0 产品识别（公共预览版）

借助产品识别 API，可以分析零售商店中货架的照片。可以检测产品是否存在，并获取其边界框坐标。将其与模型自定义结合使用，以训练模型来识别特定产品。还可以将产品识别结果与商店的货架图文档进行比较。产品识别。

2023 年 4 月

人脸受限访问令牌

独立软件供应商 (ISV) 可以通过颁发访问令牌来管理其客户的人脸 API 使用情况，这些令牌可授予对通常受限的人脸功能的访问权限。这允许客户公司使用人脸 API，而无需经过正式的审批流程。使用受限访问令牌。

2023 年 3 月

Azure 视觉图像分析 4.0 SDK 公共预览版

佛罗伦萨基础模型现已集成到 Azure 视觉中。改进的视觉服务使开发人员能够跨各个行业创建市场就绪、负责任的 Azure 视觉应用程序。客户现在可以无缝数字化、分析数据并将其连接到自然语言交互，从图像和视频内容中解锁强大的见解以支持辅助功能、通过 SEO 推动获取、保护用户免受有害内容侵害、增强安全性并缩短事件响应时间。有关详细信息，请参阅公布 Microsoft 的 Florence 基础模型。

图像分析 4.0 SDK（公共预览版）

图像分析 4.0 现在可通过 C#、C++ 和 Python 语言的客户端库 SDK 提供。此次更新还包括 Florence 支持的图像文字描述，以及近似人类性能的密集文字描述。

图像分析 V4.0 描述文字生成和密集描述文字生成（公共预览版）：

在 V4.0 中，“描述文字”取代了“描述”，它是经过改进的图像文字描述功能，具有丰富的细节和语义理解。除了描述整个图像之外，“密集文字描述”还可以生成最多 10 个图像区域的单句说明，从而提供更多详细信息。 “密集文字描述”还会返回所描述图像区域的边界框坐标。还有一个新的性别中立参数，允许客户选择是否为替换文本和 Seeing AI 应用程序启用概率性别推理。自动提供丰富的描述文字、可访问的替换文字、SEO 优化和智能照片策展，以支持数字内容。图形描述文字。

视频摘要和帧定位器（公共预览版）：

以类似于思考和写作时的直观方式搜索视频内容并与之交互。查找相关内容，无需额外的元数据。仅在 Vision Studio 中可用。

图像分析 4.0 模型自定义（公共预览版）

现在，可以使用 Vision Studio 或 v4.0 REST API 创建和训练自己的自定义图像分类和物体检测模型。

多模式嵌入 API（公共预览版）

多模式嵌入 API 是图像分析 4.0 API 的一部分，支持对图像和文本查询进行矢量化。这些 API 可用于将图像和文本转换为多维矢量空间中的坐标。现在，你可以使用自然语言进行搜索，并使用矢量相似性搜索查找相关图像。

背景移除 API（公共预览版）

作为图像分析 4.0 API 的一部分，背景移除 API 可用于移除图像的背景。此操作可以输出检测到的前景物体的图像（具有透明背景），也可以输出显示检测到的前景物体的不透明度的灰度 alpha 哑光图像。

Azure 视觉 3.0 & 3.1 预览版弃用

Azure Vision 3.0 和 3.1 API 的预览版计划于 2023 年 9 月 30 日停用。超过此日期后，客户将无法再对这些 API 进行任何调用。建议客户将其工作负载迁移到正式发布 (GA) 的 3.2 API。从这些预览版本迁移到 3.2 API 时，请注意以下变化：

分析图像和读取 API 调用将采用可选的 model-version 参数，该参数可用于指定要使用的 AI 模型。默认情况下，它们使用最新模型。
分析图像和读取 API 调用还会在成功的 API 响应中返回 model-version 字段。此字段报告使用了哪个模型。
Azure Vision 3.2 API 使用不同的错误报告格式。请参阅 API 参考文档详细了解如何调整任何错误处理代码。

2022 年 10 月

Azure 视觉图像分析 4.0（公共预览版）

图像分析 4.0 已以公共预览版发布。新的 API 包括映像字幕、图像标记、物体检测、智能裁剪、人脸检测和读取 OCR 功能，所有这些均可在一个“分析图像”操作中使用。在性能增强的同步 API 中对常规非文档图像进行了优化，可更轻松地在工作流中嵌入 OCR 支持的体验。

2022 年 9 月

Azure 视觉 3.0/3.1 读取预览版弃用

Azure Vision 3.0 和 3.1 读取 API 的预览版计划于 2023 年 1 月 31 日停用。建议客户参考操作指南和快速入门，以开始使用正式发布版 (GA) 的读取 API。最新的 GA 版本具有以下优势：

2022 年正式发布的最新 OCR 模型
OCR 语言覆盖范围显著增大，包括支持手写文本
改进了 OCR 质量

2022 年 6 月

Vision Studio 推出

Vision Studio 是一种 UI 工具，可用于浏览、生成和集成 Azure Vision 的功能并将其集成到应用程序中。

Vision Studio 为你提供了一个平台，可用于试用多个服务功能，并以可视化的方式查看它们返回的内容。使用 Studio，无需编写代码即可开始操作，然后在应用程序中使用可用的客户端库和 REST API。

用于人脸的负责任 AI

人脸透明度说明

透明度说明提供了相关指导，通过将融合有意义的人工评审来检测和解决错误识别或其他故障案例、向认为其结果不正确的人员提供支持以及识别和处理因操作条件变化而导致的准确度波动，从而帮助客户提高其系统的准确度和公平性。

停用敏感属性

我们已经停用了面部分析功能，这些功能旨在推断情绪状态和身份属性，如性别、年龄、微笑、面部毛发、头发和化妆。
面部检测功能（包括检测模糊、曝光、眼镜、头部姿势、特征点、噪音、阻挡物、面部轮廓）将仍然普遍可用，并且不需要应用程序。

Fairlearn 包和 Microsoft 的公平性仪表板

开源 Fairlearn 包和 Microsoft 的公平性仪表板旨在支持客户根据自己的数据衡量 Microsoft 面部验证算法的公平性，使他们能够在部署技术之前识别和解决可能影响不同人群的潜在公平性问题。

受限访问策略

在使人脸 API 和更新的负责任 AI 标准保持一致的过程中，已为人脸 API 和 Azure 计算机视觉实施新的受限访问策略。现有客户有一年的时间可以根据他们提供的用例申请继续访问面部识别服务并获得批准。在此处查看有关“有限访问人脸识别”的详细信息。

Azure Vision 3.2-preview 即将停用

API 3.2 预览版已计划于 2022 年 12 月停用。建议客户改用 API 正式版 (GA)。从 3.2 预览版迁移时请注意以下更改：

分析图像和读取 API 调用现在采用可选的 model-version 参数，该参数可用于指定要使用的 AI 模型。默认情况下，它们使用最新模型。
分析图像和读取 API 调用还会在成功的 API 响应中返回 model-version 字段。此字段报告使用了哪个模型。
图像分析 API 现在使用不同的错误报告格式。请参阅 API 参考文档详细了解如何调整任何错误处理代码。

2022 年 5 月

OCR（读取）API 模型已正式发布 (GA)

Azure 视觉的 OCR （读取） API 最新模型，支持 164 种语言现已正式发布为云服务和容器。

OCR 支持的打印文本扩展到 164 种新语言（包括俄语、阿拉伯语、印地语以及使用西里尔文字母、阿拉伯字母和梵文字母的其他语言）。
OCR 支持的手写文本扩展到 9 种语言，即英语、简体中文、法语、德语、意大利语、日语、韩语、葡萄牙语和西班牙语。
增强了对单个字符、手写日期、数量、名称、通常在收据和发票中找到的其他实体的支持。
改进了对数字 PDF 文档的处理。
输入文件大小限制提高 10 倍至 500 MB。
性能和延迟方面的改进。
可用作云服务和 Docker 容器。

请参阅 OCR 操作指南，了解如何使用 GA 模型。

读取 API 入门

2022 年 2 月

OCR（读取）API 公共预览版支持 164 种语言

Azure 视觉的 OCR （读取） API 在最新预览版中将支持的语言扩展到 164 种：

OCR 支持的打印文本扩展到 42 种新语言（包括阿拉伯语、印度语以及使用阿拉伯字母和梵文字母的其他语言）。
除了英语、简体中文、法语、德语、意大利语、葡萄牙语和西班牙语外，OCR 支持的手写文本还扩展到日语和韩语。
增强功能包括更好支持提取手写日期、数量、名称和单个字符框。
常规性能和 AI 质量改进

请参阅 OCR 操作指南，了解如何使用新的预览功能。

读取 API 入门

Detection_01 和 Detection_03 中的新质量属性

为了帮助系统构建者和客户从人脸 API 获取高质量输出所需的高质量图像，我们引入了新的质量属性 QualityForRecognition，用于帮助确定图像是否具有足够高的质量来尝试进行人脸识别。非正式评级值为低、中或高。该新属性在使用检测模型 detection_01 或 detection_03 以及识别模型 recognition_03 或 recognition_04 的任意组合时可用。建议仅将“高”质量图像用于人员登记，“中等”以上质量的图像用于识别方案。若要详细了解该新质量属性，请参阅人脸检测和属性，并了解如何将其与快速入门配合使用。

2021 年 9 月

OCR（读取）API 公共预览版支持 122 种语言

Azure 视觉的 OCR（读取）API 在最新预览版中将支持的语言增加至 122 种：

OCR 支持，针对 49 种新语言（包括俄语、保加利亚语、其他西里尔语和其他拉丁语）的打印文本。
OCR 支持，针对 6 种新语言（包括英语、简体中文、法语、德语、意大利语、葡萄牙语和西班牙语）的手写文本。
增强功能，用于处理标识文档中的数字 PDF 和计算机可读区域 (MRZ) 文本。
常规性能和 AI 质量改进

请参阅 OCR 操作指南，了解如何使用新的预览功能。

读取 API 入门

2021 年 8 月

图像标记语言扩展

图像标记器的最新版本 (v3.2) 现支持 50 种语言的标记。有关详细信息，请参阅语言支持页。

2021 年 7 月

面向 Detection_03 的新的 HeadPose 和特征点改进

Detection_03 模型现已更新，可支持面部特征点。
Detection_03 中的特征点功能更加精确，尤其是在对视线跟踪至关重要的眼球特征点方面。

2021 年 5 月

空间分析容器更新

已发布提供新功能集的空间分析容器新版本。借助此 Docker 容器，可分析实时流视频，了解人们与他们在物理环境中的移动之间的空间关系。

现可配置空间分析操作来检测人面朝的方向。
- 可通过配置 personcrossingline 参数，为 personcrossingpolygon 和 enable_orientation 操作启用方向分类器。默认情况下，此选项设置为 off。
空间分析操作现在还提供可检测人步行/奔跑速度的配置
- 可以通过打开 personcrossingline 分类器（默认情况下为关闭状态）来检测 personcrossingpolygon 和 enable_speed 操作的速度。输出结果反映在 speed、avgSpeed 和 minSpeed 输出中。

2021 年 4 月

Azure Vision v3.2 正式版

Azure 视觉 API v3.2 现已全面可用，并包括以下更新内容：

改善了图像标记模型：根据图像中显示的对象、操作和内容分析视觉对象内容并生成相关标记。此模型通过标记图像 API 提供。有关详细信息，请参阅图像分析操作指南和概述。
更新的内容审查模型：检测是否存在成人内容并提供标志来筛选包含成人、猥亵和血腥视觉内容的图像。可通过分析 API 获取此模型。有关详细信息，请参阅图像分析操作指南和概述。
用于 73 种语言的 OCR（读取），这些语言包括简体中文和繁体中文、日语、韩语和拉丁语言。
OCR (读取) 还可作为本地部署的 Distroless 容器。

请参阅 Azure Vision v3.2 正式版

PersonDirectory 数据结构（预览版）

为执行人脸识别操作（如识别和查找相似对象），人脸 API 客户需要创建一份 Person 对象的分类列表。新的 PersonDirectory 是一种数据结构，其中包含添加到目录的每个人员标识的唯一 ID、可选名称字符串和可选用户元数据字符串。目前，人脸 API 提供 LargePersonGroup 结构，该结构具有相似功能，但限制添加 100,0000 个身份识别。 PersonDirectory 结构最多可扩展到 750,00000 个标识。
PersonDirectory 和之前的数据结构之间还存在一个重大差异，即在将人脸添加到 Person 对象后，便无需再执行任何定型调用，因为更新进程会自动发生。有关更多详细信息，请参阅使用 PersonDirectory 结构。

2021 年 3 月

Azure Vision 3.2 公共预览版更新

Azure 视觉 API v3.2 公共预览版已更新。预览版包含所有 Azure 视觉功能以及更新的读取和分析 API。

请参阅 Azure Vision v3.2 公共预览版 3

2021 年 2 月

读取 API v3.2 公共预览版（带有对 73 种语言的 OCR 支持）

Azure 视觉读取 API v3.2 公共预览版（作为云服务和 Docker 容器提供）包括以下更新：

用于 73 种语言的 OCR，这些语言包括简体中文和繁体中文、日语、韩语和拉丁语言。
文本行输出的自然读取顺序（仅限拉丁语言）
文本行的手写样式分类以及置信度分数（仅限拉丁语言）。
对于多页文档，仅提取所选页面的文本。
可为本地部署用作 Distroless 容器。

若要了解详细信息，请参阅读取 API 操作指南。

使用读取 API v3.2 公共预览版

新的人脸 API 检测模型

新的“检测 03”模型是当前可用的最准确的检测模型。如果你是新客户，建议使用此模型。 “检测 03”提高了图像（64x64 像素）中找到的较小人脸的召回率和精准率。其他改进包括：全面降低了误报、改善了对转动的人脸方向的检测。将 Detection 03 与新的 Recognition 04 模型相结合也会提高识别准确度。有关更多详细信息，请参阅指定人脸检测模型。

新的可检测人脸属性

随最新的 Detection 03 模型提供了 faceMask 属性以及新增的属性 "noseAndMouthCovered"（用于检测是否按预期佩戴了面罩，覆盖了鼻子和嘴）。若要使用最新的面罩检测功能，用户需要在 API 请求中指定检测模型：通过 detectionModel 参数将模型版本指定为 detection_03。有关更多详细信息，请参阅指定人脸检测模型。

新的人脸 API 识别模型

新的“识别 04”模型是当前可用的最准确的识别模型。如果你是新客户，建议使用此模型进行验证和识别。它针对“识别 03”的准确度进行了改进，包括改进对佩戴面罩（外科口罩、N95 口罩、布口罩）的用户的识别。我们建议不要注册戴面罩的用户的图像，因为这会降低识别质量。现在，客户可以构建安全且无缝的用户体验，以便使用最新的“检测 03”模型来检测用户是否佩戴了面罩，然后使用最新的“识别 04”模型来识别他们。有关更多详细信息，请参阅指定人脸识别模型。

2021 年 1 月

空间分析容器更新

已发布提供新功能集的空间分析容器新版本。借助此 Docker 容器，可分析实时流视频，了解人们与他们在物理环境中的移动之间的空间关系。

现可配置空间分析操作来检测某人是否正戴着口罩等保护性面罩。
- 可通过配置 personcount 参数，为 personcrossingline、personcrossingpolygon 和 ENABLE_FACE_MASK_CLASSIFIER 操作启用口罩分类器。
- 系统将以元数据的形式返回 face_mask 和 face_noMask 属性，其中有在视频流中检测到的每个人的置信度分数
personcrossingpolygo 操作已得到扩展，可计算一个人在某个区域中的停留时间。可将该操作的区域配置中的 type 参数设置为 zonedwelltime，类型为 personZoneDwellTimeEvent 的新事件将包括字段，该字段填充了该人员在该区域中停留的毫秒数durationMs。
中断性变更：已将 personZoneEvent 事件重命名为 personZoneEnterExitEvent。此事件在某人进入或离开该区域时由 personcrossingpolygon 操作引发，并提供与所穿过区域的编号侧相关的方向信息。
可在所有操作中将视频 URL 作为“专用参数/已模糊处理”提供。模糊处理现在是可选操作，仅当 KEY 和 IV 作为环境变量提供时才有效。
默认情况下，对所有操作启用了校准。设置 do_calibration: false 可禁用它。
已通过 enable_recalibration 参数增加对自动重新校准的支持（默认禁用），请参阅空间分析操作了解有关详细信息
照相机校准参数设置为 DETECTOR_NODE_CONFIG。有关详细信息，请参阅空间分析操作。

缓解延迟

人脸团队发布了一篇新文章，其中详细介绍了使用该服务时的可能的延迟原因和可能的缓解策略。请参阅使用人脸服务时减少延迟。

2020 年 12 月

人脸 ID 存储的客户配置

尽管人脸服务不存储客户图像，但已提取的人脸特征将存储在服务器上。人脸 ID 是人脸特征的标识符，并且将在人脸 - 识别、人脸 - 验证和人脸 - 查找相似人脸中使用。在进行原始检测调用之后的 24 小时，存储的人脸特征将过期并将会被删除。客户现在可以决定这些人脸 ID 的缓存时间长度。最大值仍为 24 小时，但现在可以设置最小值 60 秒。缓存人脸 ID 的新时间范围是介于 60 秒和 24 小时之间的任何值。有关详细信息，请参阅人脸 - 检测 API 参考（faceIdTimeToLive 参数）。

2020 年 11 月

示例人脸注册应用

该团队发布了一个示例人脸注册应用，用于演示通过高质量注册确立有意义的同意和创建高准确度人脸识别系统的最佳做法。可在生成注册应用指南中和 GitHub 上找到开放源代码的示例，供开发人员部署或自定义。

2020 年 10 月

Azure 视觉 API v3.1 正式版

Azure 视觉 API 已在公共预览版中升级到 v3.1。

2020 年 9 月

空间分析容器预览版

空间分析容器现提供预览版。使用 Azure 视觉的空间分析功能，可以分析实时流式处理视频，以了解人员与其在物理环境中移动之间的空间关系。空间分析是一种可以在本地使用的 Docker 容器。

读取 API v3.1 公共预览版添加了日语的 OCR

Azure 视觉读取 API v3.1 公共预览版添加了这些功能：

日语的 OCR
对于每个文本行，指示呈现效果是手写体还是打印样式，并随附置信度评分（仅限拉丁语言）。
对于多页文档，仅提取所选页面或页面范围的文本。
此预览版本的读取 API 支持英语、荷兰语、法语、德语、意大利语、日语、葡萄牙语、简体中文和西班牙语。

若要了解详细信息，请参阅读取 API 操作指南。

详细了解读取 API v3.1 公共预览版 2

2020 年 8 月

客户管理的静态数据加密

人脸服务在将数据保存到云时会自动加密数据。人脸服务加密可以保护数据，以便帮助组织履行在安全性与合规性方面做出的承诺。默认情况下，订阅使用 Microsoft 托管的加密密钥。还有一个新选项可供你通过你自己的密钥（称为客户管理的密钥 (CMK)）管理订阅。有关更多详细信息，请参阅客户管理的密钥。

2020 年 7 月

读取 API v3.1 公共预览版包含简体中文的 OCR

Foundry Tools 中的 Azure 视觉读取 API v3.1 公共预览版添加了对简体中文的支持。

此预览版本的读取 API 支持英语、荷兰语、法语、德语、意大利语、葡萄牙语、简体中文和西班牙语。

若要了解详细信息，请参阅读取 API 操作指南。

详细了解读取 API v3.1 公共预览版 1

2020 年 5 月

Azure 视觉 API v3.0 进入一般可用性，并更新了 Read API。

支持英语、荷兰语、法语、德语、意大利语、葡萄牙语和西班牙语
准确度改进
每个已提取单词的置信度分数
新输出格式

若要了解详细信息，请参阅 OCR 概述。

2020 年 4 月

新的人脸 API 识别模型

新的“识别 03”模型是当前可用的最准确的模型。如果你是新客户，建议使用此模型。 Recognition 03 在相似性比较和人员匹配比较方面提供了更高的准确性。有关更多详细信息，请参阅指定人脸识别模型。

2020 年 3 月

现在，将对此服务的所有 HTTP 请求强制执行 TLS 1.2。有关详细信息，请参阅 Foundry Tools 安全性。

2020 年 1 月

读取 API 3.0 公共预览版

现在，可以使用 Read API 3.0 版从图像中提取印刷体文本或手写文本。与早期版本相比，3.0 版提供了：

准确度改进
新输出格式
每个已提取单词的置信度分数
使用语言参数同时支持西班牙语和英语

按照提取文本快速入门，开始使用 3.0 API。

2019 年 6 月

新的人脸 API 检测模型

新的“检测 02”模型功能提高了较小的、侧面的、遮蔽的和模糊的人脸的检测准确度。通过人脸 - 检测、FaceList - 添加人脸、LargeFaceList - 添加人脸、PersonGroup Person - 添加人脸和 LargePersonGroup Person - 添加人脸来使用它，只需在 detection_02 参数中指定新的人脸检测模型名称 detectionModel 即可。如何指定检测模型中提供了更多详细信息。

2019 年 4 月

提高了属性准确度

提高了 age 和 headPose 属性的总体准确性。此外还更新了 headPose 属性，pitch 值现已启用。使用这些属性的方法是在returnFaceAttributes参数的 returnFaceAttributes 参数中指定它们。

提高了处理速度

提高了人脸 - 检测、FaceList - 添加人脸、LargeFaceList - 添加人脸、PersonGroup 人员 - 添加人脸和 LargePersonGroup 人员 - 添加人脸操作的速度。

2019 年 3 月

新的人脸 API 识别模型

“识别 02”模型的准确度已提高。通过人脸 - 检测、FaceList - 创建、LargeFaceList - 创建、PersonGroup - 创建和 LargePersonGroup - 创建来使用它，只需在 recognition_02 参数中指定新的人脸识别模型名称 recognitionModel 即可。如何指定识别模型中提供了更多详细信息。

2019 年 1 月

人脸快照功能

此功能使服务可以支持跨订阅进行数据迁移：快照。

重要说明

人脸快照 API 已于 2023 年 6 月 30 停用。

2018 年 10 月

API 消息

在 status、createdDateTime和 lastActionDateTime中完善了对 lastSuccessfulTrainingDateTime、、和的说明。

2018 年 5 月

提高了属性准确度

显着改进了 gender 属性，还改进了 age、glasses、facialHair、hair、makeup 属性。通过人脸 - 检测returnFaceAttributes 参数使用这些属性。

增加了文件大小限制

在以下部分中将输入图像文件大小限制从 4 MB 增加到了 6 MB：人脸 - 检测、FaceList - 添加人脸、LargeFaceList - 添加人脸、PersonGroup 人员 - 添加人脸和 LargePersonGroup人员 - 添加人脸。

2018 年 3月

新的数据结构

LargeFaceList 和 LargePersonGroup。有关详细信息，请参阅如何缩放以处理更多注册用户。
将人脸 - 识别maxNumOfCandidatesReturned 参数从 [1, 5] 增加到了 [1, 100]，默认为 10。

2017 年 5 月

新的可检测人脸属性

在hairmakeup 参数中添加了 accessory、occlusion、blur、exposure、noise、和 returnFaceAttributes 属性。
在 PersonGroup 和人脸 - 识别中支持 10K 人员。
在带可选参数和 start 的 top中支持分页。
支持在针对 PersonGroup 中的不同 FaceLists 和不同人员添加/删除人脸时的并发性。

2017 年 3 月

新的可检测人脸属性

在emotion 参数中添加了 returnFaceAttributes 属性。

修复的问题

无法使用从人脸 - 检测返回的矩形重新将人脸检测为 targetFace和 PersonGroup 人员 - 添加人脸中的。
设置了可检测的人脸大小，以确保它一定在 36x36 到 4096x4096 像素之间。

2016 年 11 月

新的订阅层

添加了人脸存储标准订阅以在使用 PersonGroup 人员 - 添加人脸或 FaceList - 添加人脸进行标识或相似性匹配时存储额外的持久性人脸。存储的图像按每 1000 张人脸 0.5 美元收费，每天以此费率按比例计费。免费层订阅的总人数仍限制为 1,000 人。

2016 年 10 月

API 消息

在 targetFace和 PersonGroup 人员 - 添加人脸中将中多个人脸的错误消息从“There are more than one face in the image”更改为“There is more than one face in the image”。

2016 年 7 月

新增功能

支持在人脸 - 验证中进行人脸到人员对象身份验证。
添加了可选的 mode 参数，可以选择两种工作模式：matchPerson中的 matchFace 和，默认值为 matchPerson。
为用户添加了可选的 confidenceThreshold 参数，以设置一个人脸是否属于人脸 - 识别中的 Person 对象的阈值。
在 start中添加了可选的 top 和参数，使用户能够指定要列出的起点和总 PersonGroup 数。

从 V0 进行的 V1.0 更改

将服务根终结点从 https://westus.api.cognitive.microsoft.com/face/v0/ 更改为 https://westus.api.cognitive.microsoft.com/face/v1.0/。更改已应用于：人脸 - 检测、人脸 - 识别、人脸 - 查找相似和人脸 - 组。
将最小可检测人脸大小更新为 36x36 像素。将不会检测到小于 36x36 像素的人脸。
已弃用人脸 V0 中的 PersonGroup 和 Person 数据。使用人脸 V1.0 服务无法访问这些数据。
于 2016 年 6 月 30 日弃用了人脸 API 的 V0 终结点。

Foundry 工具更新

Foundry 工具的 Azure 更新公告

反馈

此页面是否有帮助？

Last updated on 2025-11-18