使用 Azure 视觉提取信息

5 分钟

需要从照片或小型扫描文档（如名片或菜单）中提取见解时，Azure 视觉图像分析服务是一个不错的选择。

自动字幕和标记生成

可以使用 Azure 视觉图像分析生成与图像关联的描述性文本。该服务可以分析图像并生成：

描述图像的标题。
针对图像中的主要对象建议的一组密集辅助字幕。
帮助对图像进行分类的标记集合。

例如，假设你想要捕获与此映像相关的关键详细信息：

一名男子在繁忙街道上遛狗的照片。

AI 视觉图像分析服务生成以下描述性文本值。

标题：一个男人牵着狗散步
密集辅助字幕：
- 一个男人牵着狗散步
- 一名男子在街上行走
- 街上的黄色汽车
- 街上的黄色汽车
- 绿色电话亭，带有绿色标志
标记：
- 户外
- 陆地车辆
- 车辆
- 建筑物
- 道路
- 街道
- wheel
- 出租车
- 人
- 服装
- 汽车
- 狗
- 黄色
- 步行
- 城市

对象检测

Azure 视觉图像分析还可以检测图像中的常见对象和人员。

例如，请考虑下图：

苹果、香蕉和橙色的照片。

Azure 视觉图像分析可检测此图像中对象的类型和位置，如下所示：

水果的照片，其中突出显示了苹果、香蕉和橙子的位置。

光学字符识别 (OCR)

当图像包含打印文本或手写文本时，Azure 视觉图像分析可以使用一种称为光学字符识别（OCR）的技术来确定每行文本的位置和内容以及每个单词。 如果需要读取图像中的文本以供进一步处理，例如使用手机应用程序翻译菜单，Azure 视觉图像分析的 OCR 功能非常有用。 Azure 视觉图像分析还可用于从简单文档中提取少量自由格式文本：例如，从名片中提取联系人详细信息。

请考虑以下扫描名片：

名片的照片。

可以使用 Azure 视觉图像分析查找和提取此卡片中的文本，结果如下：

突出显示文本的名片的照片。

Adventure Works Cycles
Roberto Tamburello
Engineering Manager
roberto@adventure-works.com
555-123-4567

反馈

此页面是否有帮助？