使用 Azure 视觉提取信息
需要从照片或小型扫描文档(如名片或菜单)中提取见解时,Azure 视觉图像分析服务是一个不错的选择。
自动字幕和标记生成
可以使用 Azure 视觉图像分析生成与图像关联的描述性文本。 该服务可以分析图像并生成:
- 描述图像的 标题 。
- 针对图像中的主要对象建议的一组密集辅助字幕。
- 帮助对图像进行分类的 标记 集合。
例如,假设你想要捕获与此映像相关的关键详细信息:
AI 视觉图像分析服务生成以下描述性文本值。
- 标题:一个男人牵着狗散步
-
密集辅助字幕:
- 一个男人牵着狗散步
- 一名男子在街上行走
- 街上的黄色汽车
- 街上的黄色汽车
- 绿色电话亭,带有绿色标志
-
标记:
- 户外
- 陆地车辆
- 车辆
- 建筑物
- 道路
- 街道
- wheel
- 出租车
- 人
- 服装
- 汽车
- 狗
- 黄色
- 步行
- 城市
对象检测
Azure 视觉图像分析还可以检测图像中的常见对象和人员。
例如,请考虑下图:
。
Azure 视觉图像分析可检测此图像中对象的类型和位置,如下所示:
。
光学字符识别 (OCR)
当图像包含打印文本或手写文本时,Azure 视觉图像分析可以使用一种称为光学字符识别(OCR)的技术来确定每行文本的位置和内容以及每个单词。 如果需要读取图像中的文本以供进一步处理,例如使用手机应用程序翻译菜单,Azure 视觉图像分析的 OCR 功能非常有用。 Azure 视觉图像分析还可用于从简单文档中提取少量自由格式文本:例如,从名片中提取联系人详细信息。
请考虑以下扫描名片:
可以使用 Azure 视觉图像分析查找和提取此卡片中的文本,结果如下:
Adventure Works Cycles
Roberto Tamburello
Engineering Manager
roberto@adventure-works.com
555-123-4567