使用 Azure 视觉提取信息

已完成

需要从照片或小型扫描文档(如名片或菜单)中提取见解时,Azure 视觉图像分析服务是一个不错的选择。

自动字幕和标记生成

可以使用 Azure 视觉图像分析生成与图像关联的描述性文本。 该服务可以分析图像并生成:

  • 描述图像的 标题
  • 针对图像中的主要对象建议的一组密集辅助字幕
  • 帮助对图像进行分类的 标记 集合。

例如,假设你想要捕获与此映像相关的关键详细信息:

一名男子在繁忙街道上遛狗的照片。

AI 视觉图像分析服务生成以下描述性文本值。

  • 标题:一个男人牵着狗散步
  • 密集辅助字幕
    • 一个男人牵着狗散步
    • 一名男子在街上行走
    • 街上的黄色汽车
    • 街上的黄色汽车
    • 绿色电话亭,带有绿色标志
  • 标记
    • 户外
    • 陆地车辆
    • 车辆
    • 建筑物
    • 道路
    • 街道
    • wheel
    • 出租车
    • 服装
    • 汽车
    • 黄色
    • 步行
    • 城市

对象检测

Azure 视觉图像分析还可以检测图像中的常见对象和人员。

例如,请考虑下图:

苹果、香蕉和橙色的照片

Azure 视觉图像分析可检测此图像中对象的类型和位置,如下所示:

水果的照片,其中突出显示了苹果、香蕉和橙子的位置

光学字符识别 (OCR)

当图像包含打印文本或手写文本时,Azure 视觉图像分析可以使用一种称为光学字符识别(OCR)的技术来确定每文本的位置和内容以及每个单词。 如果需要读取图像中的文本以供进一步处理,例如使用手机应用程序翻译菜单,Azure 视觉图像分析的 OCR 功能非常有用。 Azure 视觉图像分析还可用于从简单文档中提取少量自由格式文本:例如,从名片中提取联系人详细信息。

请考虑以下扫描名片:

名片的照片。

可以使用 Azure 视觉图像分析查找和提取此卡片中的文本,结果如下:

突出显示文本的名片的照片。

Adventure Works Cycles
Roberto Tamburello
Engineering Manager
roberto@adventure-works.com
555-123-4567