计算机视觉

已完成

了解计算机视觉的关键要点包括:

  • 计算机视觉通过使用大量的图像来训练模型来实现。
  • 图像分类 是计算机视觉的一种形式,其中模型使用带有图像主主题标签的图像(换句话说,图像中是什么)进行训练,以便它可以分析未标记的图像并预测最合适的标签——识别图像的主题。
  • 对象检测 是计算机视觉的一种形式,在该视觉中训练模型以识别图像中特定对象的位置。
  • 计算机视觉有更高级的形式-例如, 语义分段 是对象检测的高级形式,而不是通过绘制对象周围的框来指示对象的位置,模型可以识别属于特定对象的图像中的单个像素。
  • 你可以结合计算机视觉和语言模型来创建一个 多模式 模型,该模型结合了计算机视觉和生成 AI 功能。

计算机视觉场景

计算机视觉的常见用途包括:

  • 为照片自动生成标题或标签。
  • 视觉搜索。
  • 在零售场景中监控库存水平或识别需要结账的商品。
  • 安全视频监视。
  • 通过面部识别进行身份验证。
  • 机器人和自动驾驶汽车。