计算机视觉
了解计算机视觉的关键要点包括:
- 计算机视觉通过使用大量的图像来训练模型来实现。
- 图像分类 是计算机视觉的一种形式,其中模型使用带有图像主主题标签的图像(换句话说,图像中是什么)进行训练,以便它可以分析未标记的图像并预测最合适的标签——识别图像的主题。
- 对象检测 是计算机视觉的一种形式,在该视觉中训练模型以识别图像中特定对象的位置。
- 计算机视觉有更高级的形式-例如, 语义分段 是对象检测的高级形式,而不是通过绘制对象周围的框来指示对象的位置,模型可以识别属于特定对象的图像中的单个像素。
- 你可以结合计算机视觉和语言模型来创建一个 多模式 模型,该模型结合了计算机视觉和生成 AI 功能。
计算机视觉场景
计算机视觉的常见用途包括:
- 为照片自动生成标题或标签。
- 视觉搜索。
- 在零售场景中监控库存水平或识别需要结账的商品。
- 安全视频监视。
- 通过面部识别进行身份验证。
- 机器人和自动驾驶汽车。