索引配置选项

可以使用默认索引设置,也可以对其进行调整。 可以选择对生成的见解、成本和性能产生影响的语言、索引、自定义模型和流式处理设置。

本文介绍每个选项。 使用 Azure AI 视频索引器网站 (请参阅 API 指南)时,相同的选项适用。 为大量内容编制索引时,请遵循大规模索引编制指南

默认设置

默认情况下,Azure AI 视频索引器配置为:

  • 源语言:英语
  • 隐私:专用
  • 音频和视频设置:标准
  • 流媒体质量:单比特率

视频源语言

如果你知道视频中讲述的语言,请从视频源语言列表中选择该语言。 如果你不确定视频的语言,请选择“自动检测单一语言”。 Azure AI 视频索引器使用语言标识(LID)来检测视频语言,并使用检测到的语言生成听录和见解。

如果视频包含多种语言且不确定哪些语言,请选择“自动检测多语言”。 在这种情况下,上传和编制视频索引时,将应用多语言(MLID)检测。

虽然当视频中的语言变化时,自动检测是一个很好的选择,但在使用 LID 或 MLID 时需要考虑两点:

  • LID/MLID 不支持 Azure AI 视频索引器支持的所有语言。
  • 在预先选择视频的适当语言时,听录质量更高。

详细了解语言支持和支持的语言

隐私

使用此选项可以确定见解是否只能供 Azure AI 视频索引器帐户中的用户或具有链接的任何人访问。

索引选项

使用默认索引设置时,每个音频和视频索引选项的价格可能有所不同。 有关详细信息,请参阅 Azure AI 视频索引器定价

下面是索引类型选项,其中包含提供其见解的详细信息。 若要修改索引编制类型,请选择“高级设置”。

注意

光学字符识别(OCR)与多种见解类型一起使用。

高级设置

选择 “高级设置”时,可以选择以下选项:

仅音频

  • 基本:仅使用音频索引和提取见解(忽略视频),并提供以下见解:
    • 转录
    • 翻译
    • 输出字幕和字幕的格式设置(隐藏式字幕)
  • 标准:仅使用音频索引和提取见解(忽略视频),并提供以下见解:
    • 转录
    • 翻译
    • 输出字幕和字幕的格式设置(隐藏式字幕)
    • 自动语言检测
    • 情绪
    • 关键字
    • 命名实体(品牌、位置、人员)
    • 情绪
    • 扬声器
    • 主题提取
    • 文本内容审查
  • 高级:仅使用音频索引和提取见解(忽略视频),并提供以下见解:
    • 转录
    • 翻译
    • 输出字幕和字幕的格式设置(隐藏式字幕)
    • 自动语言检测
    • 音频事件检测
    • 情绪
    • 关键字
    • 命名实体(品牌、位置、人员)
    • 情绪
    • 扬声器
    • 主题提取
    • 文本内容审查

仅视频

  • 基本:仅使用视频索引和提取见解(忽略音频),并提供以下见解:
    • 标签
    • 对象检测
    • 光学字符识别 (OCR)
    • 场景(关键帧和镜头)
    • 黑帧检测
  • 标准:仅使用视频索引和提取见解(忽略音频),并提供以下见解:
    • 标签 (OCR)
    • 命名实体(OCR - 品牌、地点、人物)
    • 光学字符识别 (OCR)
    • 人员
    • 场景(关键帧和镜头)
    • 黑色框架
    • 视觉内容审核
    • 主题提取(OCR)
  • 高级:仅使用视频索引和提取见解(忽略音频),并提供以下见解:
    • 标签 (OCR)
    • 匹配的人员
    • 命名实体(OCR - 品牌、地点、人物)
    • 光学字符识别 (OCR)
    • 被观察人员
    • 人员
    • 场景(关键帧和镜头)
    • 场记板检测
    • 数字模式检测
    • 特色服装见解
    • 无文本石板检测
    • 文本徽标检测
    • 黑色框架
    • 视觉内容审核
    • 主题提取(OCR)

音频和视频

  • 基本:使用音频和视频为见解编制索引并提取见解,并提供以下见解:
    • 转录
    • 翻译
    • 输出字幕和字幕的格式设置(隐藏式字幕)
    • 对象检测
    • 光学字符识别 (OCR)
    • 场景(关键帧和镜头)
    • 黑色框架
  • 标准:使用音频和视频为见解编制索引并提取见解,并提供以下见解:
    • 转录
    • 翻译
    • 输出字幕和字幕的格式设置(隐藏式字幕)
    • 自动语言检测
    • 情绪
    • 关键字
    • 命名实体(品牌、位置、人员)
    • 光学字符识别 (OCR)
    • 场景(关键帧和镜头)
    • 黑色框架
    • 视觉内容审核
    • 人员
    • 情绪
    • 扬声器
    • 主题提取
    • 文本内容审查
  • 高级:使用音频和视频编制索引和提取见解,并提供以下见解:
    • 转录
    • 翻译
    • 输出字幕和字幕的格式设置(隐藏式字幕)
    • 自动语言检测
    • 文本内容审查
    • 音频事件检测
    • 情绪
    • 关键字
    • 匹配的人员
    • 命名实体(品牌、位置、人员)
    • 光学字符识别 (OCR)
    • 被观察人员
    • 人员
    • 场记板检测
    • 数字模式检测
    • 特色服装见解
    • 无文本石板检测
    • 情绪
    • 扬声器
    • 场景(关键帧和镜头)
    • 文本徽标检测
    • 黑色框架
    • 视觉内容审核
    • 主题提取

流媒体质量选项

播放已索引的视频有两个选项:

  • 单比特率:如果视频高度大于或等于 720p HD,则 Azure AI 视频索引器使用分辨率为 1280 x 720 对其进行编码。 否则,其编码为 640 x 468。
  • 无流式处理:生成见解但不执行流式处理操作,并且不会在 Azure AI 视频索引器网站上提供视频。 如果选择“无流式处理”,则无需为编码付费。

排除模型

通过 VI 网站和 API 编制索引时,可以排除模型。 使用网站将视频上传到索引时,请选择“高级设置>索引预设”,然后选择要从索引结果中排除的 AI 模型。 它能够实现更高效的索引并给出仅包含你感兴趣的见解的 VI 结果。

自定义内容模型

Azure AI 视频索引器允许自定义其某些模型,使其适应特定的用例。 这些模型包括 品牌语言人物语音

洞察和媒体存储

以下部分介绍了如何在 Azure AI 视频索引器中存储见解和媒体。

见解存储

所有索引见解和元数据都保存在由 VI 管理的存储帐户中,不会为此存储付费。

媒体存储

VI 帐户已连接到Azure 存储帐户。 您控制并支付此存储帐户的使用。 当为视频编制索引时,以下文件存储在此帐户中:

  • 源文件。 在将来你需要重新编制视频索引时,它会被保留。
  • 当流式处理质量设置为单比特率时,新的编码文件。

删除媒体

索引媒体及其所有关联的文件和见解可以通过三种方式删除:

  • 使用 视频索引器门户删除文件。
  • 使用 “删除视频 ”或 “删除视频源文件 API”请求。
  • 如果使用 API 时,如果不需要将原始媒体文件保留在存储中,请将 retentionPeriod 参数设置为 1-7 之间。 索引视频及其相关内容、源文件、见解等在编制索引后 1-7 天内被删除。