可以使用默认索引设置,也可以对其进行调整。 可以选择对生成的见解、成本和性能产生影响的语言、索引、自定义模型和流式处理设置。
本文介绍每个选项。 使用 Azure AI 视频索引器网站 (请参阅 API 指南)时,相同的选项适用。 为大量内容编制索引时,请遵循大规模索引编制指南。
默认设置
默认情况下,Azure AI 视频索引器配置为:
- 源语言:英语
- 隐私:专用
- 音频和视频设置:标准
- 流媒体质量:单比特率
视频源语言
如果你知道视频中讲述的语言,请从视频源语言列表中选择该语言。 如果你不确定视频的语言,请选择“自动检测单一语言”。 Azure AI 视频索引器使用语言标识(LID)来检测视频语言,并使用检测到的语言生成听录和见解。
如果视频包含多种语言且不确定哪些语言,请选择“自动检测多语言”。 在这种情况下,上传和编制视频索引时,将应用多语言(MLID)检测。
虽然当视频中的语言变化时,自动检测是一个很好的选择,但在使用 LID 或 MLID 时需要考虑两点:
- LID/MLID 不支持 Azure AI 视频索引器支持的所有语言。
- 在预先选择视频的适当语言时,听录质量更高。
详细了解语言支持和支持的语言。
隐私
使用此选项可以确定见解是否只能供 Azure AI 视频索引器帐户中的用户或具有链接的任何人访问。
索引选项
使用默认索引设置时,每个音频和视频索引选项的价格可能有所不同。 有关详细信息,请参阅 Azure AI 视频索引器定价 。
下面是索引类型选项,其中包含提供其见解的详细信息。 若要修改索引编制类型,请选择“高级设置”。
注意
光学字符识别(OCR)与多种见解类型一起使用。
高级设置
选择 “高级设置”时,可以选择以下选项:
仅音频
-
基本:仅使用音频索引和提取见解(忽略视频),并提供以下见解:
- 转录
- 翻译
- 输出字幕和字幕的格式设置(隐藏式字幕)
-
标准:仅使用音频索引和提取见解(忽略视频),并提供以下见解:
- 转录
- 翻译
- 输出字幕和字幕的格式设置(隐藏式字幕)
- 自动语言检测
- 情绪
- 关键字
- 命名实体(品牌、位置、人员)
- 情绪
- 扬声器
- 主题提取
- 文本内容审查
-
高级:仅使用音频索引和提取见解(忽略视频),并提供以下见解:
- 转录
- 翻译
- 输出字幕和字幕的格式设置(隐藏式字幕)
- 自动语言检测
- 音频事件检测
- 情绪
- 关键字
- 命名实体(品牌、位置、人员)
- 情绪
- 扬声器
- 主题提取
- 文本内容审查
仅视频
-
基本:仅使用视频索引和提取见解(忽略音频),并提供以下见解:
- 标签
- 对象检测
- 光学字符识别 (OCR)
- 场景(关键帧和镜头)
- 黑帧检测
-
标准:仅使用视频索引和提取见解(忽略音频),并提供以下见解:
- 标签 (OCR)
- 命名实体(OCR - 品牌、地点、人物)
- 光学字符识别 (OCR)
- 人员
- 场景(关键帧和镜头)
- 黑色框架
- 视觉内容审核
- 主题提取(OCR)
-
高级:仅使用视频索引和提取见解(忽略音频),并提供以下见解:
- 标签 (OCR)
- 匹配的人员
- 命名实体(OCR - 品牌、地点、人物)
- 光学字符识别 (OCR)
- 被观察人员
- 人员
- 场景(关键帧和镜头)
- 场记板检测
- 数字模式检测
- 特色服装见解
- 无文本石板检测
- 文本徽标检测
- 黑色框架
- 视觉内容审核
- 主题提取(OCR)
音频和视频
-
基本:使用音频和视频为见解编制索引并提取见解,并提供以下见解:
- 转录
- 翻译
- 输出字幕和字幕的格式设置(隐藏式字幕)
- 对象检测
- 光学字符识别 (OCR)
- 场景(关键帧和镜头)
- 黑色框架
-
标准:使用音频和视频为见解编制索引并提取见解,并提供以下见解:
- 转录
- 翻译
- 输出字幕和字幕的格式设置(隐藏式字幕)
- 自动语言检测
- 情绪
- 关键字
- 命名实体(品牌、位置、人员)
- 光学字符识别 (OCR)
- 场景(关键帧和镜头)
- 黑色框架
- 视觉内容审核
- 人员
- 情绪
- 扬声器
- 主题提取
- 文本内容审查
-
高级:使用音频和视频编制索引和提取见解,并提供以下见解:
- 转录
- 翻译
- 输出字幕和字幕的格式设置(隐藏式字幕)
- 自动语言检测
- 文本内容审查
- 音频事件检测
- 情绪
- 关键字
- 匹配的人员
- 命名实体(品牌、位置、人员)
- 光学字符识别 (OCR)
- 被观察人员
- 人员
- 场记板检测
- 数字模式检测
- 特色服装见解
- 无文本石板检测
- 情绪
- 扬声器
- 场景(关键帧和镜头)
- 文本徽标检测
- 黑色框架
- 视觉内容审核
- 主题提取
流媒体质量选项
播放已索引的视频有两个选项:
- 单比特率:如果视频高度大于或等于 720p HD,则 Azure AI 视频索引器使用分辨率为 1280 x 720 对其进行编码。 否则,其编码为 640 x 468。
- 无流式处理:生成见解但不执行流式处理操作,并且不会在 Azure AI 视频索引器网站上提供视频。 如果选择“无流式处理”,则无需为编码付费。
排除模型
通过 VI 网站和 API 编制索引时,可以排除模型。 使用网站将视频上传到索引时,请选择“高级设置>索引预设”,然后选择要从索引结果中排除的 AI 模型。 它能够实现更高效的索引并给出仅包含你感兴趣的见解的 VI 结果。
自定义内容模型
Azure AI 视频索引器允许自定义其某些模型,使其适应特定的用例。 这些模型包括 品牌、 语言、 人物和 语音。
洞察和媒体存储
以下部分介绍了如何在 Azure AI 视频索引器中存储见解和媒体。
见解存储
所有索引见解和元数据都保存在由 VI 管理的存储帐户中,不会为此存储付费。
媒体存储
VI 帐户已连接到Azure 存储帐户。 您控制并支付此存储帐户的使用。 当为视频编制索引时,以下文件存储在此帐户中:
- 源文件。 在将来你需要重新编制视频索引时,它会被保留。
- 当流式处理质量设置为单比特率时,新的编码文件。
删除媒体
索引媒体及其所有关联的文件和见解可以通过三种方式删除:
- 使用 视频索引器门户删除文件。
- 使用 “删除视频 ”或 “删除视频源文件 API”请求。
- 如果使用 API 时,如果不需要将原始媒体文件保留在存储中,请将
retentionPeriod参数设置为 1-7 之间。 索引视频及其相关内容、源文件、见解等在编制索引后 1-7 天内被删除。