索引配置选项

可以使用默认索引设置，也可以对其进行调整。可以选择对生成的见解、成本和性能产生影响的语言、索引、自定义模型和流式处理设置。

本文介绍每个选项。使用 Azure AI 视频索引器网站（请参阅 API 指南）时，相同的选项适用。为大量内容编制索引时，请遵循大规模索引编制指南。

默认设置

默认情况下，Azure AI 视频索引器配置为：

源语言：英语
隐私：专用
音频和视频设置：标准
流媒体质量：单比特率

视频源语言

如果你知道视频中讲述的语言，请从视频源语言列表中选择该语言。如果你不确定视频的语言，请选择“自动检测单一语言”。 Azure AI 视频索引器使用语言标识（LID）来检测视频语言，并使用检测到的语言生成听录和见解。

如果视频包含多种语言且不确定哪些语言，请选择“自动检测多语言”。在这种情况下，上传和编制视频索引时，将应用多语言（MLID）检测。

虽然当视频中的语言变化时，自动检测是一个很好的选择，但在使用 LID 或 MLID 时需要考虑两点：

LID/MLID 不支持 Azure AI 视频索引器支持的所有语言。
在预先选择视频的适当语言时，听录质量更高。

详细了解语言支持和支持的语言。

隐私

使用此选项可以确定见解是否只能供 Azure AI 视频索引器帐户中的用户或具有链接的任何人访问。

索引选项

使用默认索引设置时，每个音频和视频索引选项的价格可能有所不同。有关详细信息，请参阅 Azure AI 视频索引器定价。

下面是索引类型选项，其中包含提供其见解的详细信息。若要修改索引编制类型，请选择“高级设置”。

注意

光学字符识别（OCR）与多种见解类型一起使用。

高级设置

选择 “高级设置”时，可以选择以下选项：

仅音频

基本：仅使用音频索引和提取见解（忽略视频），并提供以下见解：
- 转录
- 翻译
- 输出字幕和字幕的格式设置（隐藏式字幕）
标准：仅使用音频索引和提取见解（忽略视频），并提供以下见解：
- 转录
- 翻译
- 输出字幕和字幕的格式设置（隐藏式字幕）
- 自动语言检测
- 情绪
- 关键字
- 命名实体（品牌、位置、人员）
- 情绪
- 扬声器
- 主题提取
- 文本内容审查
高级：仅使用音频索引和提取见解（忽略视频），并提供以下见解：
- 转录
- 翻译
- 输出字幕和字幕的格式设置（隐藏式字幕）
- 自动语言检测
- 音频事件检测
- 情绪
- 关键字
- 命名实体（品牌、位置、人员）
- 情绪
- 扬声器
- 主题提取
- 文本内容审查

仅视频

基本：仅使用视频索引和提取见解（忽略音频），并提供以下见解：
- 标签
- 对象检测
- 光学字符识别 (OCR)
- 场景（关键帧和镜头）
- 黑帧检测
标准：仅使用视频索引和提取见解（忽略音频），并提供以下见解：
- 标签（OCR）
- 命名实体（OCR - 品牌、地点、人物）
- 光学字符识别 (OCR)
- 人员
- 场景（关键帧和镜头）
- 黑色框架
- 视觉内容审核
- 主题提取（OCR）
高级：仅使用视频索引和提取见解（忽略音频），并提供以下见解：
- 标签（OCR）
- 匹配的人员
- 命名实体（OCR - 品牌、地点、人物）
- 光学字符识别 (OCR)
- 被观察人员
- 人员
- 场景（关键帧和镜头）
- 场记板检测
- 数字模式检测
- 特色服装见解
- 无文本石板检测
- 文本徽标检测
- 黑色框架
- 视觉内容审核
- 主题提取（OCR）

音频和视频

基本：使用音频和视频为见解编制索引并提取见解，并提供以下见解：
- 转录
- 翻译
- 输出字幕和字幕的格式设置（隐藏式字幕）
- 对象检测
- 光学字符识别 (OCR)
- 场景（关键帧和镜头）
- 黑色框架
标准：使用音频和视频为见解编制索引并提取见解，并提供以下见解：
- 转录
- 翻译
- 输出字幕和字幕的格式设置（隐藏式字幕）
- 自动语言检测
- 情绪
- 关键字
- 命名实体（品牌、位置、人员）
- 光学字符识别 (OCR)
- 场景（关键帧和镜头）
- 黑色框架
- 视觉内容审核
- 人员
- 情绪
- 扬声器
- 主题提取
- 文本内容审查
高级：使用音频和视频编制索引和提取见解，并提供以下见解：
- 转录
- 翻译
- 输出字幕和字幕的格式设置（隐藏式字幕）
- 自动语言检测
- 文本内容审查
- 音频事件检测
- 情绪
- 关键字
- 匹配的人员
- 命名实体（品牌、位置、人员）
- 光学字符识别 (OCR)
- 被观察人员
- 人员
- 场记板检测
- 数字模式检测
- 特色服装见解
- 无文本石板检测
- 情绪
- 扬声器
- 场景（关键帧和镜头）
- 文本徽标检测
- 黑色框架
- 视觉内容审核
- 主题提取

流媒体质量选项

播放已索引的视频有两个选项：

单比特率：如果视频高度大于或等于 720p HD，则 Azure AI 视频索引器使用分辨率为 1280 x 720 对其进行编码。否则，其编码为 640 x 468。
无流式处理：生成见解但不执行流式处理操作，并且不会在 Azure AI 视频索引器网站上提供视频。如果选择“无流式处理”，则无需为编码付费。

排除模型

通过 VI 网站和 API 编制索引时，可以排除模型。使用网站将视频上传到索引时，请选择“高级设置>索引预设”，然后选择要从索引结果中排除的 AI 模型。它能够实现更高效的索引并给出仅包含你感兴趣的见解的 VI 结果。

自定义内容模型

Azure AI 视频索引器允许自定义其某些模型，使其适应特定的用例。这些模型包括品牌、语言、人物和语音。

洞察和媒体存储

以下部分介绍了如何在 Azure AI 视频索引器中存储见解和媒体。

见解存储

所有索引见解和元数据都保存在由 VI 管理的存储帐户中，不会为此存储付费。

媒体存储

VI 帐户已连接到Azure 存储帐户。您控制并支付此存储帐户的使用。当为视频编制索引时，以下文件存储在此帐户中：

源文件。在将来你需要重新编制视频索引时，它会被保留。
当流式处理质量设置为单比特率时，新的编码文件。

删除媒体

索引媒体及其所有关联的文件和见解可以通过三种方式删除：

使用视频索引器门户删除文件。
使用 “删除视频 ”或 “删除视频源文件 API”请求。
如果使用 API 时，如果不需要将原始媒体文件保留在存储中，请将 retentionPeriod 参数设置为 1-7 之间。索引视频及其相关内容、源文件、见解等在编制索引后 1-7 天内被删除。

Azure AI 视频索引器文档

反馈

此页面是否有帮助？

Last updated on 2025-10-06