你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Foundry Tools 中 Azure 内容理解服务配额与限制

本文提供了有关 Foundry Tools 服务中 Azure 内容理解的配额和限制的参考。

一般限制

properties 限度
分析器 ID 1-64 个字符。 字母数字、句点和下划线。 模式:[a-zA-Z0-9._]{1,64}
URL 属性 ≤ 8,192 个字符
说明属性 ≤ 1,024 个字符
字段名 ≤ 64 个字符。 Unicode 字母、数字、组合标记、连接标点、句点、连字符和下划线。 模式:[\p{L}\p{Nl}\p{Mn}\p{Mc}\p{Nd}\p{Pc}._-]{1,64}
标记 ≤ 10 个标记
标记键 ≤ 64 个字符。 字母数字和 + - . : = _ / 字符。 模式:[a-zA-Z0-9+-.:=_/]{1,64}
标记值 ≤ 256 个字符。 字母数字和 + - . : = _ / 字符。 可以为空。 模式:[a-zA-Z0-9+-.:=_/]{0,256}
映像引用 ID ≤ 256 个字符

资源限制

Quota 标准 (S0)
分析器上限 10万
每分钟分析上限 1000 页/张图片
4 小时的音频
4 小时的视频
每分钟操作上限 3000

支持的生成模型

内容理解连接到 Foundry 模型以获取生成功能。 该服务会定期更新,以添加对更多模型的支持。 若要了解详细信息,请参阅 将内容理解分析器连接到 Foundry 模型部署

当前支持的模型包括:

模型类型 型号 版本
聊天补全 gpt-4o 2024-08-06
聊天补全 gpt-4o 2024-11-20
聊天补全 gpt-4o-mini 2024-11-20
聊天补全 gpt-4.1 2024-11-20
聊天补全 gpt-4.1-mini 2024-11-20
聊天补全 gpt-4.1-nano 2024-11-20
嵌入 text-embedding-3-small
嵌入 text-embedding-3-large
嵌入 text-embedding-ada-002

分析器

输入文件限制

文档和文本

支持的文件类型 文件大小 长度
.pdf
.tiff
.jpg、、.jpeg.jpe.png.bmp、、 .heif.heic
≤ 200 MB ≤ 300 页
.docx.xlsx.pptx ≤ 200 MB ≤ 1M 字符
.txt
.html.md.rtf
.eml.msg
.xml
≤ 1 MB ≤ 1M 字符

注意

Pro 模式(预览版) 目前仅支持输入 .pdf、.tiff和图像文件类型。 总输入可能不超过 100 MB 和 150 页。

图像

支持的文件类型 文件大小 解决方法
.jpg、、.jpeg.jpe.png.bmp、、 .heif.heic ≤ 200 MB 最小:50 x 50 像素
最大:10k x 10k 像素

音频

支持的文件类型 文件大小 长度
.wav (PCM, A-law, μ-law)
.mp3
.mp4
.opus.ogg (Opus)
.flac
.wma
.aac
.amr(AMR-NB、AMR-WB)
.3gp (AMR-NB,AMR-WB)
.webm(Opus、Vorbis)
.m4aAACALAC
.spx
最大值:300 MB 最大值:2 小时

内容理解支持最大 1 GB 和 4 小时的音频文件,但对于≤ 300 MB 或 ≤ 2 小时的文件,转录时间会大幅减少。

视频

支持的文件类型和分辨率
支持的文件类型 解决方法
.mp4.m4v
.flv (H.264 和 AAC
.wmv.asf
.avi
.mkv
.mov
最小:320 x 240 像素
最大:1920 x 1,080 像素
文件大小限制
Upload 方法 文件大小 长度 Description
analyzeBinary API (直接上传) ≤ 200 MB ≤ 30 分钟 使用 analyzeBinary API 直接在 API 请求正文中上传视频文件。 Microsoft Foundry UX 和内容理解工作室 UX 使用此方法。
分析 API (文件参考) 最大值:4 GB 最大值:2 小时 使用分析 API 时,通过 Azure Blob 存储或类似存储中的 URL 引用视频文件

注意

视频分析具有以下限制:

  • analyzeBinary API:在请求正文中直接上传视频时,最大文件大小为 200 MB,最长持续时间为 30 分钟
  • 帧采样:分析大约每秒一帧,这可能会错过快速移动或简短事件
  • 分辨率:所有帧缩放为 512 x 512 像素,这可能会影响小细节或遥远对象的可见性

字段架构限制

内容理解支持基本字段值类型和嵌套结构,包括列表、组、表和固定表。

  • 基本字段值类型:字符串、日期、时间、数字、整数和布尔值
  • 列表字段:相同类型的值序列,表示为 API 中基本字段的数组。
  • 组字段:一组语义相关的字段,表示为 API 中基本字段的对象。
  • 表字段:具有固定子字段的数量不定的项,表示为 API 中基本字段的对象数组。
  • 固定表字段:具有共享子字段的一组字段,表示为 API 中基本字段对象的对象。

基本限制

properties 文档 文本 图像 音频 视频
字段上限 1000 1000 1000 1000 1000
分类字段类别上限 300 300 300 300 300
支持的生成方法 extract
generate
classify
generate
classify
generate
classify
generate
classify
generate
classify
  • “字段上限”限制包括所有命名字段。 例如,字符串列表计数为一个字段,而包含字符串和数字子字段的组则计为三个字段。
  • “分类字段类别上限”限制是所有字段中使用 生成方法的类别总数classify

知识源限制

类型 限制
训练数据 仅文档
总计 1 GB
总计 5 万页/图像

分段/分类

一般限制

注意

此限制适用于 内容理解分段/分类 本身,而不是对提取功能中的字段进行分类。

properties 限度
类别名称 不能从美元符号开始 ($
类别名称和说明 每个类别中组合名称和说明的最大字符数为 120 个字符
类别数 每个分析器处理 200 个文档,1 个分析器用于视频
分层分类 文档的 5 层、视频的 2 层