你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
本文提供了有关 Foundry Tools 服务中 Azure 内容理解的配额和限制的参考。
一般限制
| properties | 限度 |
|---|---|
| 分析器 ID | 1-64 个字符。 字母数字、句点和下划线。 模式:[a-zA-Z0-9._]{1,64} |
| URL 属性 | ≤ 8,192 个字符 |
| 说明属性 | ≤ 1,024 个字符 |
| 字段名 | ≤ 64 个字符。 Unicode 字母、数字、组合标记、连接标点、句点、连字符和下划线。 模式:[\p{L}\p{Nl}\p{Mn}\p{Mc}\p{Nd}\p{Pc}._-]{1,64} |
| 标记 | ≤ 10 个标记 |
| 标记键 | ≤ 64 个字符。 字母数字和 + - . : = _ / 字符。 模式:[a-zA-Z0-9+-.:=_/]{1,64} |
| 标记值 | ≤ 256 个字符。 字母数字和 + - . : = _ / 字符。 可以为空。 模式:[a-zA-Z0-9+-.:=_/]{0,256} |
| 映像引用 ID | ≤ 256 个字符 |
资源限制
| Quota | 标准 (S0) |
|---|---|
| 分析器上限 | 10万 |
| 每分钟分析上限 | 1000 页/张图片 4 小时的音频 4 小时的视频 |
| 每分钟操作上限 | 3000 |
支持的生成模型
内容理解连接到 Foundry 模型以获取生成功能。 该服务会定期更新,以添加对更多模型的支持。 若要了解详细信息,请参阅 将内容理解分析器连接到 Foundry 模型部署
当前支持的模型包括:
| 模型类型 | 型号 | 版本 |
|---|---|---|
| 聊天补全 | gpt-4o | 2024-08-06 |
| 聊天补全 | gpt-4o | 2024-11-20 |
| 聊天补全 | gpt-4o-mini | 2024-11-20 |
| 聊天补全 | gpt-4.1 | 2024-11-20 |
| 聊天补全 | gpt-4.1-mini | 2024-11-20 |
| 聊天补全 | gpt-4.1-nano | 2024-11-20 |
| 嵌入 | text-embedding-3-small | |
| 嵌入 | text-embedding-3-large | |
| 嵌入 | text-embedding-ada-002 |
分析器
输入文件限制
文档和文本
| 支持的文件类型 | 文件大小 | 长度 |
|---|---|---|
✓ .pdf✓ .tiff• .jpg、、.jpeg.jpe、.png、.bmp、、 .heif.heic |
≤ 200 MB | ≤ 300 页 |
✓ .docx、.xlsx、.pptx |
≤ 200 MB | ≤ 1M 字符 |
✓ .txt ✓ .html、.md、.rtf • .eml, .msg ✓ .xml |
≤ 1 MB | ≤ 1M 字符 |
注意
Pro 模式(预览版) 目前仅支持输入 .pdf、.tiff和图像文件类型。 总输入可能不超过 100 MB 和 150 页。
图像
| 支持的文件类型 | 文件大小 | 解决方法 |
|---|---|---|
• .jpg、、.jpeg.jpe、.png、.bmp、、 .heif.heic |
≤ 200 MB | 最小:50 x 50 像素 最大:10k x 10k 像素 |
音频
| 支持的文件类型 | 文件大小 | 长度 |
|---|---|---|
✓ .wav (PCM, A-law, μ-law)✓ .mp3 ✓ .mp4 • .opus、 .ogg (Opus)✓ .flac ✓ .wma ✓ .aac ✓ .amr(AMR-NB、AMR-WB)✓ .3gp (AMR-NB,AMR-WB)✓ .webm(Opus、Vorbis)• .m4a (AAC, ALAC)✓ .spx |
最大值:300 MB† | 最大值:2 小时† |
† 内容理解支持最大 1 GB 和 4 小时的音频文件,但对于≤ 300 MB 或 ≤ 2 小时的文件,转录时间会大幅减少。
视频
支持的文件类型和分辨率
| 支持的文件类型 | 解决方法 |
|---|---|
• .mp4, .m4v • .flv (H.264 和 AAC) • .wmv, .asf ✓ .avi ✓ .mkv ✓ .mov |
最小:320 x 240 像素 最大:1920 x 1,080 像素 |
文件大小限制
| Upload 方法 | 文件大小 | 长度 | Description |
|---|---|---|---|
| analyzeBinary API (直接上传) | ≤ 200 MB | ≤ 30 分钟 | 使用 analyzeBinary API 直接在 API 请求正文中上传视频文件。 Microsoft Foundry UX 和内容理解工作室 UX 使用此方法。 |
| 分析 API (文件参考) | 最大值:4 GB | 最大值:2 小时 | 使用分析 API 时,通过 Azure Blob 存储或类似存储中的 URL 引用视频文件 |
注意
视频分析具有以下限制:
- analyzeBinary API:在请求正文中直接上传视频时,最大文件大小为 200 MB,最长持续时间为 30 分钟
- 帧采样:分析大约每秒一帧,这可能会错过快速移动或简短事件
- 分辨率:所有帧缩放为 512 x 512 像素,这可能会影响小细节或遥远对象的可见性
字段架构限制
内容理解支持基本字段值类型和嵌套结构,包括列表、组、表和固定表。
- 基本字段值类型:字符串、日期、时间、数字、整数和布尔值。
- 列表字段:相同类型的值序列,表示为 API 中基本字段的数组。
- 组字段:一组语义相关的字段,表示为 API 中基本字段的对象。
- 表字段:具有固定子字段的数量不定的项,表示为 API 中基本字段的对象数组。
- 固定表字段:具有共享子字段的一组字段,表示为 API 中基本字段对象的对象。
基本限制
| properties | 文档 | 文本 | 图像 | 音频 | 视频 |
|---|---|---|---|---|---|
| 字段上限 | 1000 | 1000 | 1000 | 1000 | 1000 |
| 分类字段类别上限 | 300 | 300 | 300 | 300 | 300 |
| 支持的生成方法 | extract generate classify |
generate classify |
generate classify |
generate classify |
generate classify |
- “字段上限”限制包括所有命名字段。 例如,字符串列表计数为一个字段,而包含字符串和数字子字段的组则计为三个字段。
- “分类字段类别上限”限制是所有字段中使用 生成方法的类别总数
classify。
知识源限制
| 类型 | 限制 |
|---|---|
| 训练数据 | 仅文档 总计 1 GB 总计 5 万页/图像 |
分段/分类
一般限制
注意
此限制适用于 内容理解分段/分类 本身,而不是对提取功能中的字段进行分类。
| properties | 限度 |
|---|---|
| 类别名称 | 不能从美元符号开始 ($) |
| 类别名称和说明 | 每个类别中组合名称和说明的最大字符数为 120 个字符 |
| 类别数 | 每个分析器处理 200 个文档,1 个分析器用于视频 |
| 分层分类 | 文档的 5 层、视频的 2 层 |