你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
注释
本文档指的是 Microsoft Foundry(新) 门户网站。
本文介绍代理在 Microsoft Foundry 代理服务中使用的各种 Azure OpenAI 模型集。 这些模型具有各种功能和价格点。
Microsoft Foundry 提供两种主要类型的部署:
- 标准 包括全局部署选项,用于全局路由流量以提供更高的吞吐量。
- 预配 还包括全球部署选项。 可以在 Azure 全球基础结构中购买和部署预配的吞吐量单位。
所有部署都可以执行相同的推理操作。 然而,计费、规模和性能存在显著差异。 若要详细了解 Azure OpenAI 部署类型,请参阅 Microsoft Foundry 模型的部署类型。
可用模型
Foundry 代理服务支持列出的区域中的以下 Azure OpenAI 模型。
请记住,模型可用性因区域和云而异。 某些工具和功能需要最新的模型。 REST API 和 SDK 中提供了以下模型。
| 区域 | gpt-5, 2025-08-07 | gpt-5-mini, 2025-08-07 | gpt-5-nano, 2025-08-07 | gpt-5-chat, 2025-08-07 | gpt-4.1, 2025-04-14 | gpt-4.1-nano, 2025-04-14 | gpt-4.1-mini, 2025-04-14 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o, 2024-11-20 | gpt-4o-mini, 2024-07-18 | gpt-4, 0613 | gpt-4, turbo-2024-04-09 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||
brazilsouth |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ||||
canadaeast |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||||
eastus |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | |||
eastus2 |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
francecentral |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||||
germanywestcentral |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||||
italynorth |
✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ||||
japaneast |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||
norwayeast |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||||
southafricanorth |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ||||
southcentralus |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||||
southindia |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||
swedencentral |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||
uksouth |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||
westeurope |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ||||
westus |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||||
westus3 |
✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
其他模型集合
以下 Foundry 模型列表也可供代理使用。
Azure 直接销售的模型:
- MAI-DS-R1:确定性、以精度为中心的推理。
- grok-4:复杂多步解决问题的前沿规模推理。
- grok-4-fast-reasoning:针对工作流自动化优化的加速代理推理。
- grok-4-fast-non-reasoning:高吞吐量、低延迟生成和系统路由。
- grok-3:为复杂的系统级工作流提供强大的推理。
- grok-3-mini:针对交互式、大容量用例优化的轻型模型。
- Llama-3.3-70B-Instruct:适用于企业 Q&A、决策支持和系统编排的多功能模型。
- Llama-4-Maverick-17B-128E-Instruct-FP8:FP8 优化模型,可提供快速、经济高效的推理。
- DeepSeek-V3-0324:跨文本和图像的多模式理解。
- DeepSeek-V3.1:增强的多模式推理和地面检索。
- DeepSeek-R1-0528:高级长文本和多步骤推理模型。
- gpt-oss-120b:支持透明度和可重现性的开放生态系统模型。
来自合作伙伴和社区的模型:
- Claude-Opus-4-5:跨编码、代理、计算机使用和企业工作流的最佳性能。
- 克劳德-Opus-4-1:最复杂的问题解决的前沿推理。
- Claude-Sonnet-4-5:多模式和代理工作流的均衡性能。
- Claude-Haiku-4-5:用于交互式方案的轻型高速生成。
在 Foundry 门户中查看所有代理支持的模型
若要查看 Foundry 门户中支持模型的完整列表:
- 登录到 Microsoft Foundry。 确保 New Foundry 开关处于关闭状态。 这些步骤涉及到 Foundry(经典)。
登录到 Microsoft Foundry。 确保 New Foundry 开关处于打开状态。 这些步骤适用于 Foundry(新)。
- 转到 模型目录。
- 按 功能 筛选模型,然后选择 支持的代理。
- 登录到 Microsoft Foundry。 确保 New Foundry 开关处于关闭状态。 这些步骤涉及到 Foundry(经典)。
登录到 Microsoft Foundry。 确保 New Foundry 开关处于打开状态。 这些步骤适用于 Foundry(新)。
- 选择右上方导航中的“ 发现 ”,然后选择左窗格中的 “模型 ”。
- 打开 “功能 ”下拉列表并选择 “代理支持的 筛选器”。