你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
注释
本文档适用于 Microsoft Foundry(新)门户。
本文列出了合作伙伴和社区提供的 Microsoft Foundry 模型及其 功能、部署类型和可用性区域(不包括 已弃用模型和旧模型)的选择。 大多数 Foundry 模型来自合作伙伴和社区。 受信任的第三方组织、合作伙伴、研究实验室和社区参与者提供这些模型。
根据在 Microsoft Foundry 中使用的 项目类型 ,可以看到不同的模型选择。 若要详细了解合作伙伴和社区的 Foundry 模型的属性,请参阅 探索 Foundry 模型。
注释
有关 Azure 直接销售的模型列表,请参阅由 Azure 直接销售的 Foundry 模型。
有关 Foundry 代理服务支持的 Azure OpenAI 模型的列表,请参阅 代理服务支持的模型。
Anthropic
人类学的旗舰产品是 Claude,一个前沿 AI 模型,由领先的企业和数百万用户信任,用于复杂的任务,包括编码、代理、财务分析、研究和办公室任务。 Claude 提供卓越的性能,同时保持较高的安全标准。
若要在 Foundry 中使用 Claude 模型,请参阅 在 Microsoft Foundry 中部署和使用 Claude 模型。
还支持在 Foundry 智能体服务中使用 Claude 模型。
重要
若要在 Microsoft Foundry 中使用 Claude 模型,需要一个付费的 Azure 订阅,该订阅的计费帐户位于 Anthropic 提供购买模型的 国家或地区 。 目前,以下付费订阅类型受到限制:云解决方案提供商(CSP)、具有 Azure 额度的赞助帐户、新加坡和韩国的企业帐户以及Microsoft帐户。
有关常见订阅相关错误的列表,请参阅 常见错误消息和解决方案。
| 型号 | 类型 | Capabilities | 项目类型 |
|---|---|---|---|
|
claude-haiku-4-5 (预览版) |
Messages |
-
输入: 文本和图像 - 输出: 文本(最多 64,000 个令牌) - 上下文窗口: 200,000 - 语言: en、、fr、arzh、jako、、es、hi - 工具调用: 是(文件搜索和代码执行) - 响应格式:文本、JSON |
Foundry,基于中心的 |
|
claude-opus-4-1 (预览版) |
Messages |
-
输入: 文本、图像和代码 - 输出: 文本(32,000 个最大标记数) - 上下文窗口: 200,000 - 语言: en、、fr、arzh、jako、、es、hi - 工具调用: 是(文件搜索和代码执行) - 响应格式:文本、JSON |
Foundry,基于中心的 |
|
claude-sonnet-4-5 (预览版) |
Messages |
-
输入: 文本、图像和代码 - 输出: 文本(最大 64,000 个令牌) - 上下文窗口: 200,000 - 语言: en、、fr、arzh、jako、、es、hi - 工具调用: 是(文件搜索和代码执行) - 响应格式:文本、JSON |
Foundry,基于中心的 |
|
claude-opus-4-5 (预览版) |
Messages |
-
输入: 文本和图片,以及代码 - 输出: 文本(最多 64,000 个令牌) - 上下文窗口: 200,000 - 语言: en、、fr、arzh、jako、、es、hi - 工具调用: 是(文件搜索和代码执行) - 响应格式:文本、JSON |
Foundry,基于中心的 |
| 型号 | 类型 | Capabilities |
|---|---|---|
claude-haiku-4-5 (预览版) |
Messages |
-
输入: 文本和图像 - 输出: 文本(最多 64,000 个令牌) - 上下文窗口: 200,000 - 语言: en、、fr、arzh、jako、、es、hi - 工具调用: 是(文件搜索和代码执行) - 响应格式:文本、JSON |
claude-opus-4-1 (预览版) |
Messages |
-
输入: 文本、图像和代码 - 输出: 文本(32,000 个最大标记数) - 上下文窗口: 200,000 - 语言: en、、fr、arzh、jako、、es、hi - 工具调用: 是(文件搜索和代码执行) - 响应格式:文本、JSON |
claude-sonnet-4-5 (预览版) |
Messages |
-
输入: 文本、图像和代码 - 输出: 文本(最大 64,000 个令牌) - 上下文窗口: 200,000 - 语言: en、、fr、arzh、jako、、es、hi - 工具调用: 是(文件搜索和代码执行) - 响应格式:文本、JSON |
claude-opus-4-5 (预览版) |
Messages |
-
输入: 文本和图片,以及代码 - 输出: 文本(最多 64,000 个令牌) - 上下文窗口: 200,000 - 语言: en、、fr、arzh、jako、、es、hi - 工具调用: 是(文件搜索和代码执行) - 响应格式:文本、JSON |
请参阅 Foundry 门户中的人类模型集合。
Cohere
Cohere 模型系列包括针对不同用例优化的各种模型,其中包括会话补全和嵌入。 Cohere 模型针对各种用例进行了优化,包括推理、总结和问答。
| 型号 | 类型 | Capabilities | 项目类型 |
|---|---|---|---|
| Cohere-command-r-plus-08-2024 | chat-completion |
-
输入:文本(131,072 个标记) - 输出:文本(4,096 个标记) - 语言: en、、fr、es、it、dept-br、ja、ko和 zh-cnar - 工具调用: 是的 - 响应格式:文本、JSON |
Foundry,基于中心的 |
| Cohere-command-r-08-2024 | chat-completion |
-
输入:文本(131,072 个标记) - 输出:文本(4,096 个标记) - 语言: en、、fr、es、it、dept-br、ja、ko和 zh-cnar - 工具调用: 是的 - 响应格式:文本、JSON |
Foundry,基于中心的 |
| Cohere-embed-v3-english | embeddings |
-
输入: 文本和图像(512 个标记) - 输出: 矢量 (1024 dim.) - 语言: en |
Foundry,基于中心的 |
| Cohere-embed-v3-multilingual | embeddings |
-
输入:文本(512 个标记) - 输出: 矢量 (1024 dim.) - 语言: en、、fr、es、it、dept-br、ja、ko和 zh-cnar |
Foundry,基于中心的 |
| 型号 | 类型 | Capabilities |
|---|---|---|
Cohere-command-r-plus-08-2024 |
chat-completion |
-
输入:文本(131,072 个标记) - 输出:文本(4,096 个标记) - 语言: en、、fr、es、it、dept-br、ja、ko和 zh-cnar - 工具调用: 是的 - 响应格式:文本、JSON |
Cohere-command-r-08-2024 |
chat-completion |
-
输入:文本(131,072 个标记) - 输出:文本(4,096 个标记) - 语言: en、、fr、es、it、dept-br、ja、ko和 zh-cnar - 工具调用: 是的 - 响应格式:文本、JSON |
Cohere-embed-v3-english |
embeddings |
-
输入: 文本和图像(512 个标记) - 输出: 矢量 (1024 dim.) - 语言: en |
Cohere-embed-v3-multilingual |
embeddings |
-
输入:文本(512 个标记) - 输出: 矢量 (1024 dim.) - 语言: en、、fr、es、it、dept-br、ja、ko和 zh-cnar |
Cohere 重新排序
| 型号 | 类型 | Capabilities | API 参考文档 | 项目类型 |
|---|---|---|---|---|
| Cohere-rerank-v3.5 | rerank 文本分类 |
-
输入: 文本 - 输出: 文本 - 语言: 英语、中文、法语、德语、印度尼西亚语、意大利语、葡萄牙语、俄语、西班牙语、阿拉伯语、荷兰语、印地语、日语、越南语 |
Cohere 的 v2/rerank API | 基于中心的 |
有关 Cohere 重新调整模型的定价的更多详细信息,请参阅 Cohere 重新调整模型的定价。
Core42
Core42 包含阿拉伯语和英语的自回归双语 LLM,在阿拉伯语中具有最先进的功能。
| 型号 | 类型 | Capabilities | 项目类型 |
|---|---|---|---|
| jais-30b-chat | chat-completion |
-
输入:文本(8,192 个标记) - 输出:(4,096 个标记) - 语言:en 和 ar - 工具调用: 是的 - 响应格式:文本、JSON |
Foundry,基于中心的 |
| 型号 | 类型 | Capabilities |
|---|---|---|
jais-30b-chat |
chat-completion |
-
输入:文本(8,192 个标记) - 输出:(4,096 个标记) - 语言:en 和 ar - 工具调用: 是的 - 响应格式:文本、JSON |
Meta
Meta Llama 模型和工具是预训练和微调的生成式 AI 文本和图像推理模型的集合。 Meta 模型规模大小不一,包括:
- 小型语言模型 (SLM),如 1B 和 3B Base 模型,以及用于设备和边缘推理的 Instruct 模型
- 中等大型语言模型 (LLM),如 7B、8B 和 70B Base 模型和 Instruct 模型
- 高性能模型(如 Meta Llama 3.1-405B Instruct),用于合成数据生成和蒸馏用例。
| 型号 | 类型 | Capabilities | 项目类型 |
|---|---|---|---|
| Llama-3.2-11B-Vision-Instruct | chat-completion |
-
输入:文本和图像(128,000 个标记) - 输出:(8,192 个标记) - 语言: en - 工具调用:无 - 响应格式:文本 |
Foundry,基于中心的 |
| Llama-3.2-90B-Vision-Instruct | chat-completion |
-
输入:文本和图像(128,000 个标记) - 输出:(8,192 个标记) - 语言: en - 工具调用:无 - 响应格式:文本 |
Foundry,基于中心的 |
| Meta-Llama-3.1-405B-Instruct | chat-completion |
-
输入:文本(131,072 个标记) - 输出:(8,192 个标记) - 语言: en、、de、fr、itpt、hi、和 esth - 工具调用:无 - 响应格式:文本 |
Foundry,基于中心的 |
| Meta-Llama-3.1-8B-Instruct | chat-completion |
-
输入:文本(131,072 个标记) - 输出:(8,192 个标记) - 语言: en、、de、fr、itpt、hi、和 esth - 工具调用:无 - 响应格式:文本 |
Foundry,基于中心的 |
| Llama-4-Scout-17B-16E-Instruct | chat-completion |
-
输入:文本和图像(128,000 个标记) - 输出:文本(8,192 个标记) - 工具调用:无 - 响应格式:文本 |
Foundry,基于中心的 |
| 型号 | 类型 | Capabilities |
|---|---|---|
Llama-3.2-11B-Vision-Instruct |
chat-completion |
-
输入:文本和图像(128,000 个标记) - 输出:(8,192 个标记) - 语言: en - 工具调用:无 - 响应格式:文本 |
Llama-3.2-90B-Vision-Instruct |
chat-completion |
-
输入:文本和图像(128,000 个标记) - 输出:(8,192 个标记) - 语言: en - 工具调用:无 - 响应格式:文本 |
Meta-Llama-3.1-405B-Instruct |
chat-completion |
-
输入:文本(131,072 个标记) - 输出:(8,192 个标记) - 语言: en、、de、fr、itpt、hi、和 esth - 工具调用:无 - 响应格式:文本 |
Meta-Llama-3.1-8B-Instruct |
chat-completion |
-
输入:文本(131,072 个标记) - 输出:(8,192 个标记) - 语言: en、、de、fr、itpt、hi、和 esth - 工具调用:无 - 响应格式:文本 |
Llama-4-Scout-17B-16E-Instruct |
chat-completion |
-
输入:文本和图像(128,000 个标记) - 输出:文本(8,192 个标记) - 工具调用:无 - 响应格式:文本 |
请参阅 Foundry 门户中的此模型集合。 还可以找到多个 Meta 模型,它们作为Azure 直售模型提供。
Microsoft
Microsoft模型包括各种模型组,例如 MAI 模型、Phi 模型、医疗保健 AI 模型等。
| 型号 | 类型 | Capabilities | 项目类型 |
|---|---|---|---|
| Phi-4-mini-instruct | chat-completion |
-
输入:文本(131,072 个标记) - 输出:(4,096 个标记) - 语言: ar、zh、cs、da、nl、en、fi、fr、de、he、hu、it、ja、ko、no、pl、pt、ru、es、sv、th、tr和uk - 工具调用:无 - 响应格式:文本 |
Foundry,基于中心的 |
| Phi-4-multimodal-instruct | chat-completion |
-
输入: 文本、图像和音频(131,072 个标记) - 输出:(4,096 个标记) - 语言: ar、zh、cs、da、nl、en、fi、fr、de、he、hu、it、ja、ko、no、pl、pt、ru、es、sv、th、tr和uk - 工具调用:无 - 响应格式:文本 |
Foundry,基于中心的 |
| Phi-4 | chat-completion |
-
输入:文本(16,384 个标记) - 输出:(16,384 个标记) - 语言: en、ar、bn、cs、da、de、el、es、fa、fi、fr、gu、ha、he、hi、hu、id、it、ja、jv、kn、ko、ml、mr、nl、no、or、pa、pl、ps、pt、ro、ru、sv、sw、ta、te、th、tl、tr、uk、ur、vi、yo、及zh - 工具调用:无 - 响应格式:文本 |
Foundry,基于中心的 |
| Phi-4-reasoning | 使用推理内容的聊天补全 |
-
输入: 文本(32,768 个标记) - 输出: 文本(32,768 个标记) - 语言: en - 工具调用:无 - 响应格式:文本 |
Foundry,基于中心的 |
| Phi-4-mini-reasoning | 使用推理内容的聊天补全 |
-
输入:文本(128,000 个标记) - 输出: 文本(128,000 个标记) - 语言: en - 工具调用:无 - 响应格式:文本 |
Foundry,基于中心的 |
| 型号 | 类型 | Capabilities |
|---|---|---|
Phi-4-mini-instruct |
chat-completion |
-
输入:文本(131,072 个标记) - 输出:(4,096 个标记) - 语言: ar、zh、cs、da、nl、en、fi、fr、de、he、hu、it、ja、ko、no、pl、pt、ru、es、sv、th、tr和uk - 工具调用:无 - 响应格式:文本 |
Phi-4-multimodal-instruct |
chat-completion |
-
输入: 文本、图像和音频(131,072 个标记) - 输出:(4,096 个标记) - 语言: ar、zh、cs、da、nl、en、fi、fr、de、he、hu、it、ja、ko、no、pl、pt、ru、es、sv、th、tr和uk - 工具调用:无 - 响应格式:文本 |
Phi-4 |
chat-completion |
-
输入:文本(16,384 个标记) - 输出:(16,384 个标记) - 语言: en、ar、bn、cs、da、de、el、es、fa、fi、fr、gu、ha、he、hi、hu、id、it、ja、jv、kn、ko、ml、mr、nl、no、or、pa、pl、ps、pt、ro、ru、sv、sw、ta、te、th、tl、tr、uk、ur、vi、yo、及zh - 工具调用:无 - 响应格式:文本 |
Phi-4-reasoning |
使用推理内容的聊天补全 |
-
输入: 文本(32,768 个标记) - 输出: 文本(32,768 个标记) - 语言: en - 工具调用:无 - 响应格式:文本 |
Phi-4-mini-reasoning |
使用推理内容的聊天补全 |
-
输入:文本(128,000 个标记) - 输出: 文本(128,000 个标记) - 语言: en - 工具调用:无 - 响应格式:文本 |
请参阅 Foundry 门户中Microsoft模型集合。 Microsoft 模型也可作为 Azure 直售模型提供。
Mistral人工智能
Mistral AI 提供两类模型:高级模型(如 Mistral Large 2411 和 Ministral 3B),以及 Mistral Nemo 等开放模型。
| 型号 | 类型 | Capabilities | 项目类型 |
|---|---|---|---|
| Codestral-2501 | chat-completion |
-
输入:文本(262,144 个标记) - 输出:文本(4,096 个标记) - 语言:en - 工具调用:无 - 响应格式:文本 |
Foundry,基于中心的 |
| Ministral-3B | chat-completion |
-
输入:文本(131,072 个标记) - 输出:文本(4,096 个标记) - 语言:fr、de、es、it、en - 工具调用: 是的 - 响应格式:文本、JSON |
Foundry,基于中心的 |
| Mistral-Nemo | chat-completion |
-
输入:文本(131,072 个标记) - 输出:文本(4,096 个标记) - 语言: en、、fr、deesitzhjakopt、和 nlpl - 工具调用: 是的 - 响应格式:文本、JSON |
Foundry,基于中心的 |
| Mistral-small-2503 | chat-completion |
-
输入: 文本(32,768 个标记) - 输出:文本(4,096 个标记) - 语言:fr、de、es、it、en - 工具调用: 是的 - 响应格式:文本、JSON |
Foundry,基于中心的 |
| Mistral-medium-2505 | chat-completion |
-
输入: 文本(128,000 个标记),图像 - 输出: 文本(128,000 个标记) - 工具调用:无 - 响应格式:文本、JSON |
Foundry,基于中心的 |
| Mistral-Large-2411 | chat-completion |
-
输入:文本(128,000 个标记) - 输出:文本(4,096 个标记) - 语言: en、、fr、deesitzhjakopt、和 nlpl - 工具调用: 是的 - 响应格式:文本、JSON |
Foundry,基于中心的 |
| Mistral-OCR-2503 | 图像到文本 |
-
输入: 图像或 PDF 页面(1,000 页,最大 50MB PDF 文件) - 输出: 文本 - 工具调用:无 - 响应格式: 文本、JSON、Markdown |
基于中心的 |
| mistralai-Mistral-7B-Instruct-v01 | chat-completion |
-
输入: 文本 - 输出: 文本 - 语言:en - 响应格式:文本 |
基于中心的 |
| mistralai-Mistral-7B-Instruct-v0-2 | chat-completion |
-
输入: 文本 - 输出: 文本 - 语言:en - 响应格式:文本 |
基于中心的 |
| mistralai-Mixtral-8x7B-Instruct-v01 | chat-completion |
-
输入: 文本 - 输出: 文本 - 语言:en - 响应格式:文本 |
基于中心的 |
| mistralai-Mixtral-8x22B-Instruct-v0-1 | chat-completion |
-
输入: 文本(64,000 个标记) - 输出:文本(4,096 个标记) - 语言: fr、it、de、es、en - 响应格式:文本 |
基于中心的 |
| 型号 | 类型 | Capabilities |
|---|---|---|
Codestral-2501 |
chat-completion |
-
输入:文本(262,144 个标记) - 输出:文本(4,096 个标记) - 语言:en - 工具调用:无 - 响应格式:文本 |
Ministral-3B |
chat-completion |
-
输入:文本(131,072 个标记) - 输出:文本(4,096 个标记) - 语言:fr、de、es、it、en - 工具调用: 是的 - 响应格式:文本、JSON |
Mistral-Nemo |
chat-completion |
-
输入:文本(131,072 个标记) - 输出:文本(4,096 个标记) - 语言: en、、fr、deesitzhjakopt、和 nlpl - 工具调用: 是的 - 响应格式:文本、JSON |
Mistral-small-2503 |
chat-completion |
-
输入: 文本(32,768 个标记) - 输出:文本(4,096 个标记) - 语言:fr、de、es、it、en - 工具调用: 是的 - 响应格式:文本、JSON |
Mistral-medium-2505 |
chat-completion |
-
输入: 文本(128,000 个标记),图像 - 输出: 文本(128,000 个标记) - 工具调用:无 - 响应格式:文本、JSON |
Mistral-Large-2411 |
chat-completion |
-
输入:文本(128,000 个标记) - 输出:文本(4,096 个标记) - 语言: en、、fr、deesitzhjakopt、和 nlpl - 工具调用: 是的 - 响应格式:文本、JSON |
请参阅 Foundry 门户中的此模型集合。 Mistral 模型也可作为 Azure 直售模型提供。
Nixtla
Nixtla 的 TimeGEN-1 是用于时序数据的生成式预训练预测模型和异常检测模型。 TimeGEN-1 在不训练的情况下为新的时序生成准确的预测,仅使用历史值和外生协变量作为输入。
若要执行推理,TimeGEN-1 要求使用 Nixtla 的自定义推理 API。
| 型号 | 类型 | Capabilities | 推理 API | 项目类型 |
|---|---|---|---|---|
| TimeGEN-1 | Forecasting |
-
输入: 时序数据作为 JSON 或数据帧(支持多变量输入) - 输出: 时序数据作为 JSON - 工具调用:无 - 响应格式: JSON |
预测客户端与 Nixtla 的 API 交互 | 基于中心的 |
有关 Nixtla 模型的定价的更多详细信息,请参阅 Nixtla。
NTT 数据
tsuzumi 是一种自回归语言优化转换器。 优化版本使用监督式微调(SFT)。 tsuzumi 可以高效地处理日语和英语。
| 型号 | 类型 | Capabilities | 项目类型 |
|---|---|---|---|
| tsuzumi-7b | chat-completion |
-
输入:文本(8,192 个标记) - 输出:文本(8,192 个标记) - 语言: en 和 jp - 工具调用:无 - 响应格式:文本 |
基于中心的 |
稳定性 AI
Stability AI 图像生成模型集合包括 Stable Image Core、Stable Image Ultra 和 Stable Diffusion 3.5 Large。 Stable Diffusion 3.5 Large 接受图像和文本输入。
| 型号 | 类型 | Capabilities | 项目类型 |
|---|---|---|---|
| 稳定扩散 3.5 大型版 | 图像生成 |
-
输入: 文本和图像(1,000 个令牌和 1 个图像) - 输出: 一个图像 - 工具调用:无 - 响应格式:图像(PNG 和 JPG) |
Foundry,基于中心的 |
| 稳定映像核心 | 图像生成 |
-
输入: 文本(1,000 个词元) - 输出: 一个图像 - 工具调用:无 - 响应格式: 图像(PNG 和 JPG) |
Foundry,基于中心的 |
| 超稳图像 | 图像生成 |
-
输入: 文本(1,000 个词元) - 输出: 一个图像 - 工具调用:无 - 响应格式: 图像(PNG 和 JPG) |
Foundry,基于中心的 |
| 型号 | 类型 | Capabilities |
|---|---|---|
Stable Diffusion 3.5 Large |
图像生成 |
-
输入: 文本和图像(1,000 个令牌和 1 个图像) - 输出: 一个图像 - 工具调用:无 - 响应格式:图像(PNG 和 JPG) |
Stable Image Core |
图像生成 |
-
输入: 文本(1,000 个词元) - 输出: 一个图像 - 工具调用:无 - 响应格式: 图像(PNG 和 JPG) |
Stable Image Ultra |
图像生成 |
-
输入: 文本(1,000 个词元) - 输出: 一个图像 - 工具调用:无 - 响应格式: 图像(PNG 和 JPG) |
打开和自定义模型
模型目录提供来自更广泛的提供商的丰富模型选择。 对于这些模型,不能在 Microsoft Foundry 资源中使用标准部署选项,其中模型以 API 的形式提供。 相反,若要部署这些模型,可能需要将其托管在基础结构上,创建 AI 中心,并提供基础计算配额来托管模型。
此外,这些模型可以开放访问或 IP 保护。 在这两种情况下,必须在 Foundry 的托管计算产品中部署它们。 若要开始,请参阅 操作指南:部署到托管计算。