本文将介绍如何更改提示生成器中的模型版本和设置。 模型版本和设置可能会影响生成式 AI 模型的性能和行为。
模型选择
可以通过选择提示生成器顶部的 “模型 ”来更改模型。 下拉菜单允许您从生成自定义提示答案的生成式 AI 模型中进行选择。
重要
2025年11月,我们将o3模型迁移到了GPT-5推理模型。 运行在 o3 模型上的提示会自动转移到 GPT-5 推理模型,无需你采取任何作。 可以通过在提示时通过支持请求暂时还原到 o3 模型。 该例外有效期至2025年12月17日,届时O3型号将永久退役。
在 Power Apps 或 Power Automate 中使用提示会消耗提示 生成器额度,而在 Microsoft Copilot Studio 中使用提示会消耗 Copilot 额度。 在 许可和提示构建器积分中了解更多信息。
概述
下表介绍了可用的不同型号。
| GPT 模型 | 许可 | 功能 | 类别 |
|---|---|---|---|
| GPT-4.1 微型 (默认模型) |
基本费率 | 根据截至 2024 年 6 月的数据进行训练。 最多输入128K代币。 | 迷你 |
| GPT-4.1 | Standard速率 | 根据截至 2024 年 6 月的数据进行训练。 上下文最多允许 128K 标记。 | 概况 |
| GPT-5 聊天 | Standard速率 | 基于截至2024年9月的数据进行训练。 最多允许 40 万个令牌的上下文。 | 概况 |
| GPT-5 推理 | 费率 | 训练的数据截至2024年10月。 最多允许 40 万个令牌的上下文。 | 深 |
| GPT-5.2 聊天(实验阶段) | Standard速率 | - | 概况 |
| GPT-5.2 推理(实验阶段) | 费率 | - | 深 |
| 克劳德十四行诗4.5(实验版) | Standard速率 | 外部模型来自Anthropic。 上下文最多允许 200K 标记。 | 概况 |
| 克劳德作品4.1(实验版) | 费率 | 外部模型来自Anthropic。 上下文最多允许 200K 标记。 | 深 |
GPT-4o mini 和 GPT-4o 继续用于美国政府管辖区域。 这些模型遵循许可规则并提供与 GPT-4.1 迷你版和 GPT-4.1 相当的功能。
模型的可用性因地区而异。 了解更多关于模型可用性的信息,请参阅 按地区划分的模型可用性。
Anthropic模型托管在Microsoft外部,并受Anthropic条款和数据处理约束。 在“ 选择外部模型作为主要人工智能模型”中了解更多关于外部人类模型的信息。
许可
在代理、流程或应用中,提示词使用的模型无论发布阶段如何,都会消耗 Copilot 积分。 了解更多关于 Copilot信用管理的信息。
如果你有 AI Builder 积分,当 Power Apps 和 Power Automate 中使用提示时,这些积分会优先被消耗。 在 Copilot Studio 中使用提示时,这些提示不会被消耗。 了解更多内容,请参阅 AI 构建器:许可概览。
发行阶段
模型有不同的发布阶段。 你可以尝试新的、前沿的实验和预览模型,或者选择可靠、经过充分测试、普遍可用的模型。
| 标记 | Description |
|---|---|
| Experimental | 用于实验,不建议用于生产用途。 受预览条款的约束,并且可能对可用性和质量有限制。 |
| Preview | 最终成为了普遍可用的型号,但目前不推荐用于生产环境。 受预览条款的约束,并且可能对可用性和质量有限制。 |
| 无标签 | 正式发布。 您可以将此模型用于缩放和生产用途。 在大多数情况下,正式发布的型号在可用性和质量方面没有限制,但有些型号可能仍然有一些限制,例如区域可用性。 重要提示:拟人版Claude模型处于实验阶段,尽管它们不显示标签。 |
| 违约 | 所有代理的默认模型,通常是性能最佳的正式发布模型。 默认模型会随着新的、功能更强大的模型正式发布而定期升级。 如果所选模型已关闭或不可用,代理还会使用默认模型作为后备。 |
实验模型和预览模型可能在性能、响应质量、延迟或消息消耗方面存在差异,且可能超时或不可用。 它们受 预览条款约束。
分类
下表描述了不同的模型类别。
| 迷你 | 概况 | 深 | |
|---|---|---|---|
| 性能 | 适用于大多数任务 | 胜任复杂任务 | 经过推理任务训练 |
| 速度 | 处理速度更快 | 可能由于复杂程度变慢 | 速度较慢,因为它在响应之前会进行推理 |
| 用例 | 摘要、信息任务、图像和文档处理 | 图像和文档处理、高级内容创建任务 | 数据分析和推理任务、图像和文档处理 |
当您需要一个经济高效的解决方案来应对中等复杂度的任务、计算资源有限或需要更快的处理时,选择 迷你 模型。 它是具有预算约束的项目以及客户支持或高效代码分析等应用程序的理想选择。
当你处理高度复杂、多模态且需要卓越性能和详细分析的任务时,选择 通用 模型。 对于准确性和高级功能至关重要的大型项目,它是更好的选择。 另一个适合它的场景是您有预算和计算资源来支持它。 对于可能随着时间增长而复杂度增加的长期项目,通用模型也更受青睐。
对于需要高级推理能力的项目, Deep Models表现出色。 它适用于需要复杂问题解决和批判性思维的场景。 深度模型在需要细致推理、复杂决策和细致分析的环境中表现出色。
根据地区可用性、功能、使用场景和成本选择模型。 详情请参阅 按地区划分的模型可用性和 价格比较表。
按地区划分的模型可用性
以下章节描述了各地区模型的公众和美国政府供应情况。
公众可得性
在下表中,(GA)、(预览)或(实验性)表示该功能可用,但使用了其他区域的Azure OpenAI服务。 了解更多信息,请参阅实现跨区域数据移动。
| 功能 / 特点 | 亚洲 | 澳大利亚 | Canada | 欧洲 | 法国 | 德国 | 印度 | 日本 | 挪威 | 新加坡 | 南非 | 南美洲 | 韩国 | 瑞典 | 瑞士 | 阿拉伯联合酋长国 | 英国 | 美国 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| GPT-4.1 微型 | GA | GA | (GA) | (GA) | (GA) | (GA) | GA | (GA) | (GA) | GA | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | GA | GA |
| GPT-4.1 | GA | GA | (GA) | (GA) | (GA) | (GA) | GA | (GA) | (GA) | GA | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | GA | GA |
| o3 | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | GA |
| GPT-5 聊天 | (GA) | (GA) | (GA) | GA | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | GA |
| GPT-5 推理 | (GA) | (GA) | (GA) | GA | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | (GA) | GA |
| GPT-5.2聊天 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | Experimental |
| GPT-5.2 推理 | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | Experimental |
美国政府的可用性
| 功能 / 特点 | 政府社区云 (GCC) | 政府社区云 – 高 (GCC High) | 国防部 (DOD) |
|---|---|---|---|
| GPT-4o mini | GA | GA | - |
| GPT-4o | GA | GA | - |
| GPT-4o 使用图像或文档作为输入 | - | - | - |
模型更新
| 型号 | 状态 | 停用日期 | Replacement |
|---|---|---|---|
| GPT-4.1 微型 | 普遍可用 | 还没有具体日期 | n/a |
| GPT-4.1 | 普遍可用 | 还没有具体日期 | n/a |
| GPT-5 聊天 | 普遍可用 | 还没有具体日期 | n/a |
| GPT-5 推理 | 普遍可用 | 还没有具体日期 | n/a |
| GPT-5.2聊天 | Experimental | 还没有具体日期 | n/a |
| GPT-5.2 推理 | Experimental | 还没有具体日期 | n/a |
| 克劳德十四行诗 4.5 | Experimental | 还没有具体日期 | n/a |
| Claude Opus 4.1 | Experimental | 2025 年 12 月 | Claude Opus 4.5 |
| Claude Opus 4.5 | 待发售 | 还没有具体日期 | n/a |
| o3 | 已停用 | 2025 年 12 月 4 日 | GPT-5 推理 |
| GPT-4o mini | 已停用 | 2025 年 7 月 | GPT-4.1 微型 |
| GPT-4o | 已停用 | 2025 年 7 月 | GPT-4.1 |
| o1 | 已停用 | 2025 年 7 月 | o3 |
模型设置
你可以通过选择......>进入设置面板。提示构建器顶部的设置。 您可以更改以下设置:
- 温度:较低的温度带来可预测的结果。 更高的温度允许更多样或富有创意的反应。
- 记录检索:为知识源检索的记录数。
- 在回复中包含链接:选中后,回复中将包含检索记录的链接引文。
温度
滑块允许您选择生成式人工智能模型的温度。 它在0到1之间变化。 这个价值指导生成式AI模型在创造力(1)与确定性答案(0)之间做出选择。
温度是一个控制 AI 模型生成的输出随机性的参数。 较低的温度导致更可预测和更保守的输出。 相比之下,温度越高,回复就越有创造性和多样性。 这是一种在模型输出中微调随机性和确定性之间平衡的方法。
与之前创建的提示一样,默认温度为 0。
| 温度 | 功能性 | 使用位置 |
|---|---|---|
| 0 | 更可预测和更保守的输出。 回复更加一致。 |
要求高准确性和较小可变性的提示。 |
| 1 | 回复更具创造性和多样性。 更多样且有时更创新的回复。 |
这些提示词能创造出全新的跳出框架内容。 |
调整温度会影响模型的输出,但不能保证获得特定结果。 AI的响应本质上是概率性的,并且在相同温度设置下可能发生变化。
注释
GPT-5推理模型没有温度设置。 因此,当你选择GPT-5推理模型时,滑块会被禁用。