你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
本文介绍如何在 Foundry 中部署和使用最新的 Claude 模型,包括 Claude Opus 4.5、Claude Sonnet 4.5、Claude Haiku 4.5 和 Claude Opus 4.1。 人类学的旗舰产品是 Claude,一种前沿 AI 模型,可用于编码、代理、财务分析、研究和办公室任务等复杂任务。 Claude 提供卓越的性能,同时保持较高的安全标准。
可用的 Claude 模型
Foundry 通过全球标准部署支持 Claude Opus 4.5、Claude Sonnet 4.5、Claude Haiku 4.5 和 Claude Opus 4.1 模型。 这些模型具有关键功能,包括:
- 扩展思维:扩展思维为 Claude 提供了复杂任务所需的增强推理能力。
- 图像和文本输入:强大的视觉功能,使模型能够处理图像并返回文本输出,以便分析和理解图表、图形、技术关系图、报表和其他视觉资产。
- 代码生成:高级思维,包括 Claude Sonnet 4.5 和 Claude Opus 4.1 的代码生成、分析和调试。
有关模型功能的更多详细信息,请参阅 Claude 模型的功能。
克劳德·奥普斯 4.5 (预览版)
Claude Opus 4.5 是人类学最智能的模型,也是跨编码、代理、计算机使用和企业工作流的行业领导者。 Opus 4.5 具有 200K 令牌上下文窗口和 64K 最大输出,非常适合生产代码、复杂的代理、办公室任务、财务分析、网络安全和计算机使用。
Claude Sonnet 4.5(预览版)
Claude Sonnet 4.5 是一种高度有能力的模型,旨在生成真实代理并处理复杂的长期任务。 它为大容量用例提供了强大的速度和成本平衡。 Sonnet 4.5 还为计算机操作提供了高级的精准度功能,能够使开发人员指导 Claude 像人类一样使用计算机。
克劳德·海库 4.5 (预览版)
Claude Haiku 4.5 为多个使用场景提供接近前沿的性能。 它被认为是最好的编码和代理程序模型之一,以适当的速度和成本驱动免费产品和规模化的子代理。
克劳德·奥普斯 4.1 (预览版)
Claude Opus 4.1 是编码行业领导者。 它针对需要集中精力和数千个步骤的长时间运行任务提供持续的性能,大大扩展了 AI 代理可以解决的问题。
先决条件
- 具有有效付款方式的 Azure 订阅。 如果没有 Azure 订阅,请先创建一个付费的 Azure 帐户。
- 使用适当的权限访问 Microsoft Foundry,以创建和管理资源。
- 在支持的区域之一创建的 Microsoft Foundry 项目:美国东部 2 和 瑞典中部。
- 合作伙伴和社区的 Foundry 模型 需要访问 Azure 市场 才能创建订阅。 确保你拥有 订阅模型产品/服务所需的权限。
部署 Claude 模型
Foundry 中的 Claude 模型可用于 全局标准部署。 若要部署 Claude 模型,请按照 添加并配置模型至 Microsoft Foundry 模型中的说明进行操作。
部署后,可以使用 Foundry 操场进行交互式模型测试。
使用 Claude 模型
部署后,有一些选项可用于与 Claude 模型交互以生成文本响应:
使用 Anthropic SDKs 和以下 Claude APIs:
在 Microsoft Foundry 中使用 Responses API 通过 Claude 模型生成文本响应。 有关演示此用法的多语言代码示例,请参阅 在 Microsoft Foundry 中将 Claude 模型与 OpenAI 响应 API 配合使用。
使用消息 API 处理 Claude 模型
以下示例演示如何 使用消息 API 通过Microsoft Entra ID 身份验证和 API 密钥身份验证方法将请求发送到 Claude Sonnet 4.5。 若要使用已部署的模型,需要以下项:
- 基 URL,格式为
https://<resource name>.services.ai.azure.com/anthropic。 - 从部署详细信息中获取的目标 URI,格式为
https://<resource name>.services.ai.azure.com/anthropic/v1/messages。 - Microsoft Entra ID 用于无密钥身份验证,或者使用部署的 API 密钥进行 API 身份验证。
- 在创建部署期间选择的部署名称。 此名称可以不同于模型 ID。
使用 Microsoft Entra ID 身份验证
对于消息 API 终结点,请将基 URL 与 Microsoft Entra ID 身份验证配合使用。
安装 Azure 标识客户端库:需要安装此库才能使用该
DefaultAzureCredential库。 使用DefaultAzureCredential时,授权最容易,因为它找到在运行环境中使用的最佳凭据。pip install azure.identity将Microsoft Entra ID 应用程序的客户端 ID、租户 ID 和客户端机密的值设置为环境变量:
AZURE_CLIENT_ID、AZURE_TENANT_ID、AZURE_CLIENT_SECRET。export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>" export AZURE_TENANT_ID="<AZURE_TENANT_ID>" export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"安装依赖项: 使用 pip 安装人类 SDK(需要:Python >=3.8)。
pip install -U "anthropic"运行基本代码示例: 此示例完成以下任务:
- 使用 Microsoft Entra ID 身份验证创建 Anthropic SDK 客户端。
- 对消息 API 进行基本调用。 调用是同步的。
from anthropic import AnthropicFoundry from azure.identity import DefaultAzureCredential, get_bearer_token_provider baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name deploymentName = "claude-sonnet-4-5" # Replace with your deployment name # Create token provider for Entra ID authentication tokenProvider = get_bearer_token_provider( DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default" ) # Create client with Entra ID authentication client = AnthropicFoundry( azure_ad_token_provider=tokenProvider, base_url=baseURL ) # Send request message = client.messages.create( model=deployment_name, messages=[ {"role": "user", "content": "What is the capital/major city of France?"} ], max_tokens=1024, ) print(message.content)
使用 API 密钥身份验证
对于消息 API 终结点,请使用基本 URL 和 API 密钥对服务进行身份验证。
安装依赖项: 使用 pip 安装人类 SDK(需要:Python >=3.8):
pip install -U "anthropic"运行基本代码示例: 此示例完成以下任务:
- 通过将 API 密钥传递给 SDK 的配置,使用 Anthropic SDK 创建客户端。 此身份验证方法使你可以与服务无缝交互。
- 对消息 API 进行基本调用。 调用是同步的。
from anthropic import AnthropicFoundry baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name deploymentName = "claude-sonnet-4-5" # Replace with your deployment name apiKey = "YOUR_API_KEY" # Replace YOUR_API_KEY with your API key # Create client with API key authentication client = AnthropicFoundry( api_key=apiKey, base_url=baseURL ) # Send request message = client.messages.create( model=deploymentName, messages=[ {"role": "user", "content": "What is the capital/major city of France?"} ], max_tokens=1024, ) print(message.content)
代理支持
- Foundry 智能体服务支持 Claude 模型。
- Microsoft Agent Framework 支持创建使用 Claude 模型的代理。
- 可以使用 Claude 代理 SDK 生成自定义 AI 代理。
Claude 高级特性和功能
Foundry 模型中的 Claude 支持高级特性和功能。 核心功能 增强了 Claude 处理、分析和生成各种格式和用例的内容的基本功能。 工具 使 Claude 能够与外部系统交互、执行代码,并通过各种工具接口执行自动化任务。
Foundry 支持的一些 核心功能 包括:
- 100 万个令牌上下文窗口: 扩展的上下文窗口。
- 代理技能: 使用技能扩展 Claude 的功能。
- 引文:基于源文档来支持 Claude 的响应。
- 上下文编辑: 使用可配置的策略自动管理聊天上下文。
- 扩展思维: 增强了复杂任务的推理功能。
- PDF 支持: 处理和分析 PDF 文档中的文本和视觉内容。
- 提示缓存: 为 Claude 提供更多背景知识和示例输出,以降低成本和延迟。
Foundry 支持的一些 工具 包括:
- MCP 连接器: 无需单独的 MCP 客户端即可直接从消息 API 连接到远程 MCP 服务器。
- 记忆: 跨对话存储和检索信息。 随着时间的推移,构建知识库,维护项目上下文,并从过去的交互中学习。
- Web 提取: 从指定的网页和 PDF 文档中检索完整内容以进行深入分析。
有关支持的功能和工具的完整列表,请参阅 Claude 的功能概述。
API 配额和限制
在 Foundry 中,Claude 模型有以下速率限制:以每分钟令牌(TPM)和每分钟请求(RPM)为单位。
| 型号 | 部署类型 | 默认 RPM | 默认 TPM | 企业和 MCA-E RPM | 企业和 MCA-E TPM |
|---|---|---|---|---|---|
| claude-haiku-4-5 | GlobalStandard | 1,000 | 1,000,000 | 4,000 | 4,000,000 |
| claude-opus-4-1 | GlobalStandard | 1,000 | 1,000,000 | 2,000 | 2,000,000 |
| claude-sonnet-4-5 | GlobalStandard | 1,000 | 1,000,000 | 4,000 | 2,000,000 |
| claude-opus-4-5 | 全局标准 | 1,000 | 1,000,000 | 2,000 | 2,000,000 |
若要提高配额超出默认限制,请通过 配额增加请求表单提交请求。
速率上限最佳做法
优化您的使用并避免频率限制:
- 实现重试逻辑:使用指数退避处理 429 个响应
- 批处理请求:尽可能合并多个提示
- 监视使用情况:跟踪令牌消耗和请求模式
- 使用适当的模型:为用例选择正确的 Claude 模型
负责任 AI 的注意事项
在 Foundry 中使用 Claude 模型时,请考虑以下负责任的 AI 做法:
在模型推理期间配置 AI 内容安全,因为 Foundry 在部署时不提供对 Claude 模型的内置内容筛选。 若要了解如何创建和使用内容筛选器,请参阅 配置 Foundry 模型的内容筛选。
确保应用程序符合 人类可接受的使用策略。 此外,请参阅 Claude Opus 4.5、 Claude Haiku 4.5、 Claude Opus 4.1 和 Claude Sonnet 4.5 的安全评估的详细信息。
在模型推理期间配置 AI 内容安全,因为 Foundry 在部署时不提供对 Claude 模型的内置内容筛选。
确保应用程序符合 人类可接受的使用策略。 此外,请参阅 Claude Opus 4.5、 Claude Haiku 4.5、 Claude Opus 4.1 和 Claude Sonnet 4.5 的安全评估的详细信息。
最佳做法
在 Foundry 中使用 Claude 模型时,请遵循以下最佳做法:
模型选择
根据具体要求选择适当的 Claude 模型:
- Claude Opus 4.5:为了获得编码、代理、计算机使用和企业工作流的最佳性能
- Claude Sonnet 4.5:为了达到性能和功能的平衡,生产流程
- Claude Haiku 4.5:对于速度和成本优化,大容量处理
- Claude Opus 4.1:复杂推理和企业应用程序
提示工程
- 清晰的说明:提供具体和详细的指令
- 上下文管理:有效使用可用的上下文窗口
- 角色定义:使用系统消息定义助手的角色和行为
- 结构化提示:为更好的结果使用一致的格式设置
成本优化
- 令牌管理:监视和优化令牌使用情况
- 模型选择:对用例使用最经济高效的模型
- 缓存:在适当情况下实现显式提示缓存
- 请求批处理:尽可能合并多个请求