備註
本文件指的是 Microsoft Foundry(新) 入口網站。
本文說明如何在 Foundry 中部署及使用最新的 Claude 模型,包括 Claude Opus 4.5、Claude Sonnet 4.5、Claude Haiku 4.5 以及 Claude Opus 4.1。 Anthropic 的旗艦產品是 Claude,一款前沿的 AI 模型,適用於程式編寫、代理、財務分析、研究及辦公等複雜任務。 Claude 在維持高安全標準的同時,提供卓越的性能。
這很重要
要在 Microsoft Foundry 中使用 Claude 模型,你需要付費的 Azure 訂閱,並在 Anthropic 提供模型購買的 國家或地區 擁有帳單帳號。 目前限制的付費訂閱類型包括:雲端解決方案供應商(CSP)、持有 Azure 信用的贊助帳戶、新加坡及南韓的企業帳戶,以及 Microsoft 帳戶。
關於常見訂閱相關錯誤的清單,請參見 常見錯誤訊息與解決方案。
可選的 Claude 型號
Foundry 透過全球標準部署支援 Claude Opus 4.5、Claude Sonnet 4.5、Claude Haiku 4.5 及 Claude Opus 4.1 型號。 這些模型具備以下關鍵功能:
- 延伸思考:延伸思考賦予克勞德在複雜任務中更強的推理能力。
- 影像與文字輸入:強大的視覺功能,使模型能處理影像並回傳文字輸出,以分析與理解圖表、圖表、技術圖表、報告及其他視覺資產。
- 程式碼產生:進階思考,包括 Claude Sonnet 4.5 與 Opus 4.1 的程式碼生成、分析與除錯。
關於模型功能的更多細節,請參見 Claude 模型的能力。
Claude Opus 4.5(預覽)
Claude Opus 4.5 是 Anthropic 最智慧的模型,也是程式設計、代理程式、電腦使用及企業工作流程的業界領導者。 Opus 4.5 擁有 200K 的代幣上下文視窗和 64K 最大輸出,非常適合生產程式碼、複雜代理、辦公任務、財務分析、資安及電腦使用。
Claude Sonnet 4.5(預覽)
Claude Sonnet 4.5 是一款高度強大的模型,專為建立真實世界代理人及處理複雜且長期任務而設計。 它在大量使用情境中提供了速度與成本的良好平衡。 Sonnet 4.5 也提供電腦使用的高級精確度,讓開發者能指導 Claude 以人類的方式使用電腦。
Claude Haiku 4.5(預覽)
Claude Haiku 4.5 在各種應用情境下,提供接近前沿的效能。 它以最佳的編碼與代理模型之一脫穎而出,具備適當的速度與成本,能驅動免費產品及可擴展的子代理。
Claude Opus 4.1(預覽)
Claude Opus 4.1 是程式設計業界的領導者。 它能在需要專注努力和數千步驟的長期任務上持續表現,大幅擴展 AI 代理能解決的範圍。
先決條件
- 具有有效付款方式的 Azure 訂用帳戶。 如果您沒有 Azure 訂用帳戶,請建立付費 Azure 帳戶以開始。
- 可取得 Microsoft Foundry 的適當權限來建立和管理資源。
- 一個由 Microsoft Foundry 在支援區域之一: 東美國 2 和 瑞典中部建立的專案。
- 合作夥伴和社群的 Foundry Models 需要存取 Azure Marketplace 才能建立訂閱。 請確定您擁有 訂閱模型供應專案所需的許可權。
部署 Claude 模型
Foundry 中的 Claude 模型可供 全球標準部署。 要部署 Claude 模型,請依照 Foundry 入口網站中的「部署 Microsoft Foundry 模型」中的指示操作。
部署後,你可以使用 Foundry 遊樂場 進行互動式測試模型。
與 Claude 模型合作
部署後,你可以選擇與 Claude 模型互動以產生文字回應:
請使用 Anthropic SDK 及以下 Claude API:
- 訊息 API 會傳送包含文字和/或圖片的結構化輸入訊息清單,模型會產生對話中的下一則訊息。
- Token Count API 用於計算訊息中的標記數量。
- 檔案 API 用於上傳和管理檔案,以便與 Claude API 使用,且每次請求無需重新上傳內容。
- Skills API 用於為 Claude AI 建立自訂技能。
使用 Responses API 在 Microsoft Foundry 中使用 Claude 模型產生文字回應。 如需示範此用法的多語言程式碼範例,請參閱 Microsoft Foundry 中的「使用 Claude 模型搭配 OpenAI 回應 API」。
使用 Messages API 來處理 Claude 模型
以下範例展示了如何 利用 Messages API 向 Claude Sonnet 4.5 發送請求,方法是同時使用 Microsoft Entra ID 認證與 API 金鑰驗證方法。 要使用已部署的模型,你需要以下項目:
- 你的基本網址形式為
https://<resource name>.services.ai.azure.com/anthropic。 - 你的目標 URI 來自你的部署細節,格式為
https://<resource name>.services.ai.azure.com/anthropic/v1/messages。 - Microsoft Entra ID 用於無金鑰認證,或是你部署的 API 金鑰用於 API 認證。
- 你在建立部署時選擇的部署名稱。 這個名稱可以與型號 ID 不同。
使用 Microsoft Entra ID 認證
對於 Messages API 端點,請使用你的基礎網址搭配 Microsoft Entra ID 認證。
安裝 Azure Identity 用戶端函式庫:你需要安裝這個函式庫才能使用
DefaultAzureCredential. 授權最容易的是使用DefaultAzureCredential,因為它會找到最適合執行環境的憑證。pip install azure.identity將 Microsoft Entra ID 應用程式的用戶端 ID、租戶 ID 與用戶端秘密值設為環境變數:
AZURE_CLIENT_ID,AZURE_TENANT_ID,AZURE_CLIENT_SECRET, 。export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>" export AZURE_TENANT_ID="<AZURE_TENANT_ID>" export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"安裝相依性:使用 pip 安裝 Anthropic SDK(需求:Python 版本為 >=3.8)。
pip install -U "anthropic"執行一個基本程式碼範例: 此範例可完成以下任務:
- 使用 Anthropic SDK 建立客戶端,使用 Microsoft Entra ID 驗證。
- 對訊息 API 進行基本呼叫。 呼叫為同步進行。
from anthropic import AnthropicFoundry from azure.identity import DefaultAzureCredential, get_bearer_token_provider baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name deploymentName = "claude-sonnet-4-5" # Replace with your deployment name # Create token provider for Entra ID authentication tokenProvider = get_bearer_token_provider( DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default" ) # Create client with Entra ID authentication client = AnthropicFoundry( azure_ad_token_provider=tokenProvider, base_url=baseURL ) # Send request message = client.messages.create( model=deployment_name, messages=[ {"role": "user", "content": "What is the capital/major city of France?"} ], max_tokens=1024, ) print(message.content)
使用 API 金鑰認證
對於 Messages API 端點,請使用你的基礎 URL 和 API 金鑰來驗證服務。
安裝相依性套件: 使用 pip 安裝 Anthropic SDK(需求版本:Python >=3.8):
pip install -U "anthropic"執行一個基本程式碼範例: 此範例可完成以下任務:
- 透過將您的 API 金鑰傳入 Anthropic SDK 的設定,建立一個客戶端程式。 此認證方式讓您能無縫與服務互動。
- 對訊息 API 進行基本呼叫。 呼叫為同步進行。
from anthropic import AnthropicFoundry baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name deploymentName = "claude-sonnet-4-5" # Replace with your deployment name apiKey = "YOUR_API_KEY" # Replace YOUR_API_KEY with your API key # Create client with API key authentication client = AnthropicFoundry( api_key=apiKey, base_url=baseURL ) # Send request message = client.messages.create( model=deploymentName, messages=[ {"role": "user", "content": "What is the capital/major city of France?"} ], max_tokens=1024, ) print(message.content)
代理支援
- Foundry Agent Service 支援 Claude 模型。
- Microsoft Agent Framework 支援建立使用 Claude 模型的代理程式。
- 你可以用 Claude Agent SDK 建立自訂的 AI 代理。
Claude 進階功能與能力
Foundry Models 中的 Claude 支援進階功能與能力。 核心能力 提升了 Claude 在處理、分析及生成各種格式與應用場景內容的基本能力。 工具 讓 Claude 能與外部系統互動、執行程式碼,並透過各種工具介面執行自動化任務。
Foundry 支援的一些 核心功能 包括:
- 100萬個代幣上下文視窗: 一個延伸的情境視窗。
- 代理人技能: 擴展克勞德的能力,通過技能增強其功能。
- 引用: 使克勞德的回應建立在原始文件的基礎上。
- 情境編輯: 自動管理對話情境,並可配置策略。
- 延伸思考: 強化推理能力以應付複雜任務。
- PDF 支援: 處理並分析 PDF 文件中的文字與視覺內容。
- 提示快取: 提供 Claude 更多背景知識與範例輸出,以降低成本與延遲。
Foundry 支援的一些 工具 包括:
- MCP 連接器: 可直接從 Messages API 連接遠端 MCP 伺服器,無需獨立的 MCP 用戶端。
- 記憶體: 在多次對話中儲存和檢索資訊。 隨著時間建立知識庫,維持專案背景,並從過去的互動中學習。
- 網路取物: 從指定的網頁及 PDF 文件擷取完整內容以進行深入分析。
欲了解完整支援的功能與工具清單,請參閱 Claude 的功能概覽。
API 配額與限制
這很重要
目前僅有企業版與 MCA-E 訂閱方可於 Foundry 中使用 Claude 模型。
Foundry 中的 Claude 模型有以下速率限制,以每分鐘代幣數(TPM)和每分鐘請求數(RPM)衡量:
| 型號 | 部署類型 | 預設轉速 | 預設 TPM | 企業和 MCA-E RPM | 企業和 MCA-E TPM |
|---|---|---|---|---|---|
| 克勞德俳句-4-5 | 全域標準 | 0 | 0 | 4,000 | 4,000,000 |
| claude-opus-4-1 | 全域標準 | 0 | 0 | 2,000 | 2,000,000 |
| 克勞德十四行詩-第4-5首 | 全域標準 | 0 | 0 | 4,000 | 2,000,000 |
| 克勞德作品4-5 | 全域標準 | 0 | 0 | 2,000 | 2,000,000 |
若要超過預設上限,請透過 配額增加申請表提交申請。
速率限制最佳做法
為了優化使用並避免速率限制:
- 實作重試邏輯:以指數退讓處理 429 次回應
- 批次請求:儘可能將多個提示合併
- 監控使用情況:追蹤你的代幣消費與請求模式
- 使用適當模型:選擇適合您使用情境的 Claude 模型
負責任 AI 的考量因素
在 Foundry 中使用 Claude 模型時,請考慮以下負責任的 AI 實踐:
在模型推論時設定 AI 內容安全,因為 Foundry 在部署時並未為 Claude 模型提供內建內容過濾功能。 欲了解如何建立及使用內容過濾器,請參閱 「為鑄造廠模型設定內容過濾」。
確保您的應用程式符合 Anthropic 的可接受使用政策。 此外,請參閱 Claude Opus 4.5、 Claude Haiku 4.5、 Claude Opus 4.1 及 Claude Sonnet 4.5 的安全評估細節。
在模型推論時設定 AI 內容安全,因為 Foundry 在部署時並未為 Claude 模型提供內建內容過濾功能。
確保您的應用程式符合 Anthropic 的可接受使用政策。 此外,請參閱 Claude Opus 4.5、 Claude Haiku 4.5、 Claude Opus 4.1 及 Claude Sonnet 4.5 的安全評估細節。
最佳做法
在 Foundry 中使用 Claude 模型時,請遵循以下最佳實務:
型號選擇
根據您的具體需求選擇合適的 Claude 型號:
- Claude Opus 4.5:在編碼、代理程式、電腦使用及企業工作流程中達到最佳效能
- Claude Sonnet 4.5:為了平衡效能與能力,製作工作流程
- Claude Haiku 4.5:為了速度與成本優化,進行大量處理
- Claude Opus 4.1:用於複雜推理與企業應用
提示工程
- 明確指示:提供具體且詳盡的提示
- 情境管理:有效利用可用的情境視窗
- 角色定義:利用系統訊息定義助理的角色與行為
- 結構化提示:使用一致格式以獲得更好效果
成本優化
- 代幣管理:監控並優化代幣使用情況
- 模型選擇:根據你的使用情境,選擇最具成本效益的模型
- 快取:在適當情況下實作明確的提示快取
- 請求批次處理:盡可能合併多個請求