共用方式為


在 Microsoft Foundry(預覽版)中部署並使用 Claude 模型

備註

本文件指的是 Microsoft Foundry(經典版) 入口網站。

🔄如果你正在使用新的入口網站,請切換至 Microsoft Foundry(新版)文件

備註

本文件指的是 Microsoft Foundry(新) 入口網站。

本文說明如何在 Foundry 中部署及使用最新的 Claude 模型,包括 Claude Opus 4.5、Claude Sonnet 4.5、Claude Haiku 4.5 以及 Claude Opus 4.1。 Anthropic 的旗艦產品是 Claude,一款前沿的 AI 模型,適用於程式編寫、代理、財務分析、研究及辦公等複雜任務。 Claude 在維持高安全標準的同時,提供卓越的性能。

這很重要

要在 Microsoft Foundry 中使用 Claude 模型,你需要付費的 Azure 訂閱,並在 Anthropic 提供模型購買的 國家或地區 擁有帳單帳號。 目前限制的付費訂閱類型包括:雲端解決方案供應商(CSP)、持有 Azure 信用的贊助帳戶、新加坡及南韓的企業帳戶,以及 Microsoft 帳戶。

關於常見訂閱相關錯誤的清單,請參見 常見錯誤訊息與解決方案

可選的 Claude 型號

Foundry 透過全球標準部署支援 Claude Opus 4.5、Claude Sonnet 4.5、Claude Haiku 4.5 及 Claude Opus 4.1 型號。 這些模型具備以下關鍵功能:

  • 延伸思考:延伸思考賦予克勞德在複雜任務中更強的推理能力。
  • 影像與文字輸入:強大的視覺功能,使模型能處理影像並回傳文字輸出,以分析與理解圖表、圖表、技術圖表、報告及其他視覺資產。
  • 程式碼產生:進階思考,包括 Claude Sonnet 4.5 與 Opus 4.1 的程式碼生成、分析與除錯。

關於模型功能的更多細節,請參見 Claude 模型的能力

Claude Opus 4.5(預覽)

Claude Opus 4.5 是 Anthropic 最智慧的模型,也是程式設計、代理程式、電腦使用及企業工作流程的業界領導者。 Opus 4.5 擁有 200K 的代幣上下文視窗和 64K 最大輸出,非常適合生產程式碼、複雜代理、辦公任務、財務分析、資安及電腦使用。

Claude Sonnet 4.5(預覽)

Claude Sonnet 4.5 是一款高度強大的模型,專為建立真實世界代理人及處理複雜且長期任務而設計。 它在大量使用情境中提供了速度與成本的良好平衡。 Sonnet 4.5 也提供電腦使用的高級精確度,讓開發者能指導 Claude 以人類的方式使用電腦。

Claude Haiku 4.5(預覽)

Claude Haiku 4.5 在各種應用情境下,提供接近前沿的效能。 它以最佳的編碼與代理模型之一脫穎而出,具備適當的速度與成本,能驅動免費產品及可擴展的子代理。

Claude Opus 4.1(預覽)

Claude Opus 4.1 是程式設計業界的領導者。 它能在需要專注努力和數千步驟的長期任務上持續表現,大幅擴展 AI 代理能解決的範圍。

先決條件

部署 Claude 模型

Foundry 中的 Claude 模型可供 全球標準部署。 要部署 Claude 模型,請依照 Foundry 入口網站中的「部署 Microsoft Foundry 模型」中的指示操作。

部署後,你可以使用 Foundry 遊樂場 進行互動式測試模型。

與 Claude 模型合作

部署後,你可以選擇與 Claude 模型互動以產生文字回應:

使用 Messages API 來處理 Claude 模型

以下範例展示了如何 利用 Messages API 向 Claude Sonnet 4.5 發送請求,方法是同時使用 Microsoft Entra ID 認證與 API 金鑰驗證方法。 要使用已部署的模型,你需要以下項目:

  • 你的基本網址形式為 https://<resource name>.services.ai.azure.com/anthropic
  • 你的目標 URI 來自你的部署細節,格式為 https://<resource name>.services.ai.azure.com/anthropic/v1/messages
  • Microsoft Entra ID 用於無金鑰認證,或是你部署的 API 金鑰用於 API 認證。
  • 你在建立部署時選擇的部署名稱。 這個名稱可以與型號 ID 不同。

使用 Microsoft Entra ID 認證

對於 Messages API 端點,請使用你的基礎網址搭配 Microsoft Entra ID 認證。

  1. 安裝 Azure Identity 用戶端函式庫:你需要安裝這個函式庫才能使用 DefaultAzureCredential. 授權最容易的是使用 DefaultAzureCredential,因為它會找到最適合執行環境的憑證。

    pip install azure.identity
    

    將 Microsoft Entra ID 應用程式的用戶端 ID、租戶 ID 與用戶端秘密值設為環境變數: AZURE_CLIENT_IDAZURE_TENANT_IDAZURE_CLIENT_SECRET, 。

    export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>"
    export AZURE_TENANT_ID="<AZURE_TENANT_ID>"
    export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"
    
  2. 安裝相依性:使用 pip 安裝 Anthropic SDK(需求:Python 版本為 >=3.8)。

    pip install -U "anthropic"
    
  3. 執行一個基本程式碼範例: 此範例可完成以下任務:

    1. 使用 Anthropic SDK 建立客戶端,使用 Microsoft Entra ID 驗證。
    2. 對訊息 API 進行基本呼叫。 呼叫為同步進行。
    from anthropic import AnthropicFoundry
    from azure.identity import DefaultAzureCredential, get_bearer_token_provider
    
    baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name
    deploymentName = "claude-sonnet-4-5" # Replace with your deployment name
    
    # Create token provider for Entra ID authentication
    tokenProvider = get_bearer_token_provider(
        DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
    )
    
    # Create client with Entra ID authentication
    client = AnthropicFoundry(
        azure_ad_token_provider=tokenProvider,
        base_url=baseURL
    )
    
    # Send request
    message = client.messages.create(
        model=deployment_name,
        messages=[
            {"role": "user", "content": "What is the capital/major city of France?"}
        ],
        max_tokens=1024,
    )
    
    print(message.content)
    

使用 API 金鑰認證

對於 Messages API 端點,請使用你的基礎 URL 和 API 金鑰來驗證服務。

  1. 安裝相依性套件: 使用 pip 安裝 Anthropic SDK(需求版本:Python >=3.8):

    pip install -U "anthropic"
    
  2. 執行一個基本程式碼範例: 此範例可完成以下任務:

    1. 透過將您的 API 金鑰傳入 Anthropic SDK 的設定,建立一個客戶端程式。 此認證方式讓您能無縫與服務互動。
    2. 對訊息 API 進行基本呼叫。 呼叫為同步進行。
    from anthropic import AnthropicFoundry
    
    baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name
    deploymentName = "claude-sonnet-4-5" # Replace with your deployment name
    apiKey = "YOUR_API_KEY" # Replace YOUR_API_KEY with your API key
    
    # Create client with API key authentication
    client = AnthropicFoundry(
        api_key=apiKey,
        base_url=baseURL
    )
    
    # Send request
    message = client.messages.create(
        model=deploymentName,
        messages=[
            {"role": "user", "content": "What is the capital/major city of France?"}
        ],
        max_tokens=1024,
    )
    
    print(message.content)
    

代理支援

Claude 進階功能與能力

Foundry Models 中的 Claude 支援進階功能與能力。 核心能力 提升了 Claude 在處理、分析及生成各種格式與應用場景內容的基本能力。 工具 讓 Claude 能與外部系統互動、執行程式碼,並透過各種工具介面執行自動化任務。

Foundry 支援的一些 核心功能 包括:

  • 100萬個代幣上下文視窗: 一個延伸的情境視窗。
  • 代理人技能: 擴展克勞德的能力,通過技能增強其功能。
  • 引用: 使克勞德的回應建立在原始文件的基礎上。
  • 情境編輯: 自動管理對話情境,並可配置策略。
  • 延伸思考: 強化推理能力以應付複雜任務。
  • PDF 支援: 處理並分析 PDF 文件中的文字與視覺內容。
  • 提示快取: 提供 Claude 更多背景知識與範例輸出,以降低成本與延遲。

Foundry 支援的一些 工具 包括:

  • MCP 連接器: 可直接從 Messages API 連接遠端 MCP 伺服器,無需獨立的 MCP 用戶端。
  • 記憶體: 在多次對話中儲存和檢索資訊。 隨著時間建立知識庫,維持專案背景,並從過去的互動中學習。
  • 網路取物: 從指定的網頁及 PDF 文件擷取完整內容以進行深入分析。

欲了解完整支援的功能與工具清單,請參閱 Claude 的功能概覽

API 配額與限制

這很重要

目前僅有企業版與 MCA-E 訂閱方可於 Foundry 中使用 Claude 模型。

Foundry 中的 Claude 模型有以下速率限制,以每分鐘代幣數(TPM)和每分鐘請求數(RPM)衡量:

型號 部署類型 預設轉速 預設 TPM 企業和 MCA-E RPM 企業和 MCA-E TPM
克勞德俳句-4-5 全域標準 0 0 4,000 4,000,000
claude-opus-4-1 全域標準 0 0 2,000 2,000,000
克勞德十四行詩-第4-5首 全域標準 0 0 4,000 2,000,000
克勞德作品4-5 全域標準 0 0 2,000 2,000,000

若要超過預設上限,請透過 配額增加申請表提交申請。

速率限制最佳做法

為了優化使用並避免速率限制:

  • 實作重試邏輯:以指數退讓處理 429 次回應
  • 批次請求:儘可能將多個提示合併
  • 監控使用情況:追蹤你的代幣消費與請求模式
  • 使用適當模型:選擇適合您使用情境的 Claude 模型

負責任 AI 的考量因素

在 Foundry 中使用 Claude 模型時,請考慮以下負責任的 AI 實踐:

最佳做法

在 Foundry 中使用 Claude 模型時,請遵循以下最佳實務:

型號選擇

根據您的具體需求選擇合適的 Claude 型號:

  • Claude Opus 4.5:在編碼、代理程式、電腦使用及企業工作流程中達到最佳效能
  • Claude Sonnet 4.5:為了平衡效能與能力,製作工作流程
  • Claude Haiku 4.5:為了速度與成本優化,進行大量處理
  • Claude Opus 4.1:用於複雜推理與企業應用

提示工程

  • 明確指示:提供具體且詳盡的提示
  • 情境管理:有效利用可用的情境視窗
  • 角色定義:利用系統訊息定義助理的角色與行為
  • 結構化提示:使用一致格式以獲得更好效果

成本優化

  • 代幣管理:監控並優化代幣使用情況
  • 模型選擇:根據你的使用情境,選擇最具成本效益的模型
  • 快取:在適當情況下實作明確的提示快取
  • 請求批次處理:盡可能合併多個請求