微調模型之後,您可以透過聊天完成 API 或 評估 服務來測試其品質。
開發人員層部署可讓您部署新的模型,而不需要標準或全域部署所產生的每小時裝載費用。 唯一產生的費用是依據權杖計算。 如需最新的價格,請參閱價格頁面。
這很重要
開發人員方案不提供可用性 SLA,也沒有資料存放保證。 如果您需要 SLA 或資料落地,請選擇替代 部署類型 來測試您的模型。
開發人員層部署的固定存留期為 24小時。 深入了解下面的部署生命週期。
部署已微調的模型
若要部署候選模型,請選取要部署的微調模型,然後選取 [ 部署]。
[部署模型] 對話方塊隨即開啟。 在對話框中,輸入您的 [部署名稱 ],然後從 [部署類型] 下拉式清單中選取 [ 開發人員 ]。 選取 [建立] 以開始部署自定義模型。
你可以在 Microsoft Foundry 入口網站的 部署 面板中監控新部署的進度。
import json
import os
import requests
token = os.getenv("<TOKEN>")
subscription = "<YOUR_SUBSCRIPTION_ID>"
resource_group = "<YOUR_RESOURCE_GROUP_NAME>"
resource_name = "<YOUR_AZURE_OPENAI_RESOURCE_NAME>"
model_deployment_name = "gpt41-mini-candidate-01" # custom deployment name that you will use to reference the model when making inference calls.
deploy_params = {'api-version': "2025-07-01-preview"}
deploy_headers = {'Authorization': 'Bearer {}'.format(token), 'Content-Type': 'application/json'}
deploy_data = {
"sku": {"name": "developertier", "capacity": 50},
"properties": {
"model": {
"format": "OpenAI",
"name": <"fine_tuned_model">, #retrieve this value from the previous call, it will look like gpt41-mini-candidate-01.ft-b044a9d3cf9c4228b5d393567f693b83
"version": "1"
}
}
}
deploy_data = json.dumps(deploy_data)
request_url = f'https://management.azure.com/subscriptions/{subscription}/resourceGroups/{resource_group}/providers/Microsoft.CognitiveServices/accounts/{resource_name}/deployments/{model_deployment_name}'
print('Creating a new deployment...')
r = requests.put(request_url, params=deploy_params, headers=deploy_headers, data=deploy_data)
print(r)
print(r.reason)
print(r.json())
| 變數 |
定義 |
| Token |
有多種方式可以產生授權令牌。 初始測試最簡單的方法是從 Azure 入口網站啟動Cloud Shell。 接著,執行 az account get-access-token。 您可以使用此權杖作為 API 測試的暫時授權權杖。 建議您將此儲存在新的環境變數中。 |
| 月租方案 |
相關聯 Azure OpenAI 資源的訂閱識別碼。 |
| 資源群組 |
Azure OpenAI 資源的資源群組名稱。 |
| 資源名稱 |
Azure OpenAI 資源名稱。 |
| 模型部署名稱 |
新微調模型部署的自訂名稱。 這是在程式碼中執行聊天完成功能調用時參考的名稱。 |
| fine_tuned_model |
從上一個步驟的微調作業結果中擷取此值。 其將會如 gpt41-mini-candidate-01.ft-b044a9d3cf9c4228b5d393567f693b83 所示。 您必須將此值新增至 deploy_data json。 或者,您也可以透過傳遞檢查點識別碼 (格式為 ftchkpt-e559c011ecc04fc68eaa339d8227d02d) 來部署檢查點 |
下列範例示範如何使用 REST API 來為您的自定義模型建立模型部署。 REST API 會產生自訂模型部署的名稱。
curl -X POST "https://management.azure.com/subscriptions/<SUBSCRIPTION>/resourceGroups/<RESOURCE_GROUP>/providers/Microsoft.CognitiveServices/accounts/<RESOURCE_NAME>/deployments/<MODEL_DEPLOYMENT_NAME>?api-version=2025-07-01-preview" \
-H "Authorization: Bearer <TOKEN>" \
-H "Content-Type: application/json" \
-d '{
"sku": {"name": "developertier", "capacity": 50},
"properties": {
"model": {
"format": "OpenAI",
"name": "<FINE_TUNED_MODEL>",
"version": "1"
}
}
}'
| 變數 |
定義 |
| Token |
有多種方式可以產生授權令牌。 初始測試最簡單的方法是從 Azure 入口網站啟動Cloud Shell。 接著,執行 az account get-access-token。 您可以使用此權杖作為 API 測試的暫時授權權杖。 建議您將此儲存在新的環境變數中。 |
| 月租方案 |
相關聯 Azure OpenAI 資源的訂閱識別碼。 |
| 資源群組 |
Azure OpenAI 資源的資源群組名稱。 |
| 資源名稱 |
Azure OpenAI 資源名稱。 |
| 模型部署名稱 |
新微調模型部署的自訂名稱。 這是在程式碼中執行聊天完成功能調用時參考的名稱。 |
| fine_tuned_model |
從上一個步驟的微調作業結果中擷取此值。 其將會如 gpt-4.1-mini-2025-04-14.ft-b044a9d3cf9c4228b5d393567f693b83 所示。 您必須將此值新增至 deploy_data json。 或者,您也可以透過傳遞檢查點識別碼 (格式為 ftchkpt-e559c011ecc04fc68eaa339d8227d02d) 來部署檢查點 |
使用 Azure CLI 部署模型
下列範例示範如何使用 Azure CLI 來部署自訂模型。 使用 Azure CLI,您必須指定自訂模型部署的名稱。 如需如何使用 Azure CLI 部署自訂模型的詳細資訊,請參閱 az cognitiveservices account deployment。
若要在主控台視窗中執行此 Azure CLI 命令,您必須使用自訂模型的對應值取代下列<預留位置>:
| 預留位置 |
價值觀 |
|
<YOUR_AZURE_SUBSCRIPTION> |
您 Azure 訂用帳戶的名稱或識別碼。 |
|
<YOUR_RESOURCE_GROUP> |
Azure 資源群組的名稱。 |
|
<YOUR_RESOURCE_NAME> |
您 Azure OpenAI 資源的名稱。 |
|
<YOUR_DEPLOYMENT_NAME> |
您要用於模型部署的名稱。 |
|
<YOUR_FINE_TUNED_MODEL_ID> |
您自訂模型的名稱。 |
az cognitiveservices account deployment create
--resource-group <YOUR_RESOURCE_GROUP>
--name <YOUR_RESOURCE_NAME>
--deployment-name <YOUR_DEPLOYMENT_NAME>
--model-name <YOUR_FINE_TUNED_MODEL_ID>
--model-version "1"
--model-format OpenAI
--sku-capacity "50"
--sku-name "Developer"
使用已部署的微調模型
部署自訂模型後,您就能如同使用其他部署模型般使用該模型。 您可以使用 Foundry 入口網站中的 [遊樂場] 對新部署進行實驗。 您可以繼續對自訂模型使用相同的參數,例如 temperature 和 max_tokens,如同對其他部署模型一樣。
您也可以使用 Evaluations 服務,針對已部署的模型候選專案和其他模型版本建立和執行模型評估。
import os
from openai import OpenAI
client = OpenAI(
base_url = "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/",
api_key=os.getenv("AZURE_OPENAI_API_KEY"),
)
response = client.chat.completions.create(
model="gpt41-mini-candidate-01", # model = "Custom deployment name you chose for your fine-tuning model"
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Does Azure OpenAI support customer managed keys?"},
{"role": "assistant", "content": "Yes, customer managed keys are supported by Azure OpenAI."},
{"role": "user", "content": "Do other Foundry Tools support this too?"}
]
)
print(response.choices[0].message.content)
curl $AZURE_OPENAI_ENDPOINT/openai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "api-key: $AZURE_OPENAI_API_KEY" \
-d '"model": "YOUR_MODEL_DEPLOYMENT_NAME", {"messages":[{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": "Does Azure OpenAI support customer managed keys?"},{"role": "assistant", "content": "Yes, customer managed keys are supported by Azure OpenAI."},{"role": "user", "content": "Do other Foundry Tools support this too?"}]}'
清除您的部署
不論活動為何,開發人員部署都會自行自動刪除。 每個部署的固定存留期為 24小時 ,之後會遭到移除。 刪除部署並不會刪除或影響基礎自定義模型,而且可以隨時重新部署自定義模型。
若要手動刪除部署,可以使用 Foundry 入口網站或 Azure CLI。
若要使用 部署 - 刪除 REST API ,請將 HTTP DELETE 傳送至部署資源。 像建立部署一樣,您必須指定下列參數:
- Azure 訂用帳戶識別碼
- Azure 資源組名
- Azure OpenAI 資源名稱
- 要刪除的部署名稱
以下是刪除部署的 REST API 範例:
curl -X DELETE "https://management.azure.com/subscriptions/<SUBSCRIPTION>/resourceGroups/<RESOURCE_GROUP>/providers/Microsoft.CognitiveServices/accounts/<RESOURCE_NAME>/deployments/<MODEL_DEPLOYMENT_NAME>?api-version=2025-07-01-preview" \
-H "Authorization: Bearer <TOKEN>"
後續步驟