Microsoft.CognitiveServices/accounts/projects でサポートされているメトリック

次の表に、Microsoft.CognitiveServices/accounts/projects リソースの種類で使用できるメトリックを示します。

テーブル見出し

メトリック - Azure Portal に表示されるメトリックの表示名。
Rest API の名前 - REST API で参照されるメトリック名。
単位 - 測定単位。
集計 - 既定の集計の種類。有効な値: 平均、最小、最大、合計、数。
ディメンション - メトリックで使用できるディメンション。
時間粒度 - メトリックのサンプリングが行われる間隔。たとえば、PT1M は、メトリックを 1 分ごとに、PT30Mは 30 分ごとに、PT1H は 1 時間ごとにサンプリングすることを示します。
DS エクスポート - メトリックが診断設定を使用して Azure Monitor ログにエクスポート可能かどうか。

メトリックのエクスポートの詳細については、「- データ収集ルールを使用したメトリックのエクスポート」および「Azure Monitor での診断設定の作成」を参照してください。

メトリックのリテンション期間の詳細については、「 Azure Monitor メトリックの概要」を参照してください。

カテゴリ: AI エージェント

メトリック	REST API での名前	単位	集約	次元	タイムグレインズ	DS エクスポート
エージェントイベント (プレビュー) このプロジェクトの AI エージェントのイベントの数。	`AgentEvents`	数える	Count、Total (Sum)、Average、Maximum、Minimum	`EventType`	PT1M	いいえ
エージェント入力トークン (プレビュー) このプロジェクトの AI エージェントの入力トークンの数。	`AgentInputTokens`	数える	合計（総和）、平均、最大値、最小値	`AgentId`、 `ModelName`、 `TokenType`	PT1M	いいえ
エージェントユーザーメッセージ (プレビュー) このプロジェクトの AI エージェントユーザーメッセージのイベントの数。	`AgentMessages`	数える	Count、Total (Sum)、Average、Maximum、Minimum	`EventType`、`ThreadId`	PT1M	いいえ
エージェント出力トークン (プレビュー) このプロジェクトの AI エージェントの出力トークンの数。	`AgentOutputTokens`	数える	合計（総和）、平均、最大値、最小値	`AgentId`、 `ModelName`、 `TokenType`	PT1M	いいえ
エージェントの応答 (プレビュー) このプロジェクトの AI エージェントによる応答の数。	`AgentResponses`	数える	Count、Total (Sum)、Average、Maximum、Minimum	`AgentId`、 `ModelName`、 `ResponseStatus`	PT1M	いいえ
エージェントの実行 (プレビュー) このプロジェクトの AI エージェントによる実行の数。	`AgentRuns`	数える	Count、Total (Sum)、Average、Maximum、Minimum	`AgentId`、 `ModelName`、 `RunStatus`、 `StatusCode`、 `ThreadId`、 `StreamType`	PT1M	いいえ
エージェントスレッド (プレビュー) このプロジェクトの AI エージェントスレッドのイベントの数。	`AgentThreads`	数える	Count、Total (Sum)、Average、Maximum、Minimum	`EventType`	PT1M	いいえ
エージェントツールの呼び出し (プレビュー) このプロジェクトで AI エージェントによって行われたツール呼び出しの数。	`AgentToolCalls`	数える	Count、Total (Sum)、Average、Maximum、Minimum	`AgentId`、 `ModelName`、 `ToolName`	PT1M	いいえ
エージェント使用状況のインデックス付きファイル (プレビュー) このプロジェクトでの取得など、AI エージェントの使用に対してインデックスが作成されたファイルの数。	`AgentUsageIndexedFiles`	数える	Count、Total (Sum)、Average、Maximum、Minimum	`ErrorCode`、 `Status`、 `VectorStoreId`	PT1M	いいえ

カテゴリ: モデル - HTTP 要求

メトリック	REST API での名前	単位	集約	次元	タイムグレインズ	DS エクスポート
モデルの可用性率次の計算による可用性の割合: (呼び出しの合計数 - サーバーエラー)/呼び出しの合計数。サーバーエラーには、HTTP 応答 >=500 が含まれます。	`ModelAvailabilityRate`	パーセント	最小値、最大値、平均値	`Region`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	いいえ
モデル要求一定期間にモデル API に対して行われた呼び出しの数。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。	`ModelRequests`	数える	合計 (和)	`ApiName`、 `OperationName`、 `Region`、 `StreamType`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`、 `StatusCode`	PT1M	イエス

カテゴリ: モデル - 待機時間

メトリック	REST API での名前	単位	集約	次元	タイムグレインズ	DS エクスポート
トークン間の時間ストリーミング要求の場合。モデルトークン生成率 (ミリ秒単位)。 PTU と PTU で管理されるデプロイに適用されます。	`NormalizedTimeBetweenTokens`	ミリ秒	最大、最小、平均	`ApiName`、 `OperationName`、 `Region`、 `StreamType`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	イエス
正規化された最初のバイトまでの時間ストリーミング要求と非ストリーミング要求の場合。要求がモデルによって行われ、トークンによって正規化された後に、応答データの最初のバイトが受信されるまでにかかる時間。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。	`NormalizedTimeToFirstToken`	ミリ秒	最大、最小、平均	`ApiName`、 `OperationName`、 `Region`、 `StreamType`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	イエス
最後のバイトまでの時間ストリーミング要求と非ストリーミング要求の場合。モデルによって要求が行われた後、応答データの最後のバイトが受信されるまでにかかる時間。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。	`TimeToLastByte`	ミリ秒	最大、最小、平均	`ApiName`、 `OperationName`、 `Region`、 `StreamType`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	イエス
Time to Response ストリーミング要求に推奨される待機時間 (応答性) の測定方法。 PTU と PTU で管理されるデプロイに適用されます。 API ゲートウェイによって測定された、ユーザーがプロンプトを送信した後に最初の応答が表示されるまでの所要時間として計算されます。この数字は、プロンプトサイズが増えたりキャッシュヒットサイズが減ったりすると、大きくなります。応答メトリックの内訳時間を設定するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion というディメンションで分割を適用します。注: このメトリックは、測定された待機時間が同時呼び出しや全体的なワークロードパターンなど、複数の要因に大きく依存するため、近似値です。さらに、クライアントと API エンドポイントの間に存在する可能性のあるクライアント側の待機時間は考慮されません。最適な待機時間の追跡については、お客様のログ記録を参照してください。	`TimeToResponse`	ミリ秒	最小値、最大値、平均値	`ApiName`、 `OperationName`、 `Region`、 `StreamType`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`、 `StatusCode`	PT1M	イエス
1 秒あたりのトークン数特定のモデル応答の生成速度を列挙します。生成されたトークンの合計は、トークンを生成する時間 (秒単位) で除算されます。 PTU と PTU で管理されるデプロイに適用されます。	`TokensPerSecond`	数える	最大、最小、平均	`ApiName`、 `OperationName`、 `Region`、 `StreamType`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	イエス

カテゴリ: モデル - 使用法

メトリック	REST API での名前	単位	集約	次元	タイムグレインズ	DS エクスポート
オーディオ入力トークン OpenAI モデルで処理 (入力) されたオーディオプロンプトトークンの数。 PTU マネージドモデルのデプロイに適用されます。	`AudioInputTokens`	数える	合計 (和)	`ModelDeploymentName`、 `ModelName`、 `ModelVersion`、 `Region`	PT1M	イエス
オーディオ出力トークン OpenAI モデルで生成 (出力) されたオーディオプロンプトトークンの数。 PTU マネージドモデルのデプロイに適用されます。	`AudioOutputTokens`	数える	合計 (和)	`ModelDeploymentName`、 `ModelName`、 `ModelVersion`、 `Region`	PT1M	イエス
入力トークンモデルで処理 (入力) されたプロンプトトークンの数。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。	`InputTokens`	数える	合計 (和)	`ApiName`、 `Region`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	イエス
出力トークン OpenAI モデルから生成 (出力) されたトークンの数。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。	`OutputTokens`	数える	合計 (和)	`ApiName`、 `Region`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	イエス
プロビジョニングされた使用率プロビジョニング済みマネージドの使用率、(使用された PTU/デプロイされた PTU) x 100 として計算されます。使用率が 100% 以上の場合、呼び出しは調整され、エラーコード 429 が返されます。	`ProvisionedUtilization`	パーセント	最小値、最大値、平均値	`Region`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	いいえ
合計トークン数モデルで処理された推論トークンの数。プロンプトトークン (入力) と生成されたトークン (出力) として計算されます。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。	`TotalTokens`	数える	合計 (和)	`ApiName`、 `Region`、 `ModelDeploymentName`、 `ModelName`、 `ModelVersion`	PT1M	イエス

次のステップ

フィードバック

このページはお役に立ちましたか?

Last updated on 2025-10-31