次の表に、Microsoft.CognitiveServices/accounts/projects リソースの種類で使用できるメトリックを示します。
テーブル見出し
メトリック - Azure Portal に表示されるメトリックの表示名。
Rest API の名前 - REST API で参照されるメトリック名。
単位 - 測定単位。
集計 - 既定の 集計 の種類。 有効な値: 平均、最小、最大、合計、数。
ディメンション - メトリックで使用できるディメンション。
時間粒度 - メトリックのサンプリングが行われる間隔。 たとえば、PT1M は、メトリックを 1 分ごとに、PT30Mは 30 分ごとに、PT1H は 1 時間ごとにサンプリングすることを示します。
DS エクスポート - メトリックが診断設定を使用して Azure Monitor ログにエクスポート可能かどうか。
メトリックのエクスポートの詳細については、「- データ収集ルールを使用したメトリックのエクスポート 」および 「Azure Monitor での診断設定の作成」を参照してください。
メトリックのリテンション期間の詳細については、「 Azure Monitor メトリックの概要」を参照してください。
カテゴリ: AI エージェント
| メトリック | REST API での名前 | 単位 | 集約 | 次元 | タイムグレインズ | DS エクスポート |
|---|---|---|---|---|---|---|
|
エージェント イベント (プレビュー) このプロジェクトの AI エージェントのイベントの数。 |
AgentEvents |
数える | Count、Total (Sum)、Average、Maximum、Minimum | EventType |
PT1M | いいえ |
|
エージェント入力トークン (プレビュー) このプロジェクトの AI エージェントの入力トークンの数。 |
AgentInputTokens |
数える | 合計(総和)、平均、最大値、最小値 |
AgentId、 ModelName、 TokenType |
PT1M | いいえ |
|
エージェント ユーザー メッセージ (プレビュー) このプロジェクトの AI エージェント ユーザー メッセージのイベントの数。 |
AgentMessages |
数える | Count、Total (Sum)、Average、Maximum、Minimum |
EventType、ThreadId |
PT1M | いいえ |
|
エージェント出力トークン (プレビュー) このプロジェクトの AI エージェントの出力トークンの数。 |
AgentOutputTokens |
数える | 合計(総和)、平均、最大値、最小値 |
AgentId、 ModelName、 TokenType |
PT1M | いいえ |
|
エージェントの応答 (プレビュー) このプロジェクトの AI エージェントによる応答の数。 |
AgentResponses |
数える | Count、Total (Sum)、Average、Maximum、Minimum |
AgentId、 ModelName、 ResponseStatus |
PT1M | いいえ |
|
エージェントの実行 (プレビュー) このプロジェクトの AI エージェントによる実行の数。 |
AgentRuns |
数える | Count、Total (Sum)、Average、Maximum、Minimum |
AgentId、 ModelName、 RunStatus、 StatusCode、 ThreadId、 StreamType |
PT1M | いいえ |
|
エージェント スレッド (プレビュー) このプロジェクトの AI エージェント スレッドのイベントの数。 |
AgentThreads |
数える | Count、Total (Sum)、Average、Maximum、Minimum | EventType |
PT1M | いいえ |
|
エージェント ツールの呼び出し (プレビュー) このプロジェクトで AI エージェントによって行われたツール呼び出しの数。 |
AgentToolCalls |
数える | Count、Total (Sum)、Average、Maximum、Minimum |
AgentId、 ModelName、 ToolName |
PT1M | いいえ |
|
エージェント使用状況のインデックス付きファイル (プレビュー) このプロジェクトでの取得など、AI エージェントの使用に対してインデックスが作成されたファイルの数。 |
AgentUsageIndexedFiles |
数える | Count、Total (Sum)、Average、Maximum、Minimum |
ErrorCode、 Status、 VectorStoreId |
PT1M | いいえ |
カテゴリ: モデル - HTTP 要求
| メトリック | REST API での名前 | 単位 | 集約 | 次元 | タイムグレインズ | DS エクスポート |
|---|---|---|---|---|---|---|
|
モデルの可用性率 次の計算による可用性の割合: (呼び出しの合計数 - サーバー エラー)/呼び出しの合計数。 サーバー エラーには、HTTP 応答 >=500 が含まれます。 |
ModelAvailabilityRate |
パーセント | 最小値、最大値、平均値 |
Region、 ModelDeploymentName、 ModelName、 ModelVersion |
PT1M | いいえ |
|
モデル要求 一定期間にモデル API に対して行われた呼び出しの数。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。 |
ModelRequests |
数える | 合計 (和) |
ApiName、 OperationName、 Region、 StreamType、 ModelDeploymentName、 ModelName、 ModelVersion、 StatusCode |
PT1M | イエス |
カテゴリ: モデル - 待機時間
| メトリック | REST API での名前 | 単位 | 集約 | 次元 | タイムグレインズ | DS エクスポート |
|---|---|---|---|---|---|---|
|
トークン間の時間 ストリーミング要求の場合。モデル トークン生成率 (ミリ秒単位)。 PTU と PTU で管理されるデプロイに適用されます。 |
NormalizedTimeBetweenTokens |
ミリ秒 | 最大、最小、平均 |
ApiName、 OperationName、 Region、 StreamType、 ModelDeploymentName、 ModelName、 ModelVersion |
PT1M | イエス |
|
正規化された最初のバイトまでの時間 ストリーミング要求と非ストリーミング要求の場合。要求がモデルによって行われ、トークンによって正規化された後に、応答データの最初のバイトが受信されるまでにかかる時間。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。 |
NormalizedTimeToFirstToken |
ミリ秒 | 最大、最小、平均 |
ApiName、 OperationName、 Region、 StreamType、 ModelDeploymentName、 ModelName、 ModelVersion |
PT1M | イエス |
|
最後のバイトまでの時間 ストリーミング要求と非ストリーミング要求の場合。モデルによって要求が行われた後、応答データの最後のバイトが受信されるまでにかかる時間。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。 |
TimeToLastByte |
ミリ秒 | 最大、最小、平均 |
ApiName、 OperationName、 Region、 StreamType、 ModelDeploymentName、 ModelName、 ModelVersion |
PT1M | イエス |
|
Time to Response ストリーミング要求に推奨される待機時間 (応答性) の測定方法。 PTU と PTU で管理されるデプロイに適用されます。 API ゲートウェイによって測定された、ユーザーがプロンプトを送信した後に最初の応答が表示されるまでの所要時間として計算されます。 この数字は、プロンプト サイズが増えたりキャッシュ ヒット サイズが減ったりすると、大きくなります。 応答メトリックの内訳時間を設定するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion というディメンションで分割を適用します。 注: このメトリックは、測定された待機時間が同時呼び出しや全体的なワークロード パターンなど、複数の要因に大きく依存するため、近似値です。 さらに、クライアントと API エンドポイントの間に存在する可能性のあるクライアント側の待機時間は考慮されません。 最適な待機時間の追跡については、お客様のログ記録を参照してください。 |
TimeToResponse |
ミリ秒 | 最小値、最大値、平均値 |
ApiName、 OperationName、 Region、 StreamType、 ModelDeploymentName、 ModelName、 ModelVersion、 StatusCode |
PT1M | イエス |
|
1 秒あたりのトークン数 特定のモデル応答の生成速度を列挙します。 生成されたトークンの合計は、トークンを生成する時間 (秒単位) で除算されます。 PTU と PTU で管理されるデプロイに適用されます。 |
TokensPerSecond |
数える | 最大、最小、平均 |
ApiName、 OperationName、 Region、 StreamType、 ModelDeploymentName、 ModelName、 ModelVersion |
PT1M | イエス |
カテゴリ: モデル - 使用法
| メトリック | REST API での名前 | 単位 | 集約 | 次元 | タイムグレインズ | DS エクスポート |
|---|---|---|---|---|---|---|
|
オーディオ入力トークン OpenAI モデルで処理 (入力) されたオーディオ プロンプト トークンの数。 PTU マネージド モデルのデプロイに適用されます。 |
AudioInputTokens |
数える | 合計 (和) |
ModelDeploymentName、 ModelName、 ModelVersion、 Region |
PT1M | イエス |
|
オーディオ出力トークン OpenAI モデルで生成 (出力) されたオーディオ プロンプト トークンの数。 PTU マネージド モデルのデプロイに適用されます。 |
AudioOutputTokens |
数える | 合計 (和) |
ModelDeploymentName、 ModelName、 ModelVersion、 Region |
PT1M | イエス |
|
入力トークン モデルで処理 (入力) されたプロンプト トークンの数。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。 |
InputTokens |
数える | 合計 (和) |
ApiName、 Region、 ModelDeploymentName、 ModelName、 ModelVersion |
PT1M | イエス |
|
出力トークン OpenAI モデルから生成 (出力) されたトークンの数。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。 |
OutputTokens |
数える | 合計 (和) |
ApiName、 Region、 ModelDeploymentName、 ModelName、 ModelVersion |
PT1M | イエス |
|
プロビジョニングされた使用率 プロビジョニング済みマネージドの使用率、(使用された PTU/デプロイされた PTU) x 100 として計算されます。 使用率が 100% 以上の場合、呼び出しは調整され、エラー コード 429 が返されます。 |
ProvisionedUtilization |
パーセント | 最小値、最大値、平均値 |
Region、 ModelDeploymentName、 ModelName、 ModelVersion |
PT1M | いいえ |
|
合計トークン数 モデルで処理された推論トークンの数。 プロンプト トークン (入力) と生成されたトークン (出力) として計算されます。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。 |
TotalTokens |
数える | 合計 (和) |
ApiName、 Region、 ModelDeploymentName、 ModelName、 ModelVersion |
PT1M | イエス |