次の方法で共有


Microsoft.CognitiveServices/accounts/projects でサポートされているメトリック

次の表に、Microsoft.CognitiveServices/accounts/projects リソースの種類で使用できるメトリックを示します。

テーブル見出し

メトリック - Azure Portal に表示されるメトリックの表示名。
Rest API の名前 - REST API で参照されるメトリック名。
単位 - 測定単位。
集計 - 既定の 集計 の種類。 有効な値: 平均、最小、最大、合計、数。
ディメンション - メトリックで使用できるディメンション
時間粒度 - メトリックのサンプリングが行われる間隔。 たとえば、PT1M は、メトリックを 1 分ごとに、PT30Mは 30 分ごとに、PT1H は 1 時間ごとにサンプリングすることを示します。
DS エクスポート - メトリックが診断設定を使用して Azure Monitor ログにエクスポート可能かどうか。

メトリックのエクスポートの詳細については、「- データ収集ルールを使用したメトリックのエクスポート 」および 「Azure Monitor での診断設定の作成」を参照してください。

メトリックのリテンション期間の詳細については、「 Azure Monitor メトリックの概要」を参照してください。

カテゴリ: AI エージェント

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
エージェント イベント (プレビュー)

このプロジェクトの AI エージェントのイベントの数。
AgentEvents 数える Count、Total (Sum)、Average、Maximum、Minimum EventType PT1M いいえ
エージェント入力トークン (プレビュー)

このプロジェクトの AI エージェントの入力トークンの数。
AgentInputTokens 数える 合計(総和)、平均、最大値、最小値 AgentIdModelNameTokenType PT1M いいえ
エージェント ユーザー メッセージ (プレビュー)

このプロジェクトの AI エージェント ユーザー メッセージのイベントの数。
AgentMessages 数える Count、Total (Sum)、Average、Maximum、Minimum EventTypeThreadId PT1M いいえ
エージェント出力トークン (プレビュー)

このプロジェクトの AI エージェントの出力トークンの数。
AgentOutputTokens 数える 合計(総和)、平均、最大値、最小値 AgentIdModelNameTokenType PT1M いいえ
エージェントの応答 (プレビュー)

このプロジェクトの AI エージェントによる応答の数。
AgentResponses 数える Count、Total (Sum)、Average、Maximum、Minimum AgentIdModelNameResponseStatus PT1M いいえ
エージェントの実行 (プレビュー)

このプロジェクトの AI エージェントによる実行の数。
AgentRuns 数える Count、Total (Sum)、Average、Maximum、Minimum AgentIdModelNameRunStatusStatusCodeThreadIdStreamType PT1M いいえ
エージェント スレッド (プレビュー)

このプロジェクトの AI エージェント スレッドのイベントの数。
AgentThreads 数える Count、Total (Sum)、Average、Maximum、Minimum EventType PT1M いいえ
エージェント ツールの呼び出し (プレビュー)

このプロジェクトで AI エージェントによって行われたツール呼び出しの数。
AgentToolCalls 数える Count、Total (Sum)、Average、Maximum、Minimum AgentIdModelNameToolName PT1M いいえ
エージェント使用状況のインデックス付きファイル (プレビュー)

このプロジェクトでの取得など、AI エージェントの使用に対してインデックスが作成されたファイルの数。
AgentUsageIndexedFiles 数える Count、Total (Sum)、Average、Maximum、Minimum ErrorCodeStatusVectorStoreId PT1M いいえ

カテゴリ: モデル - HTTP 要求

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
モデルの可用性率

次の計算による可用性の割合: (呼び出しの合計数 - サーバー エラー)/呼び出しの合計数。 サーバー エラーには、HTTP 応答 >=500 が含まれます。
ModelAvailabilityRate パーセント 最小値、最大値、平均値 RegionModelDeploymentNameModelNameModelVersion PT1M いいえ
モデル要求

一定期間にモデル API に対して行われた呼び出しの数。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。
ModelRequests 数える 合計 (和) ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersionStatusCode PT1M イエス

カテゴリ: モデル - 待機時間

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
トークン間の時間

ストリーミング要求の場合。モデル トークン生成率 (ミリ秒単位)。 PTU と PTU で管理されるデプロイに適用されます。
NormalizedTimeBetweenTokens ミリ秒 最大、最小、平均 ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersion PT1M イエス
正規化された最初のバイトまでの時間

ストリーミング要求と非ストリーミング要求の場合。要求がモデルによって行われ、トークンによって正規化された後に、応答データの最初のバイトが受信されるまでにかかる時間。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。
NormalizedTimeToFirstToken ミリ秒 最大、最小、平均 ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersion PT1M イエス
最後のバイトまでの時間

ストリーミング要求と非ストリーミング要求の場合。モデルによって要求が行われた後、応答データの最後のバイトが受信されるまでにかかる時間。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。
TimeToLastByte ミリ秒 最大、最小、平均 ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersion PT1M イエス
Time to Response

ストリーミング要求に推奨される待機時間 (応答性) の測定方法。 PTU と PTU で管理されるデプロイに適用されます。 API ゲートウェイによって測定された、ユーザーがプロンプトを送信した後に最初の応答が表示されるまでの所要時間として計算されます。 この数字は、プロンプト サイズが増えたりキャッシュ ヒット サイズが減ったりすると、大きくなります。 応答メトリックの内訳時間を設定するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion というディメンションで分割を適用します。

注: このメトリックは、測定された待機時間が同時呼び出しや全体的なワークロード パターンなど、複数の要因に大きく依存するため、近似値です。 さらに、クライアントと API エンドポイントの間に存在する可能性のあるクライアント側の待機時間は考慮されません。 最適な待機時間の追跡については、お客様のログ記録を参照してください。
TimeToResponse ミリ秒 最小値、最大値、平均値 ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersionStatusCode PT1M イエス
1 秒あたりのトークン数

特定のモデル応答の生成速度を列挙します。 生成されたトークンの合計は、トークンを生成する時間 (秒単位) で除算されます。 PTU と PTU で管理されるデプロイに適用されます。
TokensPerSecond 数える 最大、最小、平均 ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersion PT1M イエス

カテゴリ: モデル - 使用法

メトリック REST API での名前 単位 集約 次元 タイムグレインズ DS エクスポート
オーディオ入力トークン

OpenAI モデルで処理 (入力) されたオーディオ プロンプト トークンの数。 PTU マネージド モデルのデプロイに適用されます。
AudioInputTokens 数える 合計 (和) ModelDeploymentNameModelNameModelVersionRegion PT1M イエス
オーディオ出力トークン

OpenAI モデルで生成 (出力) されたオーディオ プロンプト トークンの数。 PTU マネージド モデルのデプロイに適用されます。
AudioOutputTokens 数える 合計 (和) ModelDeploymentNameModelNameModelVersionRegion PT1M イエス
入力トークン

モデルで処理 (入力) されたプロンプト トークンの数。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。
InputTokens 数える 合計 (和) ApiNameRegionModelDeploymentNameModelNameModelVersion PT1M イエス
出力トークン

OpenAI モデルから生成 (出力) されたトークンの数。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。
OutputTokens 数える 合計 (和) ApiNameRegionModelDeploymentNameModelNameModelVersion PT1M イエス
プロビジョニングされた使用率

プロビジョニング済みマネージドの使用率、(使用された PTU/デプロイされた PTU) x 100 として計算されます。 使用率が 100% 以上の場合、呼び出しは調整され、エラー コード 429 が返されます。
ProvisionedUtilization パーセント 最小値、最大値、平均値 RegionModelDeploymentNameModelNameModelVersion PT1M いいえ
合計トークン数

モデルで処理された推論トークンの数。 プロンプト トークン (入力) と生成されたトークン (出力) として計算されます。 PTU、PTU で管理されるデプロイ、従量課金制のデプロイに適用されます。
TotalTokens 数える 合計 (和) ApiNameRegionModelDeploymentNameModelNameModelVersion PT1M イエス

次のステップ