下表列出 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 資源類型的可用計量。
資料表標題
計量 - Azure 入口網站中顯示的計量顯示名稱。
Rest API 中的名稱 - REST API 中所指的計量名稱。
單位 - 測量單位。
彙總 - 預設彙總類型。 有效值:Average、Minimum、Maximum、Total、Count。
維度 - 計量可用的維度。
時間精細度 - 計量取樣的間隔 (部分內容可能是機器或 AI 翻譯)。 例如,PT1M 表示計量會每分鐘取樣、每 30 分鐘PT30M、每小時 PT1H,以此類推。
DS 匯出 - 計量是否可透過診斷設定導出至 Azure 監視器記錄。
如需匯出計量的資訊,請參閱 - 使用數據收集規則 匯出計量和 在 Azure 監視器中建立診斷設定。
如需計量保留的相關資訊,請參閱 Azure 監視器計量概觀。
類別:資源
| 計量 | REST API 中的名稱 | 單位 | 彙總 | 維度 | 時間精細度 | DS 匯出 |
|---|---|---|---|---|---|---|
|
CPU 記憶體使用率百分比 執行個體上的記憶體使用率百分比。 使用量會以一分鐘為間隔提供報告。 |
CpuMemoryUtilizationPercentage |
百分比 | 下限、上限、平均 | instanceId |
PT1M | Yes |
|
CPU 使用率百分比 執行個體上的 CPU 使用率百分比。 使用量會以一分鐘為間隔提供報告。 |
CpuUtilizationPercentage |
百分比 | 下限、上限、平均 | instanceId |
PT1M | Yes |
|
每分鐘資料收集錯誤 每分鐘捨棄的資料收集事件數目。 |
DataCollectionErrorsPerMinute |
計數 | 下限、上限、平均 |
instanceId、reason、type |
PT1M | 不 |
|
每分鐘資料收集活動 每分鐘處理的資料收集事件數目。 |
DataCollectionEventsPerMinute |
計數 | 下限、上限、平均 |
instanceId、type |
PT1M | 不 |
|
部署容量 部署中的實例數量。 |
DeploymentCapacity |
計數 | 下限、上限、平均 |
instanceId、State |
PT1M | 不 |
|
磁碟使用率 執行個體上的磁碟使用率百分比。 使用量會以一分鐘為間隔提供報告。 |
DiskUtilization |
百分比 | 下限、上限、平均 |
instanceId、disk |
PT1M | Yes |
|
以焦耳表示 GPU 能源 GPU 節點上的間隔能源 (焦耳)。 能源會以一分鐘的間隔提供報告。 |
GpuEnergyJoules |
計數 | 下限、上限、平均 | instanceId |
PT1M | 不 |
|
GPU 記憶體使用率百分比 執行個體上的 GPU 記憶體使用率百分比。 使用量會以一分鐘為間隔提供報告。 |
GpuMemoryUtilizationPercentage |
百分比 | 下限、上限、平均 | instanceId |
PT1M | Yes |
|
GPU 使用率百分比 執行個體上的 GPU 使用率百分比。 使用量會以一分鐘為間隔提供報告。 |
GpuUtilizationPercentage |
百分比 | 下限、上限、平均 | instanceId |
PT1M | Yes |
類別:流量
| 計量 | REST API 中的名稱 | 單位 | 彙總 | 維度 | 時間精細度 | DS 匯出 |
|---|---|---|---|---|---|---|
|
要求延遲 P50 由在所選時間期間收集之所有要求延遲值彙總的平均 P50 要求延遲 |
RequestLatency_P50 |
毫秒 | 平均 | <無> | PT1M | Yes |
|
要求延遲 P90 由在所選時間期間收集之所有要求延遲值彙總的平均 P90 要求延遲 |
RequestLatency_P90 |
毫秒 | 平均 | <無> | PT1M | Yes |
|
要求延遲 P95 由在所選時間期間收集之所有要求延遲值彙總的平均 P95 要求延遲 |
RequestLatency_P95 |
毫秒 | 平均 | <無> | PT1M | Yes |
|
要求延遲 P99 由在所選時間期間收集之所有要求延遲值彙總的平均 P99 要求延遲 |
RequestLatency_P99 |
毫秒 | 平均 | <無> | PT1M | Yes |
|
每分鐘的請求數量 在一分鐘內傳送至線上部署的要求數目 |
RequestsPerMinute |
計數 | 平均 | envoy_response_code |
PT1M | 不 |