다음 표에서는 Microsoft.MachineLearningServices/workspaces 리소스 종류에 사용할 수 있는 메트릭을 나열합니다.
테이블 제목
메트릭 - Azure Portal에 표시되는 메트릭 표시 이름입니다.
Rest API의 이름 - REST API에서 참조되는 메트릭 이름입니다.
단위 - 측정 단위입니다.
집계 - 기본 집계 형식입니다. 유효한 값: 평균, 최소값, 최대값, 합계, 개수입니다.
차원 - 메트릭에 사용할 수 있는 차원입니다.
시간 그레인 - 메트릭이 샘플링되는 간격을 나타냅니다. 예를 들어, PT1M은 메트릭이 1분마다, PT30M은 30분마다, PT1H는 1시간마다 샘플링됨을 나타냅니다.
DS 내보내기 - 진단 설정을 통해 메트릭을 Azure Monitor 로그로 내보낼 수 있는지 여부입니다.
메트릭을 내보내는 방법에 대한 자세한 내용은 - 데이터 수집 규칙을 사용하여 메트릭 내보내기 및 Azure Monitor에서 진단 설정 만들기를 참조하세요.
메트릭 보존에 관한 자세한 내용은 Azure Monitor 메트릭 개요를 참조하세요.
지원되는 로그 목록은 지원되는 로그 범주 - Microsoft.MachineLearningServices/workspaces를 참조 하세요.
범주: 에이전트
| 메트릭 | REST API의 이름 | 단위 | 집계 | 차원 | 시간 조직 | DS 내보내기 |
|---|---|---|---|---|---|---|
|
에이전트 이 작업 영역의 AI 에이전트에 대한 이벤트 수 |
Agents |
개수 | 평균, 최대, 최소, 합계(Sum) | EventType |
PT1M | 아니오 |
|
인덱싱된파일 이 작업 영역에서 파일 검색을 위해 인덱싱된 파일 수 |
IndexedFiles |
개수 | 평균, 최대, 최소, 합계(Sum) |
ErrorCode
Status
VectorStoreId
|
PT1M | 아니오 |
| 메시지 이 작업 영역의 AI 에이전트 메시지에 대한 이벤트 수 |
Messages |
개수 | 평균, 최대, 최소, 합계(Sum) |
EventType, ThreadId |
PT1M | 아니오 |
|
실행 이 작업 영역에서 AI 에이전트의 실행 수 |
Runs |
개수 | 평균, 최대, 최소, 합계(Sum) |
AgentId, RunStatus, StatusCodeStreamType |
PT1M | 아니오 |
|
Threads 이 작업 영역의 AI 에이전트 스레드에 대한 이벤트 수 |
Threads |
개수 | 평균, 최대, 최소, 합계(Sum) | EventType |
PT1M | 아니오 |
|
토큰 이 작업 영역의 AI 에이전트별 토큰 수 |
Tokens |
개수 | 평균, 최대, 최소, 합계(Sum) |
AgentId, TokenType |
PT1M | 아니오 |
|
ToolCalls 이 작업 영역에서 AI 에이전트가 수행한 도구 호출 |
ToolCalls |
개수 | 평균, 최대, 최소, 합계(Sum) |
AgentId, ToolName |
PT1M | 아니오 |
범주: 모델
| 메트릭 | REST API의 이름 | 단위 | 집계 | 차원 | 시간 조직 | DS 내보내기 |
|---|---|---|---|---|---|---|
|
모델 배포 실패 이 작업 영역에서 실패한 모델 배포 수 |
Model Deploy Failed |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario, StatusCode |
PT1M | 예 |
|
모델 배포 시작 이 작업 영역에서 시작한 모델 배포 수 |
Model Deploy Started |
개수 | 합계(합계), 평균, 최소, 최대, 개수 | Scenario |
PT1M | 예 |
|
모델 배포 성공 이 작업 영역에서 성공한 모델 배포 수 |
Model Deploy Succeeded |
개수 | 합계(합계), 평균, 최소, 최대, 개수 | Scenario |
PT1M | 예 |
|
모델 등록 실패 이 작업 영역에서 실패한 모델 등록 수 |
Model Register Failed |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario, StatusCode |
PT1M | 예 |
|
모델 등록 성공 이 작업 영역에서 성공한 모델 등록 수 |
Model Register Succeeded |
개수 | 합계(합계), 평균, 최소, 최대, 개수 | Scenario |
PT1M | 예 |
범주: 할당량
| 메트릭 | REST API의 이름 | 단위 | 집계 | 차원 | 시간 조직 | DS 내보내기 |
|---|---|---|---|---|---|---|
|
Active Cores 활성 코어 수 |
Active Cores |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario, ClusterName |
PT1M | 예 |
|
활성 노드 Active 노드의 수입니다. 다음은 작업을 적극적으로 실행하는 노드입니다. |
Active Nodes |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario, ClusterName |
PT1M | 예 |
|
유휴 코어 유휴 코어 수 |
Idle Cores |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario, ClusterName |
PT1M | 예 |
|
유휴 노드 유휴 노드 수. 유휴 노드는 어떤 작업도 실행하지 않지만 사용 가능한 경우 새 작업을 수락할 수 있는 노드입니다. |
Idle Nodes |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario, ClusterName |
PT1M | 예 |
|
나가는 코어 떠나는 코어 수 |
Leaving Cores |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario, ClusterName |
PT1M | 예 |
|
노드를 종료합니다. 나가는 노드 수. 나가는 노드란 방금 작업 처리를 완료했으며 곧 유휴 상태로 전환될 노드입니다. |
Leaving Nodes |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario, ClusterName |
PT1M | 예 |
|
선점된 코어 선점된 코어 수 |
Preempted Cores |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario, ClusterName |
PT1M | 예 |
|
선점된 노드 선점된 노드 수. 이러한 노드는 사용 가능한 노드 풀에서 제거되는 우선 순위가 낮은 노드입니다. |
Preempted Nodes |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario, ClusterName |
PT1M | 예 |
|
할당량 사용률 사용된 할당량의 백분율 |
Quota Utilization Percentage |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario, ClusterName, VmFamilyNameVmPriority |
PT1M | 예 |
|
총 코어 수 총 코어 수 |
Total Cores |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario, ClusterName |
PT1M | 예 |
|
총 노드 수 총 노드 수. 이 합계에는 일부 활성 노드, 유휴 노드, 사용할 수 없는 노드, 선점된 노드, 노드 종료가 포함됩니다. |
Total Nodes |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario, ClusterName |
PT1M | 예 |
|
사용할 수 없는 코어 사용할 수 없는 코어 수 |
Unusable Cores |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario, ClusterName |
PT1M | 예 |
|
사용할 수 없는 노드 사용할 수 없는 노드 수입니다. 해결할 수 없는 문제 때문에 사용할 수 없는 노드는 작동하지 않습니다. Azure에서는 이러한 노드를 재활용합니다. |
Unusable Nodes |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario, ClusterName |
PT1M | 예 |
범주: 리소스
| 메트릭 | REST API의 이름 | 단위 | 집계 | 차원 | 시간 조직 | DS 내보내기 |
|---|---|---|---|---|---|---|
|
CPU 용량 밀리코어 CPU 노드의 최대 용량(밀리코어). 용량은 1분 간격으로 집계됩니다. |
CpuCapacityMillicores |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
|
CpuMemoryCapacityMegabytes CPU 노드의 최대 메모리 사용률(메가바이트)입니다. 사용률은 1분 간격으로 집계됩니다. |
CpuMemoryCapacityMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
|
CpuMemoryUtilizationMegabytes CPU 노드의 메모리 사용률(MB)입니다. 사용률은 1분 간격으로 집계됩니다. |
CpuMemoryUtilizationMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
|
CpuMemoryUtilizationPercentage CPU 노드의 메모리 사용률 백분율입니다. 사용률은 1분 간격으로 집계됩니다. |
CpuMemoryUtilizationPercentage |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
|
CPU 사용률 CPU 노드의 사용률 비율입니다. 사용률은 1분 간격으로 보고됩니다. |
CpuUtilization |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario, runId, NodeIdClusterName |
PT1M | 예 |
|
CPU 사용밀리코어 CPU 노드의 사용률(밀리코어) 사용률은 1분 간격으로 집계됩니다. |
CpuUtilizationMillicores |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
|
CpuUtilizationPercentage CPU 노드의 사용률(%). 사용률은 1분 간격으로 집계됩니다. |
CpuUtilizationPercentage |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
|
DiskAvailMegabytes 사용 가능한 디스크 공간(MB)입니다. 메트릭은 1분 간격으로 집계됩니다. |
DiskAvailMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
|
DiskReadMegabytes 디스크에서 읽은 데이터(MB)입니다. 메트릭은 1분 간격으로 집계됩니다. |
DiskReadMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
|
DiskUsedMegabytes 사용된 디스크 공간(MB)입니다. 메트릭은 1분 간격으로 집계됩니다. |
DiskUsedMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
|
DiskWriteMegabytes 디스크에 기록된 데이터(MB)입니다. 메트릭은 1분 간격으로 집계됩니다. |
DiskWriteMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
|
GpuCapacityMilliGPUs GPU 디바이스의 최대 용량(밀리 GPU). 용량은 1분 간격으로 집계됩니다. |
GpuCapacityMilliGPUs |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId, InstanceId, DeviceIdComputeName |
PT1M | 예 |
|
GpuEnergyJoules GPU 노드의 간격 에너지(Joules). 에너지는 1분 간격으로 보고됩니다. |
GpuEnergyJoules |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario, runId, rootRunId, InstanceId, DeviceIdComputeName |
PT1M | 예 |
|
GpuMemoryCapacityMegabytes GPU 디바이스의 최대 메모리 용량(메가바이트)입니다. 용량은 1분 간격으로 집계됩니다. |
GpuMemoryCapacityMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId, InstanceId, DeviceIdComputeName |
PT1M | 예 |
|
GpuMemoryUtilization GPU 노드의 메모리 사용률 비율입니다. 사용률은 1분 간격으로 보고됩니다. |
GpuMemoryUtilization |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario, runId, NodeId, DeviceIdClusterName |
PT1M | 예 |
|
GpuMemoryUtilizationMegabytes GPU 디바이스의 메모리 사용률(MB). 사용률은 1분 간격으로 집계됩니다. |
GpuMemoryUtilizationMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId, InstanceId, DeviceIdComputeName |
PT1M | 예 |
|
GpuMemoryUtilizationPercentage GPU 디바이스의 메모리 사용률 비율입니다. 사용률은 1분 간격으로 집계됩니다. |
GpuMemoryUtilizationPercentage |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId, InstanceId, DeviceIdComputeName |
PT1M | 예 |
|
GpuUtilization GPU 노드의 사용률입니다. 사용률은 1분 간격으로 보고됩니다. |
GpuUtilization |
개수 | 평균, 최대, 최소, 합계(Sum) |
Scenario, runId, NodeId, DeviceIdClusterName |
PT1M | 예 |
|
GpuUtilizationMilliGPUs GPU 디바이스 사용률(밀리초). 사용률은 1분 간격으로 집계됩니다. |
GpuUtilizationMilliGPUs |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId, InstanceId, DeviceIdComputeName |
PT1M | 예 |
|
GpuUtilizationPercentage GPU 디바이스의 사용률(%). 사용률은 1분 간격으로 집계됩니다. |
GpuUtilizationPercentage |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId, InstanceId, DeviceIdComputeName |
PT1M | 예 |
|
IB 수신 메가바이트 InfiniBand를 통해 수신된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다. |
IBReceiveMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId, InstanceId, ComputeNameDeviceId |
PT1M | 예 |
|
IBTransmitMegabytes InfiniBand를 통해 발송된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다. |
IBTransmitMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId, InstanceId, ComputeNameDeviceId |
PT1M | 예 |
|
NetworkInputMegabytes 수신된 네트워크 데이터(메가바이트)입니다. 메트릭은 1분 간격으로 집계됩니다. |
NetworkInputMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId, InstanceId, ComputeNameDeviceId |
PT1M | 예 |
|
네트워크 출력 메가바이트 발송된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다. |
NetworkOutputMegabytes |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId, InstanceId, ComputeNameDeviceId |
PT1M | 예 |
| 저장소 API 오류 횟수 Azure Blob Storage API 호출 실패 횟수 |
StorageAPIFailureCount |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
|
저장소API성공횟수 Azure Blob Storage API 호출 성공 횟수 |
StorageAPISuccessCount |
개수 | 평균, 최대, 최소, 합계(Sum) |
RunId
InstanceId
ComputeName
|
PT1M | 예 |
범주: 달리기
| 메트릭 | REST API의 이름 | 단위 | 집계 | 차원 | 시간 조직 | DS 내보내기 |
|---|---|---|---|---|---|---|
|
요청된 실행 취소 이 작업 영역에 대해 취소가 요청된 실행 수. 실행에 대한 취소 요청을 받은 경우 개수가 업데이트됩니다. |
Cancel Requested Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName |
PT1M | 예 |
|
취소된 실행 이 작업 영역에 대해 취소된 실행 수입니다. 실행이 성공적으로 취소되면 개수가 업데이트됩니다. |
Cancelled Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName |
PT1M | 예 |
|
완료된 실행 이 작업 영역에 대해 성공적으로 완료된 실행 수입니다. 실행이 완료되고 출력이 수집되면 수가 업데이트 됩니다. |
Completed Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName |
PT1M | 예 |
|
오류 이 작업 영역의 실행 오류 수. 실행 시 오류가 발생할 때마다 개수가 업데이트됩니다. |
Errors |
개수 | 합계(합계), 평균, 최소, 최대, 개수 | Scenario |
PT1M | 예 |
|
실패한 실행 이 작업 공간에서 실패한 실행 횟수입니다. 실행이 실패하면 수가 업데이트 됩니다. |
Failed Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName |
PT1M | 예 |
|
실행 완료 이 작업 영역에 대해 완료 중인 상태에 진입한 실행 수. 실행이 완료되었지만 출력 컬렉션이 아직 진행 중인 경우 개수가 업데이트됩니다. |
Finalizing Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName |
PT1M | 예 |
|
응답하지 않는 실행 이 작업 영역에 대해 응답하지 않는 실행 수입니다. 실행이 응답하지 않는 상태로 들어가면 개수가 업데이트됩니다. |
Not Responding Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName |
PT1M | 예 |
|
시작되지 않은 실행 이 작업 영역에 대해 시작되지 않음 상태의 실행 수. 실행을 만드는 요청이 수신되었지만 실행 정보가 아직 채워지지 않은 경우 수가 업데이트됩니다. |
Not Started Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName |
PT1M | 예 |
|
준비 중인 실행 이 작업 영역에 대해 준비 중인 실행 수. 실행 환경이 준비되는 동안 실행이 준비 상태로 들어가면 개수가 업데이트됩니다. |
Preparing Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName |
PT1M | 예 |
|
프로비저닝 중인 실행 이 작업 영역을 위해 프로비저닝되는 실행 수입니다. 계산 대상 생성 또는 프로비저닝을 기다리는 동안 실행이 대기하는 경우 개수가 업데이트됩니다. |
Provisioning Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName |
PT1M | 예 |
|
큐에서 대기 중인 실행 이 작업 영역에 대해 대기 중인 실행 수입니다. 실행이 컴퓨팅 대상의 큐에서 대기할 때 개수가 업데이트됩니다. 필요한 컴퓨팅 노드가 준비될 때까지 대기할 때 발생할 수 있습니다. |
Queued Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName |
PT1M | 예 |
|
시작된 실행 이 작업 영역에 대해 실행 중인 실행 수. 필요한 리소스에서 실행이 시작되면 개수가 업데이트됩니다. |
Started Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName |
PT1M | 예 |
|
실행 시작 이 작업 영역에 대해 시작된 실행 수. 실행 ID와 같은 실행 정보를 포함한 실행 생성 요청이 처리된 후, 정보가 채워지고 나면 개수가 업데이트됩니다. |
Starting Runs |
개수 | 합계(합계), 평균, 최소, 최대, 개수 |
Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName |
PT1M | 예 |
|
경고 이 작업 영역의 실행 경고 수입니다. 실행에서 경고가 발생할 때마다 개수가 업데이트됩니다. |
Warnings |
개수 | 합계(합계), 평균, 최소, 최대, 개수 | Scenario |
PT1M | 예 |