Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
A tabela a seguir lista as métricas disponíveis para o tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.
Cabeçalhos de tabela
Métrica - O nome para exibição da métrica conforme aparece no portal do Azure.
Nome na API REST - Nome da métrica conforme referido na API REST.
Unidade - Unidade de medida.
Agregação - O tipo de agregação padrão. Valores válidos: Média, Mínimo, Máximo, Total, Contagem.
Dimensões - Dimensões disponíveis para a métrica.
Granulações Temporais - Intervalos nos quais a métrica é amostrada. Por exemplo, PT1M indica que a métrica é amostrada a cada minuto, PT30M a cada 30 minutos, PT1H a cada hora e assim por diante.
DS Export- Se a métrica é exportável para os Logs do Azure Monitor por meio das Configurações de Diagnóstico.
Para obter informações sobre como exportar métricas, consulte - Exportação de métricas usando regras de coleta de dados e Criar configurações de diagnóstico no Azure Monitor.
Para obter informações sobre retenção de métricas, consulte Visão geral do Azure Monitor Metrics.
Categoria: Recurso
| Métrica | Nome na API REST | Unidade | Agregação | Dimensões | Fragmentos de Tempo | DS Exportação |
|---|---|---|---|---|---|---|
|
Percentagem de utilização da memória da CPU Porcentagem de utilização de memória em uma instância. A utilização é relatada em intervalos de um minuto. |
CpuMemoryUtilizationPercentage |
Percentagem | Mínimo, Máximo, Médio | instanceId |
PT1M | Sim |
|
Percentagem de utilização da CPU Porcentagem de utilização da CPU em uma instância. A utilização é relatada em intervalos de um minuto. |
CpuUtilizationPercentage |
Percentagem | Mínimo, Máximo, Médio | instanceId |
PT1M | Sim |
|
Erros de coleta de dados por minuto O número de eventos de coleta de dados caiu por minuto. |
DataCollectionErrorsPerMinute |
Contar | Mínimo, Máximo, Médio |
instanceId, reason, type |
PT1M | Não |
|
Eventos de coleta de dados por minuto O número de eventos de coleta de dados processados por minuto. |
DataCollectionEventsPerMinute |
Contar | Mínimo, Máximo, Médio |
instanceId, type |
PT1M | Não |
|
Capacidade de implantação O número de instâncias na implantação. |
DeploymentCapacity |
Contar | Mínimo, Máximo, Médio |
instanceId, State |
PT1M | Não |
|
Utilização do disco Porcentagem de utilização do disco em uma instância. A utilização é relatada em intervalos de um minuto. |
DiskUtilization |
Percentagem | Mínimo, Máximo, Médio |
instanceId, disk |
PT1M | Sim |
|
Energia da GPU em Joules Energia de intervalo em Joules em um nó de GPU. A energia é reportada em intervalos de um minuto. |
GpuEnergyJoules |
Contar | Mínimo, Máximo, Médio | instanceId |
PT1M | Não |
|
Percentagem de utilização da memória GPU Porcentagem de utilização de memória da GPU em uma instância. A utilização é relatada em intervalos de um minuto. |
GpuMemoryUtilizationPercentage |
Percentagem | Mínimo, Máximo, Médio | instanceId |
PT1M | Sim |
|
Percentagem de utilização da GPU Porcentagem de utilização da GPU em uma instância. A utilização é relatada em intervalos de um minuto. |
GpuUtilizationPercentage |
Percentagem | Mínimo, Máximo, Médio | instanceId |
PT1M | Sim |
Categoria: Trânsito
| Métrica | Nome na API REST | Unidade | Agregação | Dimensões | Fragmentos de Tempo | DS Exportação |
|---|---|---|---|---|---|---|
|
Latência de solicitação P50 A latência média da solicitação P50 agregada por todos os valores de latência da solicitação coletados durante o período de tempo selecionado |
RequestLatency_P50 |
Milissegundos | Média | <nenhum> | PT1M | Sim |
|
Latência de solicitação P90 A latência média da solicitação P90 agregada por todos os valores de latência da solicitação coletados durante o período de tempo selecionado |
RequestLatency_P90 |
Milissegundos | Média | <nenhum> | PT1M | Sim |
|
Latência de solicitação P95 A latência média da solicitação P95 agregada por todos os valores de latência da solicitação coletados durante o período de tempo selecionado |
RequestLatency_P95 |
Milissegundos | Média | <nenhum> | PT1M | Sim |
|
Latência de solicitação P99 A latência média da solicitação P99 agregada por todos os valores de latência da solicitação coletados durante o período de tempo selecionado |
RequestLatency_P99 |
Milissegundos | Média | <nenhum> | PT1M | Sim |
|
Pedidos por minuto O número de solicitações enviadas para implementação online num minuto |
RequestsPerMinute |
Contar | Média | envoy_response_code |
PT1M | Não |