Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Uma etapa fundamental no monitoramento e na manutenção da integridade do cluster é identificar qualquer desvio do estado operacional normal ou do desempenho. O Gerenciador de Cluster de HPC permite que você exiba o status do cluster e do nó rapidamente, identifique os nós de problema e faça uma busca detalhada nos detalhes do nó para uma investigação mais detalhada.
Neste tópico:
Correlacionar as informações de monitoramento entre nós, trabalhos, operações e diagnóstico
Monitorar o uso e as estatísticas do cluster ao longo do tempo
Exibir o status do cluster rapidamente
No Gerenciamento de Nós , você pode monitorar o cluster rapidamente usando o modo de exibição lista de nós ou o modo de exibição mapa de calor do nó. Em Gráficos e Relatórios, os gráficos de monitoramento exibem dados atuais e recentes sobre a integridade do nó e a utilização do cluster. Para obter mais informações, consulte:
Fazer drill down em detalhes individuais do nó
As exibições lista e mapa de calor fornecem um ponto de partida para identificar áreas problemáticas. Clique duas vezes em um nó de computação para ver informações detalhadas, como hardware, propriedades do sistema operacional e métricas de desempenho atuais. Você também pode selecionar um ou mais nós e, em seguida, fazer uma busca detalhada nos detalhes do nó para investigar o desempenho.
Executar testes de diagnóstico e relatórios: execute testes de diagnóstico em um ou mais nós de computação.
Exibir Gráficos de Desempenho: exibir um gráfico das métricas de desempenho de um nó de computação ao longo do tempo.
Exibir eventos de nó: exibir eventos gerados pelos serviços HPC em um nó de computação específico.
Abra uma conexão de área de trabalho remota com seus nós do Gerenciador de Cluster do HPC: abra uma sessão de área de trabalho remota para um ou mais nós de computação.
Monitorar operações de nó
O acompanhamento de operações de cluster recentes ou em andamento é outro aspecto de monitoramento que é fundamental para a administração de um cluster. Para obter mais informações, consulte:
Correlacionar as informações de monitoramento entre nós, trabalhos, operações e diagnóstico
No Gerenciador de Trabalho do HPC, você pode usar as ações do Pivot To para correlacionar as informações de monitoramento entre nós, trabalhos, operações e diagnósticos. Por exemplo, você pode selecionar um ou mais nós no painel de exibições e, em seguida, dinamizar para os Trabalhos para os Nós Selecionados. Isso leva você a uma exibição de lista de trabalhos filtrada pelos nós que você selecionou.
Os caminhos dinâmicos com suporte são:
Nós: dinamizar para trabalhos, resultados de teste e operações.
Trabalhos: dinamizar para nós.
Resultados do teste: pivô para nós com falha e operações.
Monitorar o uso e as estatísticas do cluster ao longo do tempo
O Gerenciador de Cluster de HPC fornece vários gráficos e relatórios internos para monitorar e analisar o uso de recursos de cluster e as estatísticas de trabalho e nó ao longo do tempo. O banco de dados HPCReporting também dá suporte a relatórios personalizados. Para obter mais informações, consulte Gráficos e Relatórios: Gerenciador de Cluster de HPC.