Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
O Estado do Nó reflete o estado de implantação de um nó e se um administrador deseja ou não que o nó esteja disponível como um recurso para trabalhos de cluster. Um administrador traz um nó para o estado Online para indicar que o nó deve aceitar trabalhos ou solicitações de cliente.
A Integridade do Nó indica se há ou não avisos ou erros que os serviços de HPC estão cientes nesse nó. Se o nó tiver um valor de integridade de nó de Erro, o nó não poderá aceitar trabalhos ou solicitações de cliente, mesmo que o estado do nó seja Online.
Durante operações normais, os nós têm um valor de integridade de nó de OK. A lista a seguir descreve os valores de estado do nó normal:
O nó principal tem um valor de estado de nó offline. Se o nó principal também estiver atuando como um nó de computação ou um nó de agente do WCF ou se um nó principal estiver instalado para alta disponibilidade, o valor de estado do nó normal será Online.
Nós de computação e nós de agente do WCF (Windows Communication Foundation) têm um valor de estado de nó online.
Os nós de estação de trabalho podem ter um valor de estado de nó online ou offline, de acordo com a política de disponibilidade.
Os nós do Windows Azure definidos, mas não implantados no Windows Azure, têm um valor de estado de nó normal de Não Implantado. Os nós do Windows Azure implantados têm um valor de estado de nó normal do Online.
Parte do processo de monitoramento e manutenção da integridade do cluster é encontrar desvios do estado e da integridade do nó normal e monitorar o estado das operações de cluster.
As seções neste tópico descrevem os valores para:
Estados do nó
Os estados do nó refletem o estado de implantação de um nó e se um administrador deseja ou não que o nó esteja disponível como um recurso para trabalhos de cluster.
Quando o nó principal detecta pela primeira vez um nó local na rede, o nó é exibido no estado Desconhecido . Quando um administrador adiciona um nó ao cluster atribuindo um modelo de nó, o nó é movido para o estado de provisionamento . Quando o nó ingressou com êxito no cluster, ele se move para o estado Offline .
Quando um administrador adiciona nós do Windows Azure ao cluster, eles aparecem no estado Não Implantado . Quando os nós do Windows Azure são iniciados (o que significa que as instâncias são implantadas no Windows Azure), os nós se movem para o estado de provisionamento . Após a conclusão do provisionamento com êxito, um nó do Windows Azure iniciado manualmente vai para o estado Offline e um nó do Windows Azure que é iniciado automaticamente vai para o estado Online .
Quando um administrador adiciona nós de estação de trabalho e nós de servidor não gerenciados ao cluster e, depois que o modelo de nó é atribuído, ele pode ser colocado online para executar trabalhos de cluster e, em seguida, colocado offline para retomar suas cargas de trabalho normais. Os nós configurados no modelo de nó a serem colocados online e offline manualmente serão inicialmente offline. Os nós configurados para serem colocados online e offline de acordo com uma política de disponibilidade semanal começarão a seguir essa política e serão colocados online automaticamente durante os intervalos agendados.
Um administrador traz um nó Online ou usa um nó Offline para indicar se os nós devem ou não aceitar e executar trabalhos de cluster. Nós do Windows Azure e nós de estação de trabalho também podem ser colocados online ou offline de acordo com uma política de disponibilidade semanal. O Serviço de Agendador de Trabalho do HPC tentará iniciar apenas novos trabalhos em nós que estão no estado Online . Para tornar um nó indisponível para novos trabalhos, os administradores podem colocar o nó offline. Os nós devem estar no estado offline para executar algumas ações de gerenciamento, como Reimage ou Maintain.
Você pode usar a exibição de lista de nós para exibir o estado de cada nó e filtrar nós de computação por estado do nó.
A tabela a seguir descreve os valores de estado do nó:
| Estado do nó | Descrição |
|---|---|
| Online | Esse estado indica que o nó deve aceitar e executar trabalhos de cluster. Para nós do Agente do WCF, esse estado indica que eles devem estar disponíveis para gerenciar sessões SOA. O Serviço de Agendador de Trabalho do HPC tentará alocar apenas o trabalho para nós que estão no estado Online . Um nó deve estar no estado do nó Online e íntegro para executar trabalhos (ou gerenciar sessões). Se a integridade do nó for Erro, os trabalhos não poderão ser iniciados nesse nó. Os nós podem ser colocados online ou offline pelo administrador do cluster. Nós do Windows Azure, nós de estação de trabalho e nós de servidor não gerenciados também podem ser colocados online ou offline de acordo com uma política de disponibilidade semanal. |
| Offline | Esse estado indica que o nó não deve ser usado para executar trabalhos de cluster. Para nós do WCF Broker, isso indica que ele não deve ser usado para gerenciar sessões SOA. Esse estado permite que um administrador de cluster execute scripts, instale software e execute outras tarefas no nó. Esse é o estado padrão de um nó depois que um administrador de cluster aprovou o nó para inclusão no cluster. Esse é o estado normal para um nó de cabeçalho (a menos que esteja instalado para alta disponibilidade). Você pode colocar um nó de cabeçalho Online se quiser que ele execute funções de nó adicionais, como Nó de Computação ou Nó do Agente do WCF. Para obter mais informações, consulte Noções básicas sobre funções de nó no Microsoft HPC Pack. Os nós podem ser colocados online ou offline pelo administrador do cluster. Nós do Windows Azure, nós de estação de trabalho e nós de servidor não gerenciados também podem ser colocados online ou offline de acordo com uma política de disponibilidade semanal. Se um nó for colocado offline durante a execução de trabalhos, ele primeiro passará pelo estado de drenagem . Se um administrador optar por forçar o nó offline imediatamente, todas as tarefas em execução serão canceladas e requeuídas em seu trabalho. |
| Desconhecido | Esse estado indica que o nó não faz parte do cluster ou que uma operação de provisionamento falhou nesse nó. Para unir um nó ao cluster, aplique a ação Atribuir Modelo de Nó ao nó. Em um cluster de alta disponibilidade, depois que a instalação for executada no primeiro nó principal, o segundo nó principal estará no estado Desconhecido até que a instalação seja executada nesse nó. Após a instalação, o segundo nó principal passa para o estado Online . |
| Provisionamento | Nós locais Esse estado indica que o nó está sendo configurado como um nó de cluster. As ações Atribuir Modelo de Nó, Imagem Nova e Manutenção também colocam um nó no estado de provisionamento. Após a conclusão do provisionamento, o nó vai para o estado Offline . Nós do Windows Azure Esse estado indica que a instância do nó está sendo implantada no Windows Azure. A ação Iniciar ou uma política de disponibilidade automática pode colocar um nó do Windows Azure no estado de provisionamento. Após a conclusão do provisionamento com êxito, um Nó do Windows Azure iniciado manualmente vai para o estado Offline e um nó do Windows Azure que é iniciado automaticamente vai para o estado Online . |
| Iniciando | Esse estado indica que o nó está fazendo a transição do modo Offline para o modo Online . Nota: A ação Iniciar não coloca nós no estado Inicial . A ação Iniciar se aplica somente aos nós do Windows Azure e é usada para implantar instâncias de nó no Windows Azure. Quando a ação Iniciar é aplicada, os nós entram no estado de provisionamento . |
| de drenagem | Esse estado indica que o nó foi colocado offline e está fazendo a transição para o estado offline . O nó conclui os trabalhos em execução no momento antes de ir para o estado Offline . Nós de drenagem não aceitam novos trabalhos. |
| Removendo | Esse estado indica que as informações sobre o nó estão sendo removidas do banco de dados dos Serviços de Gerenciamento de Nós do HPC. A ação Excluir coloca um nó nesse estado. Nada é alterado no próprio nó excluído. Se o nó tentar reencontrar o cluster, uma nova entrada será criada para esse nó no banco de dados e o nó será exibido no estado Desconhecido . |
| Rejeitado | Esse estado indica que o nó foi rejeitado por um administrador de cluster. |
| Não implantado | Esse estado só se aplica aos nós do Windows Azure. Esse estado indica que o nó do Windows Azure foi definido e adicionado ao cluster, mas o nó não foi iniciado e provisionado no Windows Azure (a instância do nó não foi criada no Windows Azure). Os nós do Windows Azure são implantados de acordo com a política de disponibilidade definida no modelo de nó: manualmente (com a ação Iniciar ) ou automaticamente com base em um agendamento semanal. Os nós do Windows Azure no estado não implantado não incorrem em encargos no Windows Azure. |
| Interrompendo | Esse estado só se aplica aos nós do Windows Azure. Esse estado indica que a instância do nó do Windows Azure está sendo removida do Windows Azure. Os nós do Windows Azure são interrompidos de acordo com a política de disponibilidade definida no modelo de nó: manualmente (com a ação Parar ) ou automaticamente com base em um agendamento semanal. Quando as operações de parada são concluídas (a instância do nó é removida do Windows Azure), o nó vai para o estado Não Implantado . |
Integridade do nó
A Integridade do Nó indica se há ou não avisos ou erros que os serviços de HPC estão cientes nesse nó.
Você pode usar a exibição de lista de nós para exibir a integridade de cada nó de computação e filtrar nós por integridade do nó. Se a integridade do nó for Erro ou Aviso, examine as informações na guia Integridade do Nó para obter detalhes adicionais. Você pode exibir a guia Integridade do Nó no Painel de Detalhes (no modo de exibição de lista) ou clicando duas vezes em um nó.
A tabela a seguir descreve os valores de integridade do nó:
| Integridade do nó | Descrição |
|---|---|
| OKEY | Os serviços de HPC não estão cientes de nenhum problema com o nó. |
| Aviso | Esse valor pode indicar o seguinte: - Um administrador de cluster executou testes de diagnóstico no nó e um ou mais testes retornaram um resultado de falha ou falha na execução. Um administrador pode limpar manualmente os alertas de diagnóstico (consulte Resolver e Limpar Alertas de Diagnóstico). - Uma ou mais operações de nó estão no estado Com Falha, Revertida ou Cancelada . Leia o Log de Operações para investigar o problema. Examine as informações na guia Integridade do Nó para começar a investigar o problema. |
| Erro | Esse valor pode indicar o seguinte: - O nó não é acessível, conforme determinado pelas opções de pulsação. - Falha no provisionamento. - O nó foi rejeitado por um administrador de cluster. (Você pode atribuir um modelo de nó se decidir unir o nó ao cluster.) Examine as informações na guia Integridade do Nó para começar a investigar o problema. |
| transitório | Esse valor indica que o nó está executando uma operação iniciada por um administrador de cluster, como: - Atribuir modelo de nó, imagem nova ou manutenção (nesse caso, o estado do nó é provisionamento). - Bring Online (nesse caso, o estado do nó está começando). - Leve offline (nesse caso, o estado do nó está drenando). - Comece para nós do Windows Azure (nesse caso, o Estado do Nó é Provisionamento). Exiba a guia Integridade do Nó para obter informações adicionais ou cancelar a operação. |
| Unapproved | Nós locais O nó foi detectado pelo nó principal, mas não faz parte do cluster. Atribua um modelo de nó para unir o nó ao cluster. Veja também a adição de nós a um cluster. Nós do Windows Azure O nó foi adicionado ao cluster, mas o nó não foi iniciado e provisionado no Windows Azure (a instância do nó não existe no Windows Azure). |
Estados de operação
Para obter informações sobre como exibir o log de operações, consulte Ler o Log de Operações.
A tabela a seguir descreve os valores de estado da operação:
| Estado da operação | Descrição |
|---|---|
| Arquivado | A operação tem mais de 24 horas ou o teste de diagnóstico foi limpo. Quando uma operação é arquivada, ela é removida de outros relatórios de status. |
| Cometeu | A operação foi concluída com êxito. |
| executando | A operação está em andamento. |
| Com falha | Falha na execução da operação. |
| revertendo | A operação está sendo revertida. Quando a limpeza da operação for concluída, a operação será movida para o estado Revertido . |
| Falha ao reverter | A limpeza da operação não foi bem-sucedida. |
| revertida | A operação foi revertida após falha ou cancelamento. |