Compartilhar via


Problemas comuns: erros de configuração do Slurm

Possíveis mensagens de erro

  • Unable to execute command /usr/bin/systemctl --system start slurmd

Resolução

Como o Slurm exige que todos os nós de um cluster sejam definidos em slurm.conf, o CycleCloud cria previamente todas as VMs dentro do CycleCloud quando você inicia o nó do agendador pela primeira vez. Essas VMs permanecem não alocadas no Azure até que um trabalho as solicite, mas, às vezes, cota insuficiente ou limites de dimensionamento automático incorretos causam problemas de instalação.

  • Verifique se sua assinatura tem cota suficiente para o tipo de VM selecionado e se os limites de dimensionamento automático estão abaixo do valor da cota. Talvez seja necessário selecionar um tipo de VM diferente ou ajustar os limites de dimensionamento automático.
  • Verifique /var/log/slurmctld/slurm.log para erros relacionados ao início do agendador.