Partilhar via


Problemas comuns: erros de configuração do Slurm

Possíveis mensagens de erro

  • Unable to execute command /usr/bin/systemctl --system start slurmd

Resolução

Como o Slurm requer que todos os nós de um cluster sejam definidos no slurm.conf, o CycleCloud pré-cria todas as VMs dentro do CycleCloud quando você inicia o nó do agendador pela primeira vez. Essas VMs permanecem não alocadas no Azure até que um trabalho as solicite, mas às vezes cotas insuficientes ou limites de dimensionamento automático incorretos causam problemas de instalação.

  • Verifique se sua assinatura tem cota suficiente para o tipo de VM selecionado e se os limites de dimensionamento automático estão abaixo do valor da cota. Talvez seja necessário selecionar um tipo de VM diferente ou ajustar seus limites de dimensionamento automático.
  • Verifique /var/log/slurmctld/slurm.log se há erros relacionados ao início do agendador.