Partager via


Problèmes courants : erreurs de configuration Slurm

Messages d’erreur possibles

  • Unable to execute command /usr/bin/systemctl --system start slurmd

Résolution

Étant donné que Slurm nécessite que tous les nœuds d’un cluster soient définis dans slurm.conf, CycleCloud pré-crée toutes les machines virtuelles à l’intérieur de CycleCloud lorsque vous démarrez le nœud du planificateur pour la première fois. Ces machines virtuelles restent non allouées dans Azure jusqu’à ce qu’un travail les demande, mais parfois un quota insuffisant ou des limites de mise à l’échelle automatique incorrectes provoquent des problèmes d’installation.

  • Vérifiez que votre abonnement dispose d’un quota suffisant pour le type de machine virtuelle sélectionné et que les limites de mise à l’échelle automatique sont inférieures au montant du quota. Vous devrez peut-être sélectionner un autre type de machine virtuelle ou ajuster vos limites de mise à l’échelle automatique.
  • Vérifiez que /var/log/slurmctld/slurm.log ne contient aucune erreur liée au démarrage du planificateur.