Connexion SSH à un nœud de calcul

Vous pouvez vous connecter en SSH aux nœuds de calcul qui ont été affectés à l'un de vos travaux afin de surveiller l'exécution de vos calculs avec des outils comme top, htop ou nvidia-smi par exemple.

Lorsque l'un de vos travaux est en cours d'exécution, les nœuds de calcul qui lui ont été attribués sont visibles avec la commande squeue -j <numero_du_travail> ou squeue -u $USER :

$ squeue -u $USER
     JOBID  PARTITION         NAME       USER  ST     TIME  NODES  NODELIST(REASON)
   2042259     cpu_p1  mon_travail  mon_login   R    01:42     10  nœud[1337-1346]

Dans cet exemple, le job n° 2042259 tourne sur 10 nœuds de calcul nommés respectivement nœud1337, nœud1338, …, nœud1345 et nœud1346. Vous pouvez alors vous connecter via ssh à l'un des nœuds de cette liste (par exemple nœud1337) avec la commande suivante :

$ ssh nœud1337

Notez que vous serez automatiquement déconnecté du nœud lorsque votre travail se terminera.

Si vous essayez de vous connecter à un nœud sur lequel aucun de vos travaux n'est en cours d'exécution, vous obtiendrez l'erreur suivante :

Access denied by pam_slurm_adopt: you have no active jobs on this node