Connexion SSH à un nœud de calcul
Vous pouvez vous connecter en SSH aux nœuds de calcul qui ont été affectés à l'un de vos travaux afin de surveiller l'exécution de vos calculs avec des outils comme top, htop ou nvidia-smi par exemple.
Lorsque l'un de vos travaux est en cours d'exécution, les nœuds de calcul qui lui ont été attribués sont visibles avec la commande squeue -j <numero_du_travail> ou squeue -u $USER :
$ squeue -u $USER JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON) 2042259 cpu_p1 mon_travail mon_login R 01:42 10 nœud[1337-1346]
Dans cet exemple, le job n° 2042259 tourne sur 10 nœuds de calcul nommés respectivement nœud1337, nœud1338, …, nœud1345 et nœud1346.
Vous pouvez alors vous connecter via ssh à l'un des nœuds de cette liste (par exemple nœud1337) avec la commande suivante :
$ ssh nœud1337
Notez que vous serez automatiquement déconnecté du nœud lorsque votre travail se terminera.
Si vous essayez de vous connecter à un nœud sur lequel aucun de vos travaux n'est en cours d'exécution, vous obtiendrez l'erreur suivante :
Access denied by pam_slurm_adopt: you have no active jobs on this node
