Aller au contenu principal

46 articles tagués avec « flashinfo »

Le Flash Info est la lettre électronique envoyée à tous les utilisateurs de l'IDRIS. Son objectif est d'informer ses lecteurs des dernières nouveautés concernant l'IDRIS. Son rythme de parution dépend de l'information à diffuser.

Voir tous les tags

Flash Info n°2025-07

IDRIS
IDRIS
Computing center

Sommaire :

  • Arrêt électrique : mardi 8 avril 2025 (rappel)
  • 3ème édition de la Journée Deep Learning pour la Science le jeudi 5 juin 2025 au siège du CNRS
  • Formations IDRIS

  • Arrêt électrique : mardi 8 avril 2025 (rappel)

Comme précédemment annoncé, une maintenance de l'infrastructure technique de l'IDRIS nécessite la mise à l'arrêt du centre demain, mardi 8 avril. La machine Jean Zay sera indisponible toute la journée.

Le service de support aux utilisateurs sera fermé. Le site web restera accessible et vous pourrez suivre la disponibilité des machines sur la page habituelle : http://www.idris.fr/statut.html.

  • 3ème édition de la Journée Deep Learning pour la Science le jeudi 5 juin 2025 au siège du CNRS

L'IDRIS et l'ANF CNRS FIDLE organisent la troisième Journée Deep Learning pour la Science (JDLS) le jeudi 5 juin de 9h à 17h30 au siège du CNRS, à Paris Michel Ange. Des intervenant·e·s issu·e·s de domaines scientifiques variés se succéderont tout au long de la journée pour vous présenter leurs usages des méthodes d'intelligence artificielle. Il est également possible de participer à la journée en prenant part à la session “Mon projet en 3 minutes” et/ou à la session posters qui suivra. Informations et inscription sur https://jdls-2025.sciencesconf.org.

  • Formations IDRIS

Pensez à vous inscrire dès maintenant aux formations IDRIS planifiées sur les prochains mois :

  • Programmation hybride MPI/OpenMP, du 5 au 6 juin
  • Workshop Jean Zay, du 12 au 13 juin
  • OpenMP/MPI, du 16 au 20 juin
  • Deep Learning Optimisé sur Jean Zay, du 24 au 27 juin

Pour plus d'informations sur le catalogue des formations de l'IDRIS et les modalités d'inscription : http://www.idris.fr/formations/catalogue.html.


Vous recevez cette lettre électronique car vous êtes un utilisateur des machines de l’IDRIS.

Vous pouvez consulter ce numéro du Flash Info de l'IDRIS ainsi que les numéros précédents sur le site web de l'IDRIS : http://www.idris.fr/flash-info.html

Migration du système d'exploitation en Red Hat 9.4

IDRIS
IDRIS
Computing center

[English version below]

Bonjour,

À l'occasion de la maintenance de demain (1er avril 2025), le système d'exploitation du supercalculateur Jean Zay sera mis à jour en Red Hat 9.4 (contre 9.2 actuellement). Cette mise à jour a pour but de disposer d'un environnement logiciel récent sur Jean Zay.

Ce changement de version du système d'exploitation devrait normalement avoir un impact limité sur votre utilisation de la machine. La majorité de vos exécutables devraient continuer à fonctionner sans action de votre part, nous vous recommandons d'essayer de recompiler vos codes en cas de problème.

Les compilateurs GNU distribués avec le système passent en version 11.4.1 à l'occasion de cette mise à jour. Le module "gcc/11.3.1" deviendra un alias d'un nouveau module "gcc/11.4.1" pour assurer une transition simple.

En cas de problème, n'hésitez pas à contacter l'assistance de l'IDRIS.

Bien cordialement, L'équipe assistance de l'IDRIS


Hello,

During tomorrow's maintenance (April 1st, 2025), the operating system of the Jean Zay supercomputer will be updated to Red Hat 9.4 (from 9.2 currently). This update aims at making a recent software environment available on Jean Zay.

This operating system version change should have a limited impact on your use of the machine. The majority of our codes should continue to work without any action on your part, in case of issue we recommend that you try to recompile your codes once after the update.

The GNU compilers bundled with the operating system will be updated to version 11.4.1. The "gcc/11.3.1" module will become an alias for a new "gcc/11.4.1" module in order to ensure an easy transition.

In case of problems, contact the IDRIS Support.

Best regards, The IDRIS user support team

Flash Info n°2025-05

IDRIS
IDRIS
Computing center

Sommaire :

  • Hackathon GPU HPC et IA : plus que quelques jours pour candidater
  • Panoram'IA : rendez-vous vendredi 28/02 à 10h
  • CEEMS : un outil de mesure énergétique sur Jean Zay
  • Formations IDRIS

  • Hackathon GPU HPC et IA : plus que quelques jours pour candidater

Nous vous rappelons que la date limite d'inscription pour notre hackathon GPU HPC et IA est fixée au 4 mars. Pour rappel, cet événement, organisé conjointement avec NVIDIA, aura lieu le 13 mai (à distance) et les 20, 21 et 22 mai (dans les locaux de l'IDRIS).

L'inscription se fait via la page de l'évènement (en anglais) : https://www.openhackathons.org/s/siteevent/a0CUP00000sO9LV2A0/se000364.

  • Panoram'IA : rendez-vous vendredi 28/02 à 10h

L'assistance de l'IDRIS vous propose le vendredi matin 28/02 à 10h, un direct de son émission "Panoram'IA". Cette émission se fera en compagnie de notre invité Jérôme Louradour qui nous fera un retour d'expérience sur le pretraining de Lucie sur notre supercalculateur Jean Zay. Le direct ainsi que les rediffusions sont disponibles sur notre chaîne Youtube "Un oeil sur l'IDRIS" : https://www.youtube.com/@idriscnrs.

  • CEEMS : un outil de mesure énergétique sur Jean Zay

Comme annoncé lors du dernier comité des utilisateurs, l'outil CEEMS de mesure de l'énergie est désormais disponible sur Jean Zay : voir la page http://www.idris.fr/jean-zay/jean-zay-doc-energie.html pour plus d'informations.

  • Formations IDRIS

Pensez à vous inscrire dès maintenant aux formations IDRIS planifiées sur les prochains mois :

  • MPI, du 18 au 21 mars
  • OpenMP, du 26 au 28 mars
  • C++ Scientifique Moderne, du 9 au 11 avril
  • Introduction à OpenACC et OpenMP GPU, du 16 au 18 avril
  • Programmation hybride MPI/OpenMP, du 5 au 6 juin
  • Workshop Jean Zay, du 12 au 13 juin
  • OpenMP/MPI, du 16 au 20 juin

Pour plus d'informations sur le catalogue des formations de l'IDRIS et les modalités d'inscription : http://www.idris.fr/formations/catalogue.html.

Flash Info n°2025-04

IDRIS
IDRIS
Computing center

Webinaire d'information "Se préparer au hackathon"

[English version below]

L'IDRIS organise son 5ème Hackathon (https://www.openhackathons.org/s/siteevent/a0CUP00000sO9LV2A0/se000364) du 13 au 22 mai 2025 et nous sommes à la recherche d'équipes intéressées pour participer (date limite d'inscription : 4 mars).

Qu'est-ce qu'un hackathon ? Il s'agit d'un évènement dédié aux développeurs de codes scientifiques qui vise à aider les chercheurs et ingénieurs à optimiser, accélérer et faire passer à l'échelle leurs applications HPC ou IA sur Jean Zay. Pour cela, vous serez accompagnés de mentors experts en programmation dont les conseils permettront de booster vos projets HPC ou IA.

Cette année NVIDIA vous invite à un webinaire d'information "Se préparer au hackathon" centré sur les applications IA, avec la participation de l'IDRIS :

Rejoignez-nous le 18 février à 11h pour découvrir comment profiter au mieux de cette opportunité.

En participant au séminaire, vous pourrez :

  • obtenir une vue d'ensemble du prochain hackathon de l'IDRIS (https://www.openhackathons.org/s/siteevent/a0CUP00000sO9LV2A0/se000364) et de la manière dont il peut bénéficier à votre recherche en IA ;
  • découvrir des cas d'utilisation IA ayant bénéficié des hackathons précédents ;
  • comprendre comment profiter de Jean Zay pour vos projets d'IA ;
  • rencontrer des spécialistes en IA de NVIDIA pour échanger en privé sur votre projet.

Le nombre de places est limité, inscrivez-vous maintenant : https://bit.ly/IdrisGHR.

Pour un aperçu des projets qui ont bénéficié du hackathon de l'année passée, vous pouvez lire le récapitulatif du Hackathon IDRIS 2024 : https://www.openhackathons.org/s/article/IDRIS-Contributing-to-the-Excellence-of-Scientific-Research.

Nous espérons que vous participerez pour en savoir plus et recevoir un support personnalisé.

Si vous avez des questions, n'hésitez pas à contacter events@openhackathons.org (en anglais).


IDRIS is hosting its fifth IDRIS Open Hackathon (https://www.openhackathons.org/s/siteevent/a0CUP00000sO9LV2A0/se000364) from May 13 to May 22, 2025 and we are actively seeking applications (deadline: March 4th).

If you are not familiar, this hands-on coding event helps researchers and engineers to optimize, accelerate, and scale their HPC and AI applications on Jean Zay by pairing them with expert programming mentors whose guidance can take your HPC and AI projects to the next level.

This year NVIDIA invites you to an informational webinar “Getting Hackathon Ready” focused on AI applications, with the participation of IDRIS:

Join us on February 18th, 11AM CET to learn more about how to participate in this unique opportunity.

By attending the webinar, you will:

  • Get an overview of the upcoming IDRIS Open Hackathon (https://www.openhackathons.org/s/siteevent/a0CUP00000sO9LV2A0/se000364) and how it can benefit your AI research;
  • Examine AI use cases advanced at previous hackathons;
  • Understand how Jean Zay can support your AI projects; and
  • Get the chance to meet AI specialists from NVIDIA for a private consultation on your project.

Space is limited, sign up now: https://bit.ly/IdrisGHR.

For a glimpse of the projects that benefited from attending last year’s event, read the 2024 IDRIS Open Hackathon recap: https://www.openhackathons.org/s/article/IDRIS-Contributing-to-the-Excellence-of-Scientific-Research.

We hope you will join us to learn more and receive personalized expert support.

Should you have any questions, please contact events@openhackathons.org.

Flash Info n°2025-03

IDRIS
IDRIS
Computing center

Migration de l'espace DSDIR sur Lustre

[English version below]

Bonjour,

Lors de la maintenance du 21 janvier 2025, la variable d'environnement DSDIR a été modifiée et redirige maintenant vers un nouvel espace de stockage Lustre : "/lustre/fsmisc/dataset".

L'ensemble des bases de données et modèles téléchargés dans le DSDIR depuis les débuts de Jean Zay y a été migré. Ce nouvel espace est accessible depuis l'ensemble des noeuds de Jean Zay, y compris les noeuds de la nouvelle extension H100.

C'est ce nouvel espace qui sera dorénavant utilisé pour les téléchargements de datasets ou modèles publics. Les anciens espaces disques "/gpfsdsdir/dataset" et "/gpfsdswork/dataset" sont désormais dépréciés et ne seront plus accessibles à partir de la fin du mois de janvier.

Si vous utilisez déjà la variable d'environnement DSDIR dans vos scripts, la migration des données n'aura pas d'impact sur vos exécutions. Mais si vous utilisez des chemins explicites, il faudra penser à les modifier. Nous vous invitons à cette occasion à basculer sur un usage systématique de la variable DSDIR, comme dans le script suivant par exemple :

''' import os from datasets import load_dataset dataset = load_dataset(os.environ['DSDIR']+"/HuggingFace/wikimedia/structured-wikipedia") '''

Pour rappel, le DSDIR est un espace disque dédié au stockage de bases de données ou modèles publics nécessaires à l'utilisation d'outils de l'Intelligence Artificielle. Il est visible par l'ensemble des utilisateurs de Jean Zay. Pour plus d'information : http://www.idris.fr/jean-zay/cpu/jean-zay-cpu-calculateurs-disques.html#le_dsdir

N'hésitez pas à contacter l'assistance à assist@idris.fr si vous rencontrez des problèmes.

Bien cordialement, L'équipe assistance IDRIS


Hello,

During the maintenance on January 21, 2025, the DSDIR environment variable was modified and now points to a new Lustre storage space: "/lustre/fsmisc/dataset".

All databases and models downloaded to DSDIR since the beginning of Jean Zay have been migrated to this new space. This new space is accessible from all Jean Zay nodes, including the nodes of the new H100 extension.

This new space will now be used for downloading public datasets or models. The old disk spaces "/gpfsdsdir/dataset" and "/gpfsdswork/dataset" are now deprecated and will no longer be accessible as of the end of January.

If you are already using the DSDIR environment variable in your scripts, the data migration will have no impact on your runs. However, if you are using hardcoded paths, you will need to update them. We invite you to take this opportunity to switch to systematic use of the DSDIR variable, as in the following script for example:

''' import os from datasets import load_dataset dataset = load_dataset(os.environ['DSDIR']+"/HuggingFace/wikimedia/structured-wikipedia") '''

As a reminder, DSDIR is a dedicated disk space for storing public databases or models needed for the use of Artificial Intelligence tools. It is visible to all Jean Zay users. For more information: http://www.idris.fr/eng/jean-zay/cpu/jean-zay-cpu-calculateurs-disques-eng.html#the_dsdir

Please do not hesitate to contact the support team at assist@idris.fr if you encounter any issue.

Best regards, The IDRIS support team

Hackathon GPU HPC et IA à l'IDRIS en mai 2025

IDRIS
IDRIS
Computing center

Pour la cinquième année consécutive, l'IDRIS organise, conjointement avec NVIDIA, un hackathon GPU HPC et IA.

Il aura lieu le 13 mai (à distance) et les 20, 21 et 22 mai 2025 (dans les locaux de l'IDRIS). La date limite d'inscription est fixée au 4 mars.

Les hackathons GPU permettent à des équipes de trois ou quatre développeurs ou chercheurs d'améliorer les performances de leurs codes HPC ou IA sous la houlette d'un ou plusieurs mentors, experts en programmation GPU et issus des universités, de laboratoires nationaux, de centres de calcul, d'institutions gouvernementales et de constructeurs.

Il n'est pas nécessaire d'être utilisateur de l'IDRIS pour participer à cet événement donc n'hésitez pas à diffuser ce message auprès de vos collègues. Vous aurez à cette occasion accès aux ressources de calcul de l'IDRIS, afin de pouvoir tester votre code sur des GPU récents allant jusqu'aux NVIDIA H100.

Pour les projets HPC, il peut aussi bien s'agir de commencer le portage d'un code sur GPU en utilisant OpenACC, OpenMP, Kokkos, des bibliothèques GPU, CUDA, etc que d'optimiser une implémentation GPU existante. Dans le cas d'un code de taille importante, il est recommandé de préparer une mini-application représentative pour pouvoir être plus efficace pendant l'événement.

Pour les projets d'IA, ce hackathon offre une occasion unique d’explorer le finetuning, le développement ou l’évaluation de modèles de pointe tels que les LLM et les applications GenAI. Vous pourrez optimiser vos modèles grâce à des techniques avancées comme la précision mixte, la parallélisation multi-GPU ou multi-nœuds (DDP, PP, TP, CP), en utilisant des frameworks de base comme PyTorch ou TensorFlow, ou des outils spécialisés tels que DeepSpeed, Megatron-LM, Nanotron ou encore NVIDIA NeMo. Bien qu'un préentraînement complet soit hors de portée dans la durée du hackathon, préparer un code de préentraînement pour des modèles de grande échelle reste possible.

L'inscription se fait via la page de l'évènement (en anglais) : https://www.openhackathons.org/s/siteevent/a0CUP00000sO9LV2A0/se000364.


IDRIS is organizing a HPC and AI GPU Hackathon together with NVIDIA.

The Hackathon will be held on May 13th 2025 (remotely) and from May 20th through May 22nd (on site at IDRIS). The application deadline is March 4th 2025.

GPU Hackathons provide opportunities for teams of three or four developers and researchers to accelerate their HPC or AI codes under the guidance of expert mentors from universities, national labs, computing centers, governmental institutions and hardware manufacturers in a collaborative environment.

The event is open to everyone even if you are not already a user of IDRIS computing resources so feel free to forward this message to your colleagues. During the Hackathon, you will be provided with access to the computing resources of IDRIS, in order to be able to benchmark your code on recent GPUs, including NVIDIA H100s.

For HPC projects, it could be the opportunity to start porting a code to GPU using OpenACC, OpenMP, Kokkos, GPU libraries, CUDA, etc or to optimize an existing GPU implementation. If your codebase is large in size, we recommend selecting and extracting a representative mini-app from the original application in order to be more efficient during the Hackathon.

For AI projects, it will be the occasion to explore finetuning, developing or evaluating cutting-edge models such as LLMs or GenAI applications. You will be able to improve your models thanks to advanced techniques like mixed precision, multi-GPU or multi-node parallelization (DDP, PP, TP, CP), by using standard frameworks such as PyTorch or TensorFlow, or specialized tools like DeepSpeed, Megatron-LM, Nanotron or NVIDIA NeMo. Even though a full pretraining cannot be achieved in the time frame of the Hackathon, you can get a pretraining code ready for large scale models.

Please register on https://www.openhackathons.org/s/siteevent/a0CUP00000sO9LV2A0/se000364.

Flash Info n°2025-01

IDRIS
IDRIS
Computing center

Sommaire :

  • Meilleurs voeux !
  • Prochaine réunion du CU de l'IDRIS : mercredi 22 janvier 2025
  • Panoram'IA : rendez-vous vendredi 24/01 à 10h
  • Formations IDRIS

  • Meilleurs voeux !

L'IDRIS souhaite une excellente année 2025 à toutes ses utilisatrices et tous ses utilisateurs !

  • Prochaine réunion du CU de l'IDRIS : mercredi 22 janvier 2025

La prochaine réunion du Comité des utilisateurs (CU) de l'IDRIS aura lieu le mercredi 22 janvier 2025 dans les locaux de l'IDRIS. N'hésitez pas à transmettre vos demandes à l'adresse : cu-elus at idris.fr. Plus d'information : http://www.idris.fr/cu.html

  • Panoram'IA : rendez-vous vendredi 24/01 à 10h

L'assistance de l'IDRIS vous propose le vendredi matin 24/01 à 10h, "Panoram'IA" : le magazine vidéo mensuel et en direct qui aborde l'actualité scientifique et technique de l'IA. Le direct ainsi que les rediffusions sont disponibles sur notre chaîne Youtube "Un oeil sur l'IDRIS" : https://www.youtube.com/@idriscnrs.

  • Formations IDRIS

Pensez à vous inscrire dès maintenant aux formations IDRIS planifiées sur les prochains mois.

À venir très prochainement :

  • Introduction Pratique au Deep Learning (IPDL), les 3 et 4 février
  • Architectures du Deep Learning (ArchDL), les 5 et 6 février

Autres formations programmées :

  • MPI, du 18 au 21 mars
  • OpenMP, du 26 au 28 mars
  • C++ Scientifique Moderne, du 9 au 11 avril
  • Introduction à OpenACC et OpenMP GPU, du 16 au 18 avril

Pour plus d'informations sur le catalogue des formations de l'IDRIS et les modalités d'inscription : http://www.idris.fr/formations/catalogue.html.


Flash Info n°2024-29

IDRIS
IDRIS
Computing center

Adaptation aux nouveaux termes de la licence Anaconda

[English version below]

Bonjour,

Depuis l'été 2024, l'utilisation des dépôts Anaconda est soumise à tarification (https://legal.anaconda.com/policies/). Comme l'IDRIS ne prévoit pas d'acheter de licence, quelques mesures ont été mises en place sur Jean Zay pour limiter au maximum les requêtes vers les dépôts payants.

1/ Les nouveaux environnements conda installés pour vous par l'assistance IDRIS seront proposés via Miniforge et non plus via Anaconda. Les anciens environnements basés sur Anaconda resteront disponibles et pourront toujours être enrichis sur demande. L'assistance prendra soin de viser des dépôts ouverts comme conda-forge.

2/ Le comportement de tout environnement conda existant sur Jean Zay a été modifié grâce au déploiement d'un fichier de configuration /etc/conda/.condarc sur l'ensemble des noeuds ayant un accès à internet (noeuds de connexion, prepost, compil, archive, visu). Grâce à lui, toutes les installations effectuées par conda visent maintenant en priorité le dépôt ouvert conda-forge.

3/ Malgré le déploiement du nouveau fichier de configuration, certaines requêtes vers les dépôts Anaconda peuvent persister si vous utilisez Anaconda ou Miniconda. Nous vous demandons d'être attentives et attentifs lors de vos installations. Finalement, nous vous invitons fortement à travailler avec Miniforge à partir de maintenant pour éviter ce problème. Un module "miniforge/24.9.0" est déjà disponible et de nouvelles versions seront régulièrement installées. Au contraire, nous ne prévoyons plus de maintenir les modules Anaconda à l'avenir.

N'hésitez pas à contacter assist@idris.fr si vous avez des questions à ce sujet.

Bien cordialement, L'équipe assistance IDRIS


Hello,

Since summer 2024, the use of Anaconda repositories has been subject to pricing (https://legal.anaconda.com/policies/). As IDRIS does not plan to purchase a license, a few measures have been put in place on Jean Zay to limit requests to paid repositories as much as possible.

1/ The new conda environments installed for you by IDRIS support will be provided using Miniforge and no longer using Anaconda. Older Anaconda-based environments will remain available and can still be completed on request. Support will take care to target open repositories such as conda-forge.

2/ The behavior of any existing conda environment on Jean Zay has been modified by deploying a configuration file /etc/conda/.condarc on all nodes with internet access (connection nodes, prepost, compil, archive, visu). As a result, all installations performed by conda now target the open repository conda-forge as a priority.

3/ Despite the deployment of the new configuration file, some requests to Anaconda repositories may persist if you are using Anaconda or Miniconda. We ask you to be attentive during your installations. Finally, we strongly advise you to work with Miniforge from now on to avoid this problem. A “miniforge/24.9.0” module is already available, and new versions will be installed regularly. On the contrary, we no longer plan to maintain Anaconda modules in the future.

Please do not hesitate to contact assist@idris.fr if you have any question on this subject.

Best regards, The IDRIS Support Team


Flash Info n°2024-28

IDRIS
IDRIS
Computing center

Sommaire :

  • Panoram'IA : rendez-vous vendredi 15/11 à 10h
  • DSDIR non accessible depuis la partition H100
  • Arrêt de l'ancien espace STORE fin novembre 2024
  • Formations IDRIS

  • Panoram'IA : rendez-vous vendredi 15/11 à 10h

L'assistance de l'IDRIS vous propose ce vendredi matin 15/11 à 10h, "Panoram'IA" : le magazine vidéo mensuel et en direct qui aborde l'actualité scientifique et technique de l'IA. Au programme de cette session : les brèves de l'IA, une intervention d'experts : "QROA : L’art et la science de jailbreaker des LLMs" et notre sélection de papiers avec Papers Storm. Le direct ainsi que les rediffusions sont disponibles sur notre chaîne Youtube "Un oeil sur l'IDRIS" : https://www.youtube.com/@idriscnrs.

  • DSDIR non accessible depuis la partition H100

Nous vous rappelons que l'espace DSDIR sur lequel nous stockons les jeux de données et modèles publics utiles à la communauté (http://www.idris.fr/jean-zay/gpu/jean-zay-gpu-dataset.html) n'est pour l'instant pas accessible depuis la nouvelle partition H100 de Jean Zay. Du matériel est actuellement en cours d'installation afin de permettre sa migration vers un nouveau système de stockage utilisant Lustre qui sera accessible depuis toutes les partitions. Ce nouvel espace devrait être opérationnel d'ici à la fin de l'année 2024. En attendant, si vous avez besoin d'utiliser un jeu de données ou un modèle disponible dans le DSDIR depuis un nœud H100, nous vous recommandons de le copier dans votre SCRATCH.

  • Arrêt de l'ancien espace STORE fin novembre 2024

Suite à la migration de l'espace STORE vers un nouveau système de stockage Lustre durant l'été, l'ancien espace STORE restait accessible en lecture seule en utilisant la variable d'environnement "$OLDSTORE" (http://www.idris.fr/jean-zay/modifications-extension-jean-zay-h100.html#cas_particulier_du_store). L'arrêt définitif de cet espace aura lieu à la fin du mois de novembre 2024.

  • Formations IDRIS

Pensez à vous inscrire dès maintenant aux formations IDRIS planifiées pour le restant de l'année et début 2025 :

  • Débogage HPC, le 22 novembre
  • Vectorisation SIMD, le 26 novembre
  • Deep Learning Optimisé sur Jean Zay, les 14, 15, 16 et 17 janvier
  • MPI, les 18, 19, 20 et 21 mars
  • OpenMP, les 26, 27 et 28 mars

Pour plus d'informations sur le catalogue des formations de l'IDRIS et les modalités d'inscription : http://www.idris.fr/formations/catalogue.html.


Flash Info n°2024-27

IDRIS
IDRIS
Computing center

Changements importants : QoS, JupyterHub, H100

[English version below]

Bonjour,

Suite à la maintenance d'aujourd'hui (mardi 1er octobre), plusieurs changements pourront vous impacter.

  • Changement de noms des QoS pour la partition A100

Afin de pouvoir gérer plus finement le partage des ressources sur la machine, des QoS spécifiques ont été définies pour la partition A100. Si vous utilisiez explicitement les QoS "qos_gpu-t3" ou "qos_gpu-dev" dans vos soumissions de travaux ciblant cette partition, vous devrez utiliser à la place "qos_gpu_a100-t3" ou "qos_gpu_a100-dev". La QoS "qos_gpu_a100-t3" est utilisée par défaut et peut être omise.

Les partitions CPU et V100 ne sont pas touchées par ce changement.

La documentation a été mise à jour en conséquence : http://www.idris.fr/jean-zay/gpu/jean-zay-gpu-exec_partition_slurm.html#les_qos_disponibles.

  • Usage des QoS via JupyterHub

Si vous souhaitez spécifier une QoS lorsque vous utilisez le lanceur Slurm sur JupyterHub, il faudra maintenant la spécifier manuellement dans le champ "Extra #SBATCH directives".

  • Changement de l'adresse IP de JupyterHub

L'adresse IP de notre instance JupyterHub a été modifiée. Il s'agit maintenant de 130.84.132.56. Ce changement peut vous impacter si votre organisme applique un filtrage par adresse IP des connexions sortantes. Si vous rencontrez des difficultés de connexion à JupyterHub, nous vous suggérons de prendre contact avec votre service informatique en leur signalement ce changement.

Pour rappel, la plage des adresses IP utilisées pour les machines et les services de l'IDRIS est la suivante : 130.84.132.0/23. Nous recommandons d'autoriser la plage complète plutôt que des adresses IP spécifiques afin de ne pas être affecté par de futurs changements internes à notre infrastructure.

  • Ouverture de la partition H100

Les utilisateurs ayant déjà obtenu des heures H100 peuvent désormais les utiliser. Vous pouvez vous inspirer de l'exemple ci-dessous :

#!/bin/bash
#SBATCH --job-name=mon_travail # nom du job
#SBATCH -A xyz@h100 # comptabilite a utiliser, avec xyz le trigramme de votre projet
#SBATCH -C h100 # pour cibler les noeuds H100
# Ici, reservation de 3x24=72 CPU (pour 3 taches) et de 3 GPU (1 GPU par tache) sur un seul noeud :
#SBATCH --nodes=1 # nombre de noeud
#SBATCH --ntasks-per-node=3 # nombre de tache MPI par noeud (= ici nombre de GPU par noeud)
#SBATCH --gres=gpu:3 # nombre de GPU par noeud (max 4 pour les noeuds H100)
# Sachant qu'ici on ne reserve qu'un seul GPU par tache (soit 1/4 des GPUs),
# l'ideal est de reserver 1/4 des CPU du noeud pour chaque tache:
#SBATCH --cpus-per-task=24 # nombre de CPU par tache (1/4 des CPUs ici)
# /!\ Attention, "multithread" fait reference a l'hyperthreading dans la terminologie Slurm
#SBATCH --hint=nomultithread # hyperthreading desactive

Notez que les modules par défaut ne sont pas compatibles avec la partition H100. Afin de retrouver l'environnement logiciel spécifique à cette partition, vous devez charger le module "arch/h100" : http://www.idris.fr/jean-zay/cpu/jean-zay-cpu-doc_module.html#modules_compatibles_avec_la_partition_gpu_p6. Cela doit être fait dans vos scripts de soumission mais aussi dans votre terminal si vous avez besoin de compiler des codes.

Si vous n'avez pas encore d'heures H100, le responsable du projet peut faire une demande au fil de l'eau sur le portail eDARI si nécessaire.

N'hésitez pas à contacter assist@idris.fr en cas de besoin.

Cordialement, L'équipe support de l'IDRIS


Dear Jean Zay user,

Several changes might affect you after today's maintenance operations (Tuesday October 1st):

  • Qos name changes for the A100 partition

In order to more precisely manage the ressource sharing of the machine, specific QoS have been defined for the A100 partition. If you used to explicitely specify "qos_gpu-t3" or "qos_gpu-dev" in your Slurm jobs targeting the A100 partition, you now have to use "qos_gpu_a100-t3" or "qos_gpu_a100-dev" instead. Note that the "qos_gpu_a100-t3" QoS is used by default and may be omitted.

The CPU and V100 partitions are not affected by these changes.

The on-line documentation has been updated: http://www.idris.fr/eng/jean-zay/gpu/jean-zay-gpu-exec_partition_slurm-eng.html#available_qos

  • Use of QoS through JupyterHub

If you wish to specify a QoS when using Slurm on JupyterHub, you now have to do it manually in the "Extra #SBATCH directives" field.

  • JupyterHub IP address change

The IP address of our JupyterHub instance has been modified. It is now 130.84.132.56. This change might impact you if your institution applies an IP address filtering of outgoing connections. If you run into difficulties when connectng to JupyterHub, we invite you to contact your local administrator to mention this change.

As a reminder, the set of IP addresses used for the IDRIS machines and services is the following: 130.84.132.0/23. We recommend to authorize the complete set rather than specific IP addresses so as not to be affected by potential future internal changes of our infrastructure.

  • Opening of the H100 partition

Users who were already granted H100 computing hours may now use them. An example submission script is as follows:

#!/bin/bash
#SBATCH --job-name=my_job # job name
#SBATCH -A xyz@h100 # account to use, with xyz the 3 letter code of your project
#SBATCH -C h100 # to target H100 nodes
# Example reservation of 3x24=72 CPU (for 3 tasks) and 3 GPU (1 GPU per task) on one node:
#SBATCH --nodes=1 # number of nodes
#SBATCH --ntasks-per-node=3 # number of MPI tasks per node (= number of GPU requested per node here)
#SBATCH --gres=gpu:3 # number of GPU requested per node (max. 4 for H100 nodes)
# Since here only one GPU per task is requested (i.e., 1/4 of the available GPUs)
# the best way to proceed is to book 1/4 of the node's CPU for each task:
#SBATCH --cpus-per-task=24 # number of CPU per task (1/4 of the CPUs here)
# /!\ Caution, "multithread" in Slurm vocabulary refers to hyperthreading.
#SBATCH --hint=nomultithread # hyperthreading deactived

Note that the default modules are not compatible with the H100 partition. In order to use the software environment dedicated to this partition, you need to load the "arch/h100" module: http://www.idris.fr/eng/jean-zay/cpu/jean-zay-cpu-doc_module-eng.html#modules_compatible_with_gpu_p6_partition. This is needed for your submission scripts but also in your shell when compiling codes.

If you do not have H100 computing hours yet, your project manager may ask for supplementary hours ("au fil de l'eau") on the eDARI portal if necessary.

Do not hesitate to contact assist@idris.fr if needed.

Best regards, The IDRIS support team