12 mars 2026 - 14h - En ligne : présentation des projets LLM et SLM ayant eu recours aux ressources du supercalculateur Jean Zay 4 à l'occasion des Grands Challenges

Dans la révolution de l’intelligence artificielle qui bouleverse notre rapport au monde et au travail, les grands modèles de langage (LLM) occupent une place unique. Ils sont les premiers à avoir été largement adoptés par le grand public. Par exemple, ChatGPT a atteint plus d’un million d’utilisateurs en seulement cinq jours.

Si les modèles américains ont d’abord capté l’attention du grand public, la France et l’Europe cherchent désormais à développer leurs propres outils. Plusieurs facteurs expliquent cette dynamique parmi lesquels l’impact quotidien de ces modèles sur la formulation des idées et la nécessité de contrer le soft power exercé par ces technologies. La puissance culturelle amplifiée par l’IA représente ainsi un enjeu stratégique. La France,en 5eme position des pays les plus utilisateurs d’IA générative, se trouve ainsi confortée dans son besoin de développer des LLM s’appuyant sur un corpus de données en langue française.

La France, en acquérant le supercalculateur Jean Zay dès 2019, s’équipait avec pertinence d’un outil pour démultiplier ses capacités et les mettre au service de la science. Le succès est réel : en 2025, GENCI a soutenu près de 1 700 projets en IA, avec une augmentation constante des heures attribuées et consommées. Les thématiques principales incluent la santé, l'énergie, et l'environnement. Les utilisateurs, industriels, startups et académiques, enthousiastes anticipent une nouvelle augmentation de leurs besoins en ressources GPU. Le déploiement en cours depuis fin 2025 du projet AI Factory France va permettre d’élargir et d’amplifier cette démarche.

Les LLM ne sont pas en reste. Permettre aux chercheurs académiques comme industriels de contribuer à cette dynamique figure parmi les objectifs de GENCI et des centres de calcul nationaux. Ainsi, les Grands Challenges menés sur la nouvelle machine Jean Zay 4 ont été l’occasion pour des startups et des chercheurs de mener des travaux, portant sur ces modèles de langue, qu’il s’agisse de LLM ou de SLM (petits modèles de langues).

Les trois projets qui vous seront présentés ce jour soulèvent plusieurs enjeux cruciaux : la question des langues, celle des données, celle leur caractère open source ou non.

  • Anastasia Stasenko (Pleias) présentera le projet Pleias 1.0, la première famille de modèles de langue entraînée exclusivement sur des données ouvertes, sous une licence permettant la rediffusion
  • Imed Laaridh (Zaion) nous parlera de Vigogne SLM : une collection de modèles performants optimisés pour le Français.
  • Jean-Pierre Lorré Julie Hunter, Jérôme Louradour et Olivier Gouvert (Linagora) évoqueront quant à eux Lucie 7B : un modèle de langage de fondation multilingue, mettant l’accent sur la langue et la culture françaises.