Babel : classes batch et limitations interactives
************************************************************************
Structure de classes sur Babel 20 janvier 2011
************************************************************************
I/ Les classes de la Blue Gene/P
=============================
T(h)
^
|
20h +-------+--------+--------+--------+--------+-------+
| | | | | | |
| MRt3 | 1Rt3 | 2Rt3 | 4Rt3 | 8Rt3 | 10Rt3 |
| | | | | | |
10h +-------+--------+--------+--------+--------+-------+
| | | | | | |
| MRt2 | 1Rt2 | 2Rt2 | 4Rt2 | 8Rt2 | 10Rt2 |
| | | | | | |
1h +-------+--------+--------+--------+--------+-------+
| MRt1 | 1Rt1 | 2Rt1 | 4Rt1 | 8Rt1 | 10Rt1 |
0 +-------+--------+--------+--------+--------+-------+-->
64 512 1024 2048 4096 8192 10240
Nombre de noeuds de calcul
coeur -> unite de base
noeud de calcul -> 4 coeurs
MR -> Demi rack : 512 noeuds soit 2048 coeurs
1R -> 1 rack de 1024 noeuds soit 4096 coeurs
...
T(h) : temps elapsed en heures
Memoire: 2Gio par noeud
Remarques :
-----------
- Le nombre de noeuds de calcul minimal a reserver est de 64 (directive
bg_size).
Cela correspond a un minimum de 256 coeurs.
- Le nombre de noeuds reserves doit etre 64, 128, 256, 512, 1024, 2048,
4096, 6144, 8192 ou 10240.
- L'acces a plus d'un rack (1024 noeuds, 4096 coeurs) est soumis a
autorisation.
- Attention, est comptabilise le temps ecoule (elapsed) multiplie par
le nombre de coeurs reserves meme si certains d'entre eux ne sont pas
utilises...
(voir site web Support technique -> IBM Blue Gene/P -> notes sur la
comptabilite des travaux)
II/ Les classes de la frontale (Power5+)
====================================
Pour vos activites monoprocesseur comme la cross compilation en batch,
les activites de transferts de fichiers, petits pre et post traitement
sequentiels encadrant vos jobs massivement paralleles,...
Vous disposez de 3 classes :
- t1 : limite a 1h de temps elapsed et 15min de temps CPU
- t2 : limite a 10h de temps elapsed et 2h de temps CPU
- archive : uniquement pour les transferts mfput/mfget avec Gaya
Memoire (stack + data) :
- Par defaut : data=2.0Gio, stack=2.0Gio
- data + stack <= 4.0Gio
Ces classes ne sont pas facturees sur Babel.
Classe archive :
----------------
- Cette classe est STRICTEMENT RESERVEE aux transferts mfput/mfget avec
Gaya.
- Elle peut etre suspendue par l'IDRIS lorsque la machine Gaya est
indisponible. Une fois la situation retablie, cette queue reprend un
fonctionnement normal.
- Pour l'utiliser, il est necessaire de specifier la directive
LoadLeveler "#@class = archive" dans votre travail.
III/ Les limites en interactif de la Blue Gene/P (commande bgrun)
===========================================
Temps ecoule (elapsed): 30min
Nombre de noeuds de calcul: de 64, 128 ou 256
Remarques :
---------
- Le nombre de noeuds de calcul minimal a reserver est de 64.
Cela correspond a un minimum de 256 coeurs.
- Le nombre de noeuds reserves doit etre 64, 128, 256.
- Attention, est comptabilise le temps ecoule (elapsed) multiplie par
le nombre de coeurs reserves meme si certains d'entre eux ne sont pas
utilises...
(voir site web Support technique -> IBM Blue Gene/P -> notes sur la
comptabilite des travaux)
IV/ Les limites en interactif de la frontale (Power5)
=================================================
Temps CPU: 1h
Memoire: idem batch frontale
V/ Politique d'exploitation des travaux
====================================
Afin d'ameliorer la cohabition entre les gros jobs (>4 racks) et les
nombreux autres jobs plus petits, certaines mesures ont ete prises :
- Petits jobs (pour tests ou developpement jusqu'a 2048 coeurs et 1h)
Des ressources leurs sont dediees pendant la journee (en semaine).
Ces ressources sont limitees. Lorsque celles-ci sont entierement
occupees, ces petits jobs s'ecouleront avec une priorite normale sur
le reste de la machine.
- Gros jobs (plus de 4 racks). Ils sont prioritaires du jeudi soir au
lundi matin. En dehors de cette periode, ils ne pourront s'executer
que si des ressources suffisantes sont libres et qu'aucun autre job
n'en a besoin (priorite minimale). Attention, une fois demarre, un
gros job s'executera jusqu'a sa fin et ne sera pas interrompu pour
laisser sa place a un autre.
For the english version, type 'news class_eng'.
© CNRS - IDRIS, 23/04/2012