Babel : classes batch et limitations interactives


************************************************************************

Structure de classes sur Babel                          20 janvier 2011

************************************************************************

I/ Les classes de la Blue Gene/P
   =============================

   T(h)
       ^
       |
   20h +-------+--------+--------+--------+--------+-------+
       |       |        |        |        |        |       |
       | MRt3  | 1Rt3   | 2Rt3   | 4Rt3   | 8Rt3   | 10Rt3 |
       |       |        |        |        |        |       |
   10h +-------+--------+--------+--------+--------+-------+
       |       |        |        |        |        |       | 
       | MRt2  | 1Rt2   | 2Rt2   | 4Rt2   | 8Rt2   | 10Rt2 |
       |       |        |        |        |        |       |
    1h +-------+--------+--------+--------+--------+-------+
       | MRt1  | 1Rt1   | 2Rt1   | 4Rt1   | 8Rt1   | 10Rt1 |
     0 +-------+--------+--------+--------+--------+-------+-->
       64      512      1024     2048     4096     8192    10240
                                              Nombre de noeuds de calcul
 coeur -> unite de base
 noeud de calcul -> 4 coeurs
 MR -> Demi rack : 512 noeuds soit 2048 coeurs
 1R  -> 1 rack de 1024 noeuds soit 4096 coeurs
 ...
 T(h) : temps elapsed en heures

 Memoire: 2Gio par noeud 

 Remarques :
 -----------
 - Le nombre de noeuds de calcul minimal a reserver est de 64 (directive
   bg_size).
   Cela correspond a un minimum de 256 coeurs.
 - Le nombre de noeuds reserves doit etre 64, 128, 256, 512, 1024, 2048,
   4096, 6144, 8192 ou 10240.
 - L'acces a plus d'un rack (1024 noeuds, 4096 coeurs) est soumis a
   autorisation.
 - Attention, est comptabilise le temps ecoule (elapsed) multiplie par
   le nombre de coeurs reserves meme si certains d'entre eux ne sont pas
   utilises...
   (voir site web Support technique -> IBM Blue Gene/P -> notes sur la
   comptabilite des travaux)



II/ Les classes de la frontale (Power5+)
    ====================================

 Pour vos activites monoprocesseur comme la cross compilation en batch,
 les activites de transferts de fichiers, petits pre et post traitement
 sequentiels encadrant vos jobs massivement paralleles,...

 Vous disposez de 3 classes :
   - t1 : limite a 1h de temps elapsed et 15min de temps CPU
   - t2 : limite a 10h de temps elapsed et 2h de temps CPU
   - archive : uniquement pour les transferts mfput/mfget avec Gaya

 Memoire (stack + data) :
   - Par defaut : data=2.0Gio, stack=2.0Gio
   - data + stack <=  4.0Gio

 Ces classes ne sont pas facturees sur Babel.

 Classe archive :
 ----------------
 - Cette classe est STRICTEMENT RESERVEE aux transferts mfput/mfget avec
   Gaya.
 - Elle peut etre suspendue par l'IDRIS lorsque la machine Gaya est
   indisponible. Une fois la situation retablie, cette queue reprend un
   fonctionnement normal.
 - Pour l'utiliser, il est necessaire de specifier la directive
   LoadLeveler "#@class = archive" dans votre travail.


III/ Les limites en interactif de la Blue Gene/P (commande bgrun)
     ===========================================

 Temps ecoule (elapsed): 30min
 Nombre de noeuds de calcul: de 64, 128 ou 256

 Remarques :
 ---------
 - Le nombre de noeuds de calcul minimal a reserver est de 64.
   Cela correspond a un minimum de 256 coeurs.
 - Le nombre de noeuds reserves doit etre 64, 128, 256.
 - Attention, est comptabilise le temps ecoule (elapsed) multiplie par
   le nombre de coeurs reserves meme si certains d'entre eux ne sont pas
   utilises...
   (voir site web Support technique -> IBM Blue Gene/P -> notes sur la
   comptabilite des travaux)


IV/ Les limites en interactif de la frontale (Power5)
    =================================================

 Temps CPU: 1h
 Memoire: idem batch frontale


V/ Politique d'exploitation des travaux
   ====================================

 Afin d'ameliorer la cohabition entre les gros jobs (>4 racks) et les
 nombreux autres jobs plus petits, certaines mesures ont ete prises :

 - Petits jobs (pour tests ou developpement jusqu'a 2048 coeurs et 1h)
   Des ressources leurs sont dediees pendant la journee (en semaine).
   Ces ressources sont limitees. Lorsque celles-ci sont entierement
   occupees, ces petits jobs s'ecouleront avec une priorite normale sur
   le reste de la machine.
 - Gros jobs (plus de 4 racks). Ils sont prioritaires du jeudi soir au
   lundi matin. En dehors de cette periode, ils ne pourront s'executer
   que si des ressources suffisantes sont libres et qu'aucun autre job
   n'en a besoin (priorite minimale). Attention, une fois demarre, un
   gros job s'executera jusqu'a sa fin et ne sera pas interrompu pour
   laisser sa place a un autre.


For the english version, type 'news class_eng'.

© CNRS - IDRIS, 23/04/2012