wiki:PerformancesIPSLCM5

Version 14 (modified by ymipsl, 15 years ago) (diff)

--

Performances IPSLCM5

Cette page décrit les ressources nécessaires pour le couplé IPSLCM5 sur les différentes machines disponibles et pour les différentes résolutions utilisées. Sur certaines machines, seuls les temps de LMDZ ou NEMO sont indiqués. Elle prend la suite de la page wiki:PerformancesIPSLCM4_v2 écrite en 2008 avec des informations actualisées au 13/10/09.

Les détails sur le nombre d'heures disponibles sont là : http://www.genci.fr/spip.php?article53

En résumé, par rapport à 2008 :

  • le couplé en 39 niveaux prend 2 fois plus de temps qu'en 19 niveaux.
  • le couplé en 144x142 prend 2,5 fois plus de temps que le couplé en 96x95
  • toutes ces mesures sont sans aérosols
  • Machines massivement parallèles :
    • On sait faire tourner le couplé sur platine/titane et vargas moyennant quelques modifs connues. Ne pas hésiter à demander beaucoup d'heures dessus.
    • Il faut demander 10 fois plus de temps sur platine que sur les NEC (mercure/brodie)
    • Il faut demander 8 fois plus de temps sur vargas que sur les NEC (mercure/brodie)
    • Il faut demander 5 fois plus de temps sur titane que sur les NEC (mercure/brodie)
    • Demander autant d'heures avec ou sans OpenMP. La parallélisation mixte OpenMP/MPI permettra :
      • de demander plus de processeurs (limitation à jpj/3 avec MPI seul),
      • de réduire les temps d'exécution
      • mais ne diminue pas le temps calcul
  • Pas de demande explicite sur la SX-9 dédiée GIEC.

CCRT

NEC SX-8R

Heures disponibles : Pas d'info à ce jour.

Attention, on compte en temps réel sur le CCRT. Multiplier temps réel par le nombre de processeurs.

Le NEC SX-8R du CCRT (mercure) va plus vite que le NEC SX-8 de l'IDRIS (brodie) : 20% de mieux environ.

Résolution 44x43x19 - ORCA2

Mesure consommation 10 ans

machine Nb CPU Temps CPU Mémoire Temps réel Temps à demander
mercure (CCRT) 4 16 h 4 GB (3.2 GB) <7h30 30 h

Résolution 56x55x19 - ORCA2

Mesure consommation 10 ans

machine Nb CPU Temps CPU Mémoire Temps réel Temps à demander
mercure (CCRT) 4 36 h 4 GB (3.7 GB) 10h 40 h

Résolution 96x95x39 - ORCA2

Mesure consommation 10 ans (Validé)

machine Nb CPU Temps CPU Mémoire Temps réel Temps à demander
mercure (CCRT) 4 130 h 8 GB 40 h 160 h

Résolution 144x142x39 - ORCA2

Mesure consommation 10 ans (Validé)

machine Nb CPU Temps CPU Mémoire Temps réel Temps à demander
mercure (CCRT) 8 310 h 20 GB 45 h 360 h

Machine dédiée GIEC

Il s'agit du NEC SX-9. Seul un rapport d'activités sur ce qui a été fait depuis mai 2009 est demandé. Les heures demandées sur le NEC SX-9 sont prises en charge par le projet IPSL de Jean-Louis Dufresne qui avait été prévu sur 2 ans.

Bull Itanium : platine

Heures disponibles : pas d'informations à ce jour.

Résolution orca2- lmd 56x55x19

A cette résolution la, 1 process MPI Atm prend 4 fois plus de temps qu'un process MPI oce. Donc, un couple equilibre nous donne en MPI la configuration suivante :

  • 18 ATM + 5 OCE (cad 24 CPUs ou 3 noeuds de calcul) : 380s/mois

On est a la limite du nombre de process MPI possible.

En activant l'openMP cote ATM, on obtient la configuration equilibree suivante :

  • 16 process ATM MPI (x 4 taches OpenMP) + 7 OCE (soit 72 CPus ou 9 noeuds) : 240s/mois

Pour comparaison avec mercure (d'apres les perfs sur ta page wiki Luc) :

  • 4 CPUs (2 ATM + 1 OCE + 1 OASIS) : 250s/mois

Résolution 56x55x19 - ORCA2

Mesure consommation 10 ans (Validé)

machine Nb CPU Temps réel Temps à demander
platine 24 (18 atm + 5 oce + 1 oas) 13 h 312 h

Résolution 96x95x39 - ORCA2

Estimation consommation 10 ans

machine Nb CPU Temps réel Temps à demander
platine 20 50 h 1000 h

Résolution 144x142x39 - ORCA2

Mesure consommation 10 ans (Validé)

machine Nb CPU Temps réel Temps à demander
platine 48 (46 atm + 1 oce + 1 oas) 90 h 4 300 h

Bull Xeon : titane

Heures disponibles : 38,7 millions

LMDZ seul : résolution 96x95x39 - sans aerosol

Mesure consommation 10 ans mixte MPI/OPENMP

machine Nb CPU Temps réel Temps à demander
titane 8 49 h 392 h
titane 16 25 h 400 h
titane 32 14,6 h 467 h
titane 64 8,4 h 537 h
titane 128 5,4 h 691 h
titane 256 4,2 h 1075 h

LMDZ seul : résolution 96x95x39 - 6 aerosols

Mesure consommation 10 ans mixte MPI/OPENMP

machine Nb CPU Temps réel Temps à demander
titane 16 32.7 h 523 h
titane 32 18 h 576 h
titane 128 6.5 h 832 h

LMDZ seul : résolution 144x142x39 - sans aerosol

Mesure consommation 10 ans mixte MPI/OPENMP

machine Nb CPU Temps réel Temps à demander
titane 16 70.6 h 1130 h
titane 32 37.8 h 1209 h
titane 64 21.8 h 1395 h
titane 128 4.6 h 588 h

CINES

SGI Xeon : jade

Heures disponibles : 68,7 millions

NEMO tourne sur jade dans sa configuration ORCA025 :

  • sur 864 coeurs, 1728 CPUs réservés, utilisation de 4 coeurs/8
  • 1 an, sorties mensuelles : 3h de temps réel, comptabilisé : 5184h
  • domaine = 1442 x 1021 x 46, rdt=1440 sec, decoupage 62 x 18 = 864 (1116 - 252 domains sans océan)

IDRIS

NEC SX-8 : brodie

Heures disponibles : 480 000h

Attention, on compte en temps CPU sur le NEC de l'IDRIS.

Résolution 96x95x39 - ORCA2

Mesure consommation 10 ans (Validé)

machine Nb CPU Temps CPU Mémoire Temps réel
brodie (IDRIS) 4 160 h 5 GB 40 h

Résolution 144x142x39 - ORCA2

Mesure consommation 10 ans (Validé)

machine Nb CPU Temps CPU Mémoire Temps réel
brodie (IDRIS) 8 400 h 12 GB 55 h

Résolution 144x142x39 - ORCA05

Estimation consommation 10 ans

machine Nb CPU Temps CPU Mémoire Temps réel
brodie (IDRIS) 16 (12 océan + 4 atmosphère) 1600 h 60 GB 100 h

LMDZ sur brodie

LMDZ 96x72x50

Nb CPUS Durée Sorties Temps réel Temps CPU cumulé Mémoire
options prod, MPI 8 5 ans 2GB/mois histhf 11 h 70 h 11 GB
= 4 1 an = 4 h 14 h 7 GB

LMDZ4OR_v3 96x95x39

Nb CPUS Durée Temps réel
4 10 ans 21 mn/mois

IBM Power6 : vargas

Attention sur vargas, on compte en temps réel

Résolution 96x95x19 - ORCA2

Mesure consommation 10 ans (Validé)

machine Nb CPU Temps CPU Mémoire Temps réel Temps à demander
vargas (IDRIS) 32 (6 océan + 25 atmosphère) 800 h - 25 h 800h

Résolution 144x142x39 - ORCA2

Mesure consommation 10 ans (Validé)

machine Nb CPU Temps CPU Mémoire Temps réel Temps à demander
vargas (IDRIS) 32 (1 + 1 + 30) 3000 h - 100 h 3200 h

Résolution 96x71x19 LMDZ forcé

LMDZ4 head, flag de l'ancienne physique, mixte MPI/OPENMP (avec plus grand nombre de processeurs possible).

(A valider)

Estimation consommation 10 ans

machine Nb CPU Temps réel
vargas (IDRIS) 16 36 h
vargas (IDRIS) 32 21 h
vargas (IDRIS) 48 15 h
vargas (IDRIS) 64 12 h
vargas (IDRIS) 96 9 h

NEMO tourne sur vargas dans sa configuration ORCA025 :

  • sur 186 processeurs
  • 1 an, sorties mensuelles : 6h de temps réel
  • domaine = 1442 x 1021 x 46, rdt=1440 sec

IBM Blue Gene : babel

Heures disponibles : 232 millions

On ne fera pas tourner le couplé IPSL sur cette machine. Trop peu de mémoire par processeurs.

Demande d'accès pour des tests des composantes seules.