Version 32 (modified by jgipsl, 13 years ago) (diff) |
---|
Performances IPSLCM5A
2011
Ressources disponibles
/!\ Plus de vectoriel : ni brodie ni mercure SX-8R
centre | Supercalculateurs | Estimation des ressources disponibles DARI 2012- 1ère session |
CINES | IBM Power7 - Yoda | 920 300 |
SGI ICE - Jade | 111 055 000 | |
IDRIS | IBM SP – Vargas | 18 288 000 |
IBM BG/P - Babel | 198 956 000 | |
CCRT | Bull Xéon – Titane | 33 064 000 |
Bull Xéon – Titane noeuds hybrides GPU | 920 000 | |
TGCC | Bull - Curie nœuds larges | 6 902 000 |
Bull - Curie nœuds fins | 40 500 000 | |
Bull - Curie nœuds hybrides GPU | 144 000 |
Performances connues
IDRIS IBM vargas
- Les post-traitements des simulations faites sur vargas se font actuellement sur ulam. Nous rencontrons des difficultés insurmontables dans les post-traitements sur ulam et en l'état, il est impossible de réaliser des simulations de type CMIP5 (historical) en production.
- Il faudrait pouvoir post-traiter les simulations faites sur vargas sur vargas elle-même. Il s'agit des jobs de rebuild, TS et Monitoring, SE et ATLAS. Pour cela il faudrait sur vargas :
- disposer des outils nco et C° nécessaires (rappeler la liste svp)
- avoir la possibilités de lancer jusque 150 jobs à la fois, en classe scalaire sur vargas. C'est ce que peut soumettre le script TimeSeriesChecker de vérification des TS
- avoir la possibilité de tourner une vingtaine de jobs de type scalaire simultanément par utilisatueur
- disposer de l'espace TMPDIR nécessaire à ces jobs de post-traitements qui tourneraient simultanément.
- Il faudrait pouvoir post-traiter les simulations faites sur vargas sur vargas elle-même. Il s'agit des jobs de rebuild, TS et Monitoring, SE et ATLAS. Pour cela il faudrait sur vargas :
- Chiffrages issus de la simu v3.historicalV52 qui a tourné entre mai et juin 2011 :
- Une simulation de type historical (1850-2006, 157 ans) tourne en lançant 40 jobs enchainés sur vargas (<10h).
- L'execution s'est étalée sur une période de 1 mois environ. Elle a lancé au fur et à mesure les jobs de post-traitements sur ulam puis le rattrapage des TS a été lancé à la main. En tout :
- 156 jobs de rebuilds, (<10h) + 9 à refaire à la main à cause de souci d'accès aux fichiers gaya (arrêts désynchronisés)
- 15 jobs de SE (moyennes saisonnières), (<10h)
- 30 jobs de monitoring (<1h)
- 45 jobs d'atlas (<1h)
- 464 jobs de TimeSeries (TS) en direct (<20h)
- 166 jobs de TS (<20h) de rattrapage (via le script TimeSeriesChecker)
- Les jobs de TS peuvent partir en time limit exceeded. Le max de temps réel étant actuellement de 20h.
IPSLCM5A
Mesure consommation 10 ans pour résolution 96x95x39 - ORCA2
machine | Nb CPU | Temps réel | Temps à demander |
vargas (IDRIS) | 32 (5 océan + 26 atmosphère) | 40 h | 40x32 = 1 300h |
Attention aux ressources pour le post-traitement.
Mesure consommation 10 ans pour résolution 144x142x39 - ORCA2
machine | Nb CPU | Temps réel | Temps à demander |
titane | 64 (16 océan + 1 oasis + 47 atm | 7h par an | 70x64 = 4 500h |
Test 1 an OK. Voir : Monitoring VERIF092011 IPSLCM5A-MR
Attention aux ressources pour le post-traitement.
LMDZOR
Ancienne physique résolution 96x95x39, mesure consommation 10 ans
machine | Nb CPU | Temps réel | Temps à demander |
vargas (IDRIS) | 32 | 30 h | 30x32 = 960h |
Nouvelle physique NPv3 résolution 96x95x39, mesure consommation 10 ans
machine | Nb CPU | Temps réel | Temps à demander |
vargas (IDRIS) | 32 | 70 h | 70x32 = 2240h |
CCRT Bull titane
2 difficultés majeurs sur titane :
- Les post-traitements des simulations faites sur titane (et sur le SX9) se font actuellement sur cesium. Nous rencontrons des difficultés car cesium est trop petite pour absorber toute la charge des post-traitements.
- Une première action a été de faire les rebuild sur la frontale de titane. Utiliser libIGCM_v1_11 pour cela.
- Pour pouvoir faire tous les post-traitements sur titane il faudrait :
- disposer des outils nco et C° nécessaires (rappeler la liste svp)
- avoir la possibilités de lancer jusque 150 jobs à la fois, en classe scalaire sur titane. C'est ce que peut soumettre le script TimeSeriesChecker de vérification des TS
- avoir la possibilité de tourner une vingtaine de jobs de type scalaire simultanément par utilisateur
- disposer de l'espace TMPDIR nécessaire à ces jobs de post-traitements qui tourneraient simultanément.
- Le nombre d'inodes sur /dmnfs
- Une simulation de type historical produit plus de 120 000 fichiers.
- Les répertoires ATLAS et MONITORING sont sur /dmnfs pour être accessibles par dods.
- Au TGCC, il est prévu d'avoir un 2ème espace visible depuis dods. Quand ce sera prêt on stockera les ATLAS (20 000) et MONITORING (400 fichiers) là et on en fera un tar pour stocker un seul fichier sur STOREDIR
- Les fichiers de type Analyse et SE (2000 fichiers) resteront en l'état. A noter ils sont également visible depuis dods. Il y aura donc 2 serveurs dods.
- Les fichiers de type Restart (22 000 fichiers) seront gardés une fois par an au lieu de une fois par mois de simulation. (2 000 fichiers au final)
- Les fichiers de type Output seront regroupés (commande nccat) par an dans un répertoire Packed (au lieu de Output). Regroupement par 10 ans pou IPSLCM5A-LR et par 5 ans pour IPSLCM5A-MR.
- Les fichiers de type texte seront regroupés par an ou plus (cat).
- Les répertoires ATLAS et MONITORING sont sur /dmnfs pour être accessibles par dods.
- Une simulation de type historical produit plus de 120 000 fichiers.
- Le travail de développement nécessaire est important et un soutien ingénieur spécifique est demandé. Besoins déjà répertoriés :
- script de Package/Verification/Ménage, modification des scripts de TS pour tenir compte de la nouvelle arborescence, diffusion de cette pratique à tous, ...
- mise en place d'un cache dans la chaine pour stocker les fichiers produits par les simus, les accéder depuis les jobs de post-traitements et stocker in fine sur SCRATCHDIR des fichiers qui ne seront plus utilisés par la chaine de production.
Voir aussi BasculeCCRTTGCC
Résolution 96x95x39 - ORCA2
Mesure consommation 10 ans (sorties "légères")
machine | Nb CPU | Temps réel | Temps à demander |
titane | 32 | 35 h | 1120 h |
Attention aux ressources pour le post-traitement.
Attention au nombre de fichiers sur le stockage.
Résolution 144x142x39 - ORCA2
Mesure consommation 10 ans
machine | Nb CPU | Temps réel | Temps à demander |
titane | 64 | ?? | ?? |
Test en cours (20/9/2011)
Attention aux ressources pour le post-traitement.
Attention au nombre de fichiers sur le stockage.
Configuration Forcée : LMDZORINCA
Vous trouverez les renseignements sur cette page
TGCC Bull curie noeuds larges
Attention : pas d'environnement modipsl/libIGCM à ce jour.
Résolution 96x95x39 - ORCA2
Mesure consommation 10 ans
machine | Nb CPU | Temps réel | Temps à demander |
curie | 32 | 46 h | 1472 h |
TGCC Bull curie noeuds fins
TGCC Bull curie noeuds hybrides
Performances estimées
CINES : l'environnement des simulations IPSL n'est pas installé.
CINES IBM yoda
Pas de performances connues
CINES SGI jade
Grand challenge
NEMO (Drakkar)
Attention : pas d'environnement modipsl/libIGCM à ce jour.
IPSLCM5A : 96x95x39 - ORCA2
Mesure consommation 10 ans
machine | Nb CPU | Temps réel | Temps à demander |
jade | 32 | 60h | 1920 h |
IDRIS BlueGene babel
Utilisation non conseillée. Tests avec NEMO seulement.
CCRT Bull titane GPUs
Pas d'utilisation recensée à ce jour.
2010
C'est la suite de la page PerformancesIPSLCM5 : qui décrivait les performances de IPSLCM5 en automne 2009.
Quand on n'a pas les informations directement sur IPSLCM5A, on décrit quelques performances connues.
A noter :
- le couplé en 144x142 (IPSLCM5A-MR) prend 2,5 fois plus de temps que le couplé en 96x95.
- les sorties complètes (type historical) CMIP5 ajoutent 20 % de temps sur les NEC.
CCRT
SX9 : mercure
Ressources : 320 000 h dédiées GIEC
Résolution 96x95x39 - ORCA2
Mesure consommation 10 ans
machine | Nb CPU | Temps CPU | Mémoire | Temps réel | Temps à demander |
mercure (CCRT) | 4 | 88 h | 13 GB | 32 h | 140 h |
Résolution 144x142x39 - ORCA2
Mesure consommation 10 ans
machine | Nb CPU | Temps CPU | Mémoire | Temps réel | Temps à demander |
mercure (CCRT) | 8 | 180 h | 35 GB | 35 h | 300 h |
SX8R : mercure
Pour mémoire : pas de ressources disponibles
Résolution 96x95x39 - ORCA2
Mesure consommation 10 ans
machine | Nb CPU | Temps CPU | Mémoire | Temps réel | Temps à demander |
mercure (CCRT) | 4 | 130 h | 13 GB | 40 h | 160 h |
Xeon : titane
Ressources disponibles : 44 100 000 h
Pour mémoire : Ressources disponibles sur GPU : 1 114 200 h
Résolution 96x95x39 - ORCA2
Mesure consommation 10 ans
machine | Nb CPU | Temps réel | Temps à demander |
titane | 32 | 35 h | 1120 h |
IDRIS
SX8 : brodie
Ressources disponibles (projets en prolongation seulement) : 512 000 h
Attention, on compte en temps CPU sur le NEC de l'IDRIS.
Résolution 96x95x39 - ORCA2
Mesure consommation 10 ans
machine | Nb CPU | Temps CPU à demander | Mémoire | Temps réel |
brodie (IDRIS) | 4 | 160 h | 11 GB | 50 h |
IBM : vargas
Ressources disponibles : 22 560 000 h
Résolution 96x95x39 - ORCA2
Mesure consommation 10 ans
machine | Nb CPU | Temps CPU | Mémoire | Temps réel | Temps à demander |
vargas (IDRIS) | 32 (5 océan + 26 atmosphère) | 1300 h | - | 40 h | 1 300h |
IBM Blue Gene : babel
Pour mémoire. Ressources disponibles : 248 000 000 h
CINES
Ressources disponibles : 138 100 000 h
Xeon : jade
Attention : pas d'environnement modipsl/libIGCM à ce jour.
Résolution 96x95x39 - ORCA2
Mesure consommation 10 ans
machine | Nb CPU | Temps réel | Temps à demander |
jade | 32 | 60h | 1920 h |
Attachments (12)
-
DossierTechnique_2012.doc
(154.5 KB) -
added by omamce 13 years ago.
Dossier technique pour les demandes d'heures 2012
- Comp-convergence-clim-t2m-slp-precip-calculateurs.pdf (20.5 KB) - added by mafoipsl 12 years ago.
- DARI2013IPSL-demande-v2.doc (776.5 KB) - added by mafoipsl 12 years ago.
- DARI2013IPSL-demande-v2.pdf (937.8 KB) - added by mafoipsl 12 years ago.
- DARI2013IPSL-bilan-v2.doc (96.5 KB) - added by mafoipsl 12 years ago.
- DARI2013IPSL-bilan-v2.pdf (163.1 KB) - added by mafoipsl 12 years ago.
- DARI2013IPSL-publi-v2.doc (101.5 KB) - added by mafoipsl 12 years ago.
- DARI2013IPSL-publi-v2.pdf (108.8 KB) - added by mafoipsl 12 years ago.
- Comp-convergence-clim-t2m-precip-slp-calculateurs-new-200yrdist2.jpg (106.3 KB) - added by mafoipsl 11 years ago.
- Ressources-calcul-sept2013.pdf (416.4 KB) - added by mafoipsl 11 years ago.
- DossierTechnique_2013_v2.pdf (1.1 MB) - added by mafoipsl 11 years ago.
- DossierTechnique_2013_v2.doc (544.5 KB) - added by mafoipsl 11 years ago.