Context Navigation

Changes between Version 17 and Version 18 of Modipsl_titane

Timestamp:: 01/27/12 09:03:18 (12 years ago)
Author:: mafoipsl
Comment:: --

Legend:

: Unmodified
: Added
: Removed
: Modified

Modipsl_titane

-                      v17
+                      v18
+== Les messages de fin de job ==
+Pour recevoir les messages de fin de job envoyés par le job de calcul lui-même : fin de simulation, plantage, .... il faut :
+ * être dans le groupe platine. Le vérifier par la commande groups.
+ * avoir mis une clé ssh vide.
-[[BR]][[BR]]
 == Compiler le modèle IPSLCM5A ==
+ * il faut supprimer les 2 clés : "key_vectopt_loop key_vectopt_memory"  dans config/IPSLCM5A/AA_make
+ * il faut explicitement demander l'utilisation de 5 processeurs pour NEMO. Sinon le message est :
+{{{
+xmlf90 ../../../lib/libioipsl.a -L/applications/netcdf-3.6.3/lib -lnetcdff -lnetcdf
+/applications/intel/cprof/11.1.056/lib/intel64/libimf.so: warning: warning: feupdateenv is not implemented and will always fail
+../../../lib/libopa.a(opa.o): In function `opa_mp_opa_model_':
+opa.F90:(.text+0x2a5): relocation truncated to fit: R_X86_64_PC32 against symbol `dom_oce_mp_narea_' defined in COMMON section in ../../../lib/libopa.a(dom_oce.o)
+opa.F90:(.text+0x8bb): relocation truncated to fit: R_X86_64_PC32 against symbol `in_out_manager_mp_nprint_' defined in COMMON section in ../../../lib/libopa.a(in_out_manager.o)
+...
+opa.F90:(.text+0xa4d): additional relocation overflows omitted from the output
+gmake[2]: *** [../../../bin/opa] Error 1
+}}}
+La correction à faire est la suivante :
+{{{
+dans modipsl/modeles/NEMO/WORK/par_oce.F90 (lignes 29-31)
+      jpni   = 1,                   &  !: number of processors following i
+      jpnj   = 5,                   &  !: number of processors following j
+      jpnij  = 5                       !: nb of local domain = nb of
+processors
+}}}
+ Depuis décembre 2011, le couplé IPSLCM5A compile sans aucune modification sur titane.
 [[BR]][[BR]]
 == Faire une simulation avec le modèle IPSLCM5A  ==
- * Si vous travaillez sur 32 processus ('''!JobNumProcTot=32''') cela signifie que la composante atmosphérique tournera sur 30 CPUs alors que la composante océanique et le coupleur utiliseront chacun 1 CPU.
+ * Pour améliorer légerement les performances :
+La configuration par défaut du modèle couplé à la résolution 96x95x39 est quasiment équilibrée, cad que le modèle d'atmosphère sur 30 CPUs est très légerement plus rapide que le modèle d'ocean sur 1 CPU.
+[[BR]]
+jour simulé par LMDZ sur 30 CPUs : 25s
+[[BR]]
+jour simulé par NEMO sur 1 CPU : 27s
+[[BR]]
+ce qui donne 1 mois simulé en 900s (par comparaison on a 1 mois simulé en 600s sur 4 CPUs SX9).
+On voit donc que c'est le modèle d'océan qui va "guider" le temps de restitution du modèle couplé complet. En utilisant 2 process MPI pour l'océan on obtient :
+[[BR]]
+jour simulé par LMDZ sur 29 CPUs : 25s
+[[BR]]
+jour simulé par NEMO sur 2 CPU : 15s
+[[BR]]
+ce qui va donner 1 mois simulé en 840s.
+On voit donc que désormais, c'est le modèle d'atmosphère qui va "guider" le temps de restitution du modèle couplé complet. Mais à cette résolution là, il n'est pas possible d'utiliser plus de process pour LMDZ en parallélisation MPI seule (limite à 3 bandes de latitudes par process MPI).
+La configuration idéale est donc : 29 CPUs ATM, 2 CPUs OCE et 1 CPU pour Oasis (lorsque PISCES n'est pas activé).
+Si PISCES est activé (c'est le cas avec IPSLCM5A CMIP5) la configuration ideale est : 26 CPUs ATM, 5 CPUs OCE et 1 CPU pour Oasis
+Pour activer cette configuration-là, deux étapes sont nécessaires :
+ * Si vous travaillez sur 32 processus ('''!JobNumProcTot=32''') cela signifie que la composante atmosphérique tournera sur 26 CPUs alors que la composante océanique sur 5 CPUs et le coupleur oasis une seule. C'est ce qui se passe par défaut.
  * Execution Cas particulier : si vous souhaitez faire utiliser à votre NEMO parallèle un restart généré par un NEMO mono-processeur, alors il faut forcer une resoumission (ccc_msub) apres le 1er run de la simulation. Pour cela :