Changes between Version 1 and Version 2 of libIGCM/DocUtilisateur/FAQ
- Timestamp:
- 07/24/08 13:21:31 (16 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
libIGCM/DocUtilisateur/FAQ
v1 v2 1 . 2 ---- 3 . '''Documentation Utilisateur''' [[BR]] 4 Date 5 ["DocUtilisateur"] 6 7 . 8 ---- 9 . '''Sommaire''' 10 TableOfContents(5) 11 === Questions/Réponses === 12 13 ==== Comment repartir de zéro après un plantage ? ==== 1 '''Documentation Utilisateur''' [wiki:DocUtilisateur] 2 [[PageOutline(2,Table des matières,inline)]] 3 4 = Questions/Réponses = 5 6 == Comment repartir de zéro après un plantage ? == 14 7 Pour pouvoir relancer un job à zéro il faut : 15 8 1. effacer le fichier run.card … … 18 11 1. effacer le répertoire de sortie $DMFDIR/IGCM_OUT/IPSLCM4_v1_OASIS3/LO1 (pour mercure) ou $HOMEGAYA/IGCM_OUT/IPSLCM4_v1_OASIS3/LO1 (sur rhodes à l'IDRIS) 19 12 20 == == Comment continuer une simulation ? ====13 == Comment continuer une simulation ? == 21 14 Pour continuer un run au delà des dates existantes, il faut : 22 15 * Changer la variable !DateEnd dans config.card … … 28 21 1. !OldPrefix doit correspondre à la dernière date calculée dans le run que vous voulez prolonger 29 22 1. !PeriodDateBegin doit correspondre à la nouvelle date calculée (vous pouvez la retrouver dans le dernier fichier Scrip_output du run) 30 31 23 1. !PeriodDateEnd doit correspondre à la nouvelle date de fin 32 ==== Comment changer le nombre de processeurs/taches ==== 24 25 == Comment changer le nombre de processeurs/taches == 33 26 * Par défaut AA_job lance une exécution en parallèle sur un total de !JobNumProcTot tâches avec les options fournies par !JobRunOptions. Changer le nombre de processeurs avant de lancer la commande ins_job. Eviter de changer !JobRunOptions. Ces options sont dans le fichier config.card. 34 27 35 == == Comment choisir une execution en mode parallèle ou séquentiel ? ====28 == Comment choisir une execution en mode parallèle ou séquentiel ? == 36 29 * A l'Idris il faut utiliser la classe multi si on est en parallèle. C'est le fonctionnement par défaut. 37 30 * Depuis août 2007, le passage séquentiel/parallèle se fait automatiquement dans AA_job. Attention néanmoins à modifier la compilation qui est parallèle par défaut pour LMDZ et Orchidee dans les configurations récentes. Option -DCPP_PARA. 38 31 39 == == Où se trouve la sortie du dernier job d'une série ? ====32 == Où se trouve la sortie du dernier job d'une série ? == 40 33 * La dernière sortie de job, correspondant à la simulation des dernières périodes avant !DateEnd n'est pas rangée sur les serveurs de fichiers. On peut la trouver dans le répertoire de soumission : ${SUBMIT_DIR} 41 34 42 == == Comment renommer l'intégralité d'une expérience ? ====35 == Comment renommer l'intégralité d'une expérience ? == 43 36 * Exemple donné pour gaya, idem pour mercure en modifiant le path du rename (~p86denv/CMOR_SCRIPTS/rename) 44 37 * Je rappelle au passage que les noms d'expérience ne doivent pas contenir d'underscore. Si c'est le cas, ces expériences ne peuvent figurer dans la page mc2 : http://mc2.ipsl.jussieu.fr/PHP/testing.php?exp=PDCTLV1&resolution=false 45 38 {{{ 46 39 rlogin gaya 47 40 cd IGCM_OUT/IPSLCM4_v2 … … 51 44 }}} 52 45 53 == == Comment relancer les post-traitements à partir de la "frontale" ? ====46 == Comment relancer les post-traitements à partir de la "frontale" ? == 54 47 * En utilisant le mode !StandAlone des scripts create_ts.job (création de time series) et create_se.job (création de moyenne saisonnières). 55 48 * L'exemple suivant est donné sur mercure TX7, l'analogie est directe pour brodie TX7 ; concernant rhodes remplacé les "cp [-r]" par des "rcp [-r] brodie:" … … 57 50 * Supposons que l'expérience a post-traité ait été extrait dans /work/p86denv/PARA_SX8_ORCA2xLMD9671/SVN/modipsl et qu'il s'agit de la configuration IPSLCM4_v2. L'expérience en question s'appelle par exemple PDCTLV5. 58 51 * En mode !StandAlone on peut rajouter à loisir des variables dans les *.card, seules les séries temporelles qui n'existent pas sur le serveur de fichiers sont créees. 59 52 {{{ 60 53 # On prépare le terrain 61 54 cd ; mkdir -p POST/PDCTLV5 ; cd POST/PDCTLV5 … … 79 72 # On ramène les jobs de post-traitements depuis la libIGCM : 80 73 cp /work/p86denv/PARA_SX8_ORCA2xLMD9671/SVN/modipsl/libIGCM/create_ts.job . 81 #cp /work/p86denv/PARA_SX8_ORCA2xLMD9671/SVN/modipsl/libIGCM/create_se.job .74 cp /work/p86denv/PARA_SX8_ORCA2xLMD9671/SVN/modipsl/libIGCM/create_se.job . 82 75 83 76 # On configure create_ts.job : … … 87 80 }}} 88 81 89 == == Comment relancer les post-traitements à partir de la machine de calcul ? ====82 == Comment relancer les post-traitements à partir de la machine de calcul ? == 90 83 Cette façon de faire permet de tester des nouveaux post-traitements en phase d'inclusion dans la chaine ou bien de refaire tourner des post-traitements. Pour cela il faut utiliser la variable DRYRUN du job, la positionner à 3 pour ne passer que dans certaines étapes du job et relancer le job pour la dernière période. 91 84 * Dans le job SI VOUS COMPTEZ FAIRE QSUB : 92 {{{ 93 DRYRUN=3 # passage post-traitement seulement 94 !PeriodNb=1 # 1 seule période la dernière # si vous comptez faire qsub 95 #PBS -l 01:00:00 # réduire les temps CPU demandé # si vous comptez faire qsub 85 86 {{{ 87 DRYRUN=3 # passage post-traitement seulement 88 !PeriodNb=1 # 1 seule période la dernière si vous comptez faire qsub 89 #PBS -l 01:00:00 # réduire les temps CPU demandé si vous comptez faire qsub 96 90 }}} 97 91 * Dans le job SI VOUS COMPTEZ FAIRE DE L'INTERACTIF SUR TX OU BIEN SX : ./Job_TOTO : 98 92 {{{ 99 93 DRYRUN=3 # passage post-traitement seulement 100 94 RUN_DIR_PATH=/workdir4/rech/ces/rces452/BABATEST/TESTPOST # Le répertoire où va tourner le "mini-run" (crée si besoin) … … 103 97 * Dans le fichier run.card : 104 98 * Pour faire une execution à blanc d'une période : revenir 1 période en arrière (!CumulPeriod) et mettre !PeriodState à !OnQueue ou Running: 105 99 {{{ 106 100 #last PREFIX 107 101 OldPrefix= HOL20_18691130 … … 112 106 # State of Job "Start", "Running", "OnQueue", "Completed" 113 107 PeriodState= OnQueue 114 115 108 }}} 109 Toutes ces variables doivent être modifiées pour une relance correcte. 116 110 * Pour les post-traitements eux-mêmes, réinitialiser !PostState et indiquer qu'il faut relancer les post-traitements en mettant les variables !XxRunning à n. Mettre également la date de fin des séries temporelles déjà réalisées. Par exemple : 117 111 {{{ 118 112 PostState = Start 119 113 TimeSeriesRunning= n … … 123 117 }}} 124 118 125 == == Comment avoir les SE pour le coupleur CPL ====119 == Comment avoir les SE pour le coupleur CPL == 126 120 127 121 Il faut relancer les post-traitements en lançant create_se.job comme décrit dans la réponse à cette [http://wiki.ipsl.jussieu.fr/wiki_ipsl/IGCMG/libIGCM/DocUtilisateur/FAQ#head-0d4f6c4387459cf1300a1ffb23786e4c0b0a793a question-ci] après avoir changé NONE en Post_cpl_oce_xxx dans le fichier oasis.card ainsi : … … 137 131 }}} 138 132 139 == == Quels sont les principes de base pour relancer un job planté ? ====133 == Quels sont les principes de base pour relancer un job planté ? == 140 134 On doit pour l'instant : 141 135 1. nettoyer à la main le répertoire d'archive, … … 146 140 Détails des trois étapes : 147 141 1. Pour le répertoire d'archive ${R_SAVE} (donné dans le Script_Output_$jobname), on fait pour un job planté en février (02) 1986 : 148 142 {{{ 149 143 cd ${R_SAVE} 150 144 find . -name "*198602*" 151 145 find . -name "*198602*" -print -exec rm -f '{}' \; 152 146 }}} 153 147 /!\ Attention : 154 148 a. la seconde commande est destructive ! à manipuler avec beaucoup de prudence. 155 149 a. brodie ne voit pas directement ses répertoires d'archive (situés sur gaya), il faut donc se connecter sur ce dernier serveur pour faire le nettoyage. 156 150 1. Suivant les machines et l'état de la variable RUN_DIR_PATH, il faut nettoyer le répertoire de travail : 157 151 * Supprimer les fichiers de la racine du RUN_DIR_PATH 158 152 {{{ 159 153 cd ${RUN_DIR_PATH} 160 154 find . -type f -maxdepth 1 161 155 find . -type f -maxdepth 1 -print -exec rm -f '{}' \; 162 163 156 }}} 157 /!\ Attention : la seconde commande est destructive ! à manipuler avec beaucoup de prudence. 164 158 * Supprimer les derniers fichiers créés dans les sous-répertoires de sauvegarde temporaire, comme pour les répertoires d'archivage. Ceci n'est plus nécessaire. La double copie n'étant plus active pour le moment. 165 166 159 {{{ 160 cd ${R_OUT_SCR} 167 161 find . -name "*198602*" 168 162 find . -name "*198602*" -print -exec rm -f '{}' \; 169 170 163 }}} 164 /!\ Attention : la seconde commande est destructive ! à manipuler avec beaucoup de prudence. 171 165 1. Modifier !PeriodState dans le run.card et le placer soit à Running, soit à !OnQueue. 172 166 Enfin une bonne idée est de ressoumettre le job avec la sortie numérotée correctement : … … 175 169 }}} 176 170 177 == == Comment lancer un run guidé (nudge) ? ====171 == Comment lancer un run guidé (nudge) ? == 178 172 Ce paragraphe s'applique aux configurations contenant LMDZ (testé avec LMDZINCA). 179 173 1. Il faut ajouter un fichier guide.def dans le répertoire PARAM/ de votre répertoire d'expériences 180 174 {{{ 181 175 Type de fichier guide.def : 182 176 ncep=.false. # true si necp , false si ecmwf … … 193 187 tau_min_T=0.0208333 194 188 tau_max_T=10 195 189 }}} 196 190 1. Il faut modifier le fichier PARAM/run.def pour lui indiquer de prendre en compte guide.def 197 191 {{{ 198 192 Ajoutez la ligne : 199 193 INCLUDEDEF=guide.def 200 194 }}} 201 195 1. Il faut modifier la variable ok_guide dans le fichier PARAM/gcm.def 202 203 196 1. Dans COMP/lmdz.card : 204 197 a. Vous devez indiquer les adresses des fichiers de vents avec lesquels vous souhaitez guider votre modèle 205 198 {{{ 206 199 [BoundaryFiles] 207 200 List= ....\ 208 201 (/dmnfs/p24data/ECMWF96x72/AN${year}/u_ecmwf_${year}${month}.nc, u.nc)\ 209 202 (/dmnfs/p24data/ECMWF96x72/AN${year}/v_ecmwf_${year}${month}.nc, v.nc)\ 210 203 }}} 211 204 a. indiquer dans la liste [!ParametersFiles] le fichier guide.def 212 205 {{{ 213 206 [ParametersFiles] 214 207 List= ....\ 215 208 (${SUBMIT_DIR}/PARAM/guide.def,.) 216 209 }}} 217 210 1. Vous devez indiquer dans config.card le bon calendrier (leap pour prendre en compte les années bisextiles ou noleap pour ne pas en tenir compte) 218 211 219 == = Messages d'erreur ===212 == Messages d'erreur == 220 213 || '''Message d'erreur''' ||''' Remède''' || 221 214 || IGCM_debug_Exit : IGCM_config_!PeriodStart Error !PeriodState : Fatal || Pour repartir du début, supprimer le fichier run.card. Voir paragraphe 6 ||