[702] | 1 | #!/bin/bash |
---|
| 2 | |
---|
| 3 | function replace() # KEY VALUE FILE |
---|
| 4 | { |
---|
| 5 | # strip leading zeros that confuse ccc_msub |
---|
| 6 | VALUE=$(echo $2 | sed 's/^0*//') |
---|
| 7 | sed -i -e "s/$1/$VALUE/g" $3 |
---|
| 8 | echo "$1=$VALUE" >> params.sh |
---|
| 9 | } |
---|
| 10 | |
---|
[994] | 11 | function create_run2() # NBP LLM TIME_STEP NSPLIT_I NSPLIT_J OMP_LEVEL_SIZE NB_MPI NB_OMP |
---|
[702] | 12 | { |
---|
| 13 | NBP=$1 |
---|
[994] | 14 | LLM=$2 |
---|
| 15 | TIME_STEP=$3 |
---|
| 16 | shift; shift; shift |
---|
[702] | 17 | |
---|
[994] | 18 | NAME="run_$1_$2_$3_$4_$5" |
---|
[702] | 19 | mkdir $NAME |
---|
| 20 | cp run.def job.sh mpmd.conf gcm.sh *.xml $NAME |
---|
| 21 | cd $NAME |
---|
| 22 | touch params.sh |
---|
| 23 | |
---|
| 24 | replace NBP $NBP run.def |
---|
[994] | 25 | replace LLM $LLM run.def |
---|
[702] | 26 | replace TIME_STEP $TIME_STEP run.def |
---|
[994] | 27 | replace NSPLIT_I $1 run.def |
---|
| 28 | replace NSPLIT_J $2 run.def |
---|
| 29 | replace OMP_LEVEL_SIZE $3 run.def |
---|
| 30 | replace NUM_MPI $4 mpmd.conf |
---|
| 31 | replace NUM_MPI $4 job.sh |
---|
| 32 | replace NUM_OMP $5 job.sh |
---|
[702] | 33 | cd .. |
---|
| 34 | } |
---|
| 35 | |
---|
[994] | 36 | function create_run() # NBP TIME_STEP NSPLIT OMP_LEVEL_SIZE NB_MPI NB_OMP |
---|
| 37 | { |
---|
| 38 | create_run2 $1 79 $2 $3 $3 $4 $5 $6 |
---|
| 39 | } |
---|
| 40 | |
---|
| 41 | function cmd_create_220km_39() |
---|
| 42 | { |
---|
| 43 | rm -rf run_* |
---|
| 44 | create_run2 41 39 600 2 2 1 040 01 |
---|
| 45 | create_run2 41 39 600 2 2 1 010 04 |
---|
| 46 | create_run2 41 39 600 2 2 2 040 02 |
---|
| 47 | create_run2 41 39 600 2 2 2 010 08 |
---|
| 48 | create_run2 41 39 600 2 2 4 040 04 |
---|
| 49 | create_run2 41 39 600 2 2 4 010 16 |
---|
| 50 | |
---|
| 51 | create_run2 41 39 600 2 3 1 060 01 |
---|
| 52 | create_run2 41 39 600 2 3 1 010 06 |
---|
| 53 | create_run2 41 39 600 2 3 2 060 02 |
---|
| 54 | create_run2 41 39 600 2 3 2 010 12 |
---|
| 55 | create_run2 41 39 600 2 3 4 060 04 |
---|
| 56 | create_run2 41 39 600 2 3 4 010 24 |
---|
| 57 | |
---|
| 58 | create_run2 41 39 600 3 3 1 090 01 |
---|
| 59 | |
---|
| 60 | create_run2 41 39 600 3 4 1 120 01 |
---|
| 61 | create_run2 41 39 600 3 4 1 020 06 |
---|
| 62 | create_run2 41 39 600 3 4 1 010 12 |
---|
| 63 | create_run2 41 39 600 3 4 2 120 01 |
---|
| 64 | create_run2 41 39 600 3 4 2 020 12 |
---|
| 65 | create_run2 41 39 600 3 4 2 010 24 |
---|
| 66 | create_run2 41 39 600 3 4 4 120 04 |
---|
| 67 | create_run2 41 39 600 3 4 4 020 12 |
---|
| 68 | create_run2 41 39 600 3 4 4 010 24 |
---|
| 69 | |
---|
| 70 | create_run2 41 39 600 4 4 1 160 01 |
---|
| 71 | create_run2 41 39 600 4 4 1 040 04 |
---|
| 72 | create_run2 41 39 600 4 4 2 160 02 |
---|
| 73 | create_run2 41 39 600 4 4 2 040 08 |
---|
| 74 | create_run2 41 39 600 4 4 4 160 04 |
---|
| 75 | create_run2 41 39 600 4 4 4 040 16 |
---|
| 76 | ls -d run_* |
---|
| 77 | } |
---|
| 78 | |
---|
[702] | 79 | function cmd_create_220km() |
---|
| 80 | { |
---|
| 81 | rm -rf run_* |
---|
| 82 | create_run 41 600 4 6 040 24 |
---|
| 83 | create_run 41 600 4 6 080 12 |
---|
| 84 | create_run 41 600 4 6 160 06 |
---|
| 85 | create_run 41 600 4 4 160 04 |
---|
| 86 | create_run 41 600 4 4 080 08 |
---|
| 87 | create_run 41 600 4 2 040 08 |
---|
| 88 | create_run 41 600 4 1 020 08 |
---|
| 89 | create_run 41 600 4 1 040 04 |
---|
| 90 | create_run 41 600 4 1 080 02 |
---|
| 91 | create_run 41 600 4 1 160 01 |
---|
| 92 | create_run 41 600 2 1 040 01 |
---|
| 93 | ls -d run_* |
---|
| 94 | } |
---|
| 95 | |
---|
| 96 | function cmd_create_110km() |
---|
| 97 | { |
---|
| 98 | rm -rf run_* |
---|
| 99 | create_run 81 300 4 1 160 01 |
---|
| 100 | create_run 81 300 6 1 360 01 |
---|
| 101 | create_run 81 300 8 1 160 04 |
---|
| 102 | create_run 81 300 8 1 640 01 |
---|
| 103 | ls -d run_* |
---|
| 104 | } |
---|
| 105 | |
---|
| 106 | function cmd_create_70km() |
---|
| 107 | { |
---|
| 108 | rm -rf run_* |
---|
| 109 | create_run 129 200 8 1 640 01 |
---|
| 110 | create_run 129 200 10 1 1000 01 |
---|
| 111 | create_run 129 200 12 1 1440 01 |
---|
| 112 | create_run 129 200 16 1 2560 01 |
---|
| 113 | ls -d run_* |
---|
| 114 | } |
---|
| 115 | |
---|
| 116 | function cmd_create_35km() |
---|
| 117 | { |
---|
| 118 | rm -rf run_* |
---|
| 119 | create_run 257 100 12 1 1440 1 |
---|
| 120 | create_run 257 100 12 1 0720 2 |
---|
| 121 | create_run 257 100 12 1 0360 4 |
---|
| 122 | create_run 257 100 12 1 0120 12 |
---|
| 123 | create_run 257 100 12 1 0060 24 |
---|
| 124 | create_run 257 100 12 2 1440 2 |
---|
| 125 | create_run 257 100 12 4 1440 4 |
---|
| 126 | create_run 257 100 12 6 1440 6 |
---|
| 127 | create_run 257 100 12 8 1440 8 |
---|
| 128 | create_run 257 100 16 1 2560 1 |
---|
| 129 | create_run 257 100 16 1 1280 2 |
---|
| 130 | create_run 257 100 16 1 0640 4 |
---|
| 131 | create_run 257 100 16 1 0320 8 |
---|
| 132 | create_run 257 100 16 4 2560 4 |
---|
| 133 | create_run 257 100 16 6 2560 6 |
---|
| 134 | create_run 257 100 16 8 2560 8 |
---|
| 135 | create_run 257 100 24 4 5760 4 |
---|
| 136 | ls -d run_* |
---|
| 137 | } |
---|
| 138 | |
---|
| 139 | function cmd_create_8km() |
---|
| 140 | { |
---|
| 141 | rm -rf run_* |
---|
| 142 | create_run 1025 20 32 1 2560 4 |
---|
| 143 | ls -d run_* |
---|
| 144 | } |
---|
| 145 | |
---|
| 146 | function cmd_submit() |
---|
| 147 | { |
---|
| 148 | for RUN in run_* ; do |
---|
| 149 | cd $RUN |
---|
| 150 | if [ -f already_done ]; then |
---|
| 151 | echo "$RUN has run already." |
---|
| 152 | else |
---|
| 153 | ccc_msub job.sh |
---|
| 154 | fi |
---|
| 155 | cd .. |
---|
| 156 | done |
---|
| 157 | } |
---|
| 158 | |
---|
| 159 | #------------------------------------- Reporting -------------------------------------- |
---|
| 160 | |
---|
| 161 | function get_troughput() |
---|
| 162 | { |
---|
| 163 | grep Throughput logs/gcm.log | tail -n 5 | awk '{print $12}' | sort -r | head -n 1 |
---|
| 164 | } |
---|
| 165 | |
---|
| 166 | function get_ms_step() |
---|
| 167 | { |
---|
| 168 | grep 'ms/step' logs/gcm.log | tail -n 5 | awk '{print $8}' | sort -r | head -n 1 |
---|
| 169 | } |
---|
| 170 | |
---|
| 171 | function get_frac() |
---|
| 172 | { |
---|
| 173 | grep $1 logs/gcm.log | grep -v DEFAULT | grep -v caldyn | grep -v nqdyn | tail -n 4 | head -n 1 | awk '{print $3}' |
---|
| 174 | } |
---|
| 175 | function cmd_stats() |
---|
| 176 | { |
---|
| 177 | echo RUN frac_dyn_adv frac_MPI Throughput ms/step |
---|
| 178 | for RUN in run_* ; do |
---|
| 179 | cd $RUN |
---|
| 180 | # pwd |
---|
| 181 | # ls logs/gcm.log |
---|
| 182 | frac_adv=$(get_frac adv) |
---|
| 183 | frac_dyn=$(get_frac dyn) |
---|
| 184 | frac_adv_MPI=$(get_frac adv_MPI) |
---|
| 185 | frac_dyn_MPI=$(get_frac dyn_MPI) |
---|
| 186 | # echo $frac_adv $frac_dyn $frac_adv_MPI $frac_dyn_MPI |
---|
| 187 | echo $RUN $(( frac_adv+frac_dyn )) $((frac_adv_MPI+frac_dyn_MPI)) $(get_troughput) $(get_ms_step) |
---|
| 188 | cd .. |
---|
| 189 | done |
---|
| 190 | } |
---|
| 191 | |
---|
| 192 | function MPI() |
---|
| 193 | { |
---|
| 194 | run=$1 |
---|
| 195 | cmd=$2 |
---|
| 196 | nprocs=$(echo $run | tr "_" ' ' | awk '{print $4'} ) |
---|
| 197 | nprocs=$(compute $nprocs) |
---|
| 198 | stats=$(grep MPI_$cmd $run/logs/gcm.log | tail -n 1) |
---|
| 199 | time=$(echo $stats | awk '{print $3}') |
---|
| 200 | count=$(echo $stats | awk '{print $4}') |
---|
| 201 | wall=$(echo $stats | awk '{print $5}') |
---|
| 202 | # echo $stats |
---|
| 203 | # echo $nprocs $time $count $wall >&2 |
---|
| 204 | # echo $run $cmd |
---|
| 205 | echo $run $cmd $(compute "$time/$nprocs") $((count/nprocs)) $wall |
---|
| 206 | } |
---|
| 207 | |
---|
| 208 | function compute() |
---|
| 209 | { |
---|
| 210 | bc <<< "scale=2 ; $1" |
---|
| 211 | } |
---|
| 212 | function cmd_MPI() |
---|
| 213 | { |
---|
| 214 | # MPI_Waitall MPI_Alltoall MPI_Allreduce MPI_Bcast MPI_Barrier MPI_Isend MPI_Comm_size MPI_Reduce MPI_Irecv MPI_Comm_rank MPI_Init MPI_Finalize |
---|
| 215 | echo '# [run] [func] [time] [count] <%wall>' |
---|
| 216 | for cmd in Alltoall Allreduce Bcast Waitall Barrier ; do |
---|
| 217 | for run in run_* ; do |
---|
| 218 | # echo $run $(grep MPI_$cmd $run/logs/gcm.log) |
---|
| 219 | MPI $run $cmd |
---|
| 220 | done |
---|
| 221 | done |
---|
| 222 | } |
---|
| 223 | function elapsed() |
---|
| 224 | { |
---|
| 225 | cd $1 |
---|
| 226 | useful=$(grep elapsed logs/gcm.log | awk '{print $4}') |
---|
| 227 | echo $useful |
---|
| 228 | hhmmss=$(grep icosa_gcm.exe DYN_bench*.o | awk '{print $7}') |
---|
| 229 | minutes=$(date +'%M' -d $hhmmss) |
---|
| 230 | seconds=$(date +'%S' -d $hhmmss) |
---|
| 231 | echo $(compute "$seconds+60*$minutes-$useful") |
---|
| 232 | cd .. |
---|
| 233 | } |
---|
| 234 | |
---|
| 235 | function cmd_elapsed() |
---|
| 236 | { |
---|
| 237 | for x in run_* ; do |
---|
| 238 | echo $x $(elapsed $x) |
---|
| 239 | done |
---|
| 240 | } |
---|
| 241 | |
---|
| 242 | #--------------------------------------------------------------------------------------- |
---|
| 243 | |
---|
| 244 | function cmd_clean() |
---|
| 245 | { |
---|
| 246 | rm -f $(find . -name restart.nc) |
---|
| 247 | } |
---|
| 248 | |
---|
| 249 | echo "Usage : benchmark.sh COMMAND" |
---|
[994] | 250 | echo "Available commands : create_220km create_110km create_70km create_35km create_8km submit clean stats" |
---|
[702] | 251 | echo "Your command : $1" |
---|
| 252 | |
---|
| 253 | cmd_$1 |
---|