source: XIOS/dev/dev_ym/XIOS_COUPLING/src/buffer_client.cpp @ 2298

Last change on this file since 2298 was 2298, checked in by ymipsl, 2 years ago

Fix dead-lock in attached mode
YM

  • Property copyright set to
    Software name : XIOS (Xml I/O Server)
    http://forge.ipsl.jussieu.fr/ioserver
    Creation date : January 2009
    Licence : CeCCIL version2
    see license file in root directory : Licence_CeCILL_V2-en.txt
    or http://www.cecill.info/licences/Licence_CeCILL_V2-en.html
    Holder : CEA/LSCE (Laboratoire des Sciences du CLimat et de l'Environnement)
    CNRS/IPSL (Institut Pierre Simon Laplace)
    Project Manager : Yann Meurdesoif
    yann.meurdesoif@cea.fr
  • Property svn:eol-style set to native
File size: 12.9 KB
RevLine 
[591]1#include "xios_spl.hpp"
[300]2#include "exception.hpp"
[380]3#include "log.hpp"
[300]4#include "buffer_out.hpp"
5#include "buffer_client.hpp"
[317]6#include "cxios.hpp"
[382]7#include "mpi.hpp"
[347]8#include "tracer.hpp"
[2130]9#include "timeline_events.hpp"
[2246]10#include "timer.hpp"
[300]11
[335]12namespace xios
[300]13{
[732]14  size_t CClientBuffer::maxRequestSize = 0;
[509]15
[2259]16  CClientBuffer::CClientBuffer(MPI_Comm interComm, int serverRank, StdSize bufferSize, StdSize estimatedMaxEventSize)
[917]17    : interComm(interComm)
[2258]18    , clientRank_(0)
[917]19    , serverRank(serverRank)
20    , bufferSize(bufferSize)
[1201]21    , estimatedMaxEventSize(estimatedMaxEventSize)
22    , maxEventSize(0)
[917]23    , current(0)
24    , count(0)
25    , pending(false)
[1757]26    , hasWindows(false) 
[300]27  {
[2259]28     /*
29      if (windows[0]==MPI_WIN_NULL && windows[1]==MPI_WIN_NULL) hasWindows=false ;
30      else hasWindows=true ;
31     */
[1757]32
[2246]33      MPI_Alloc_mem(bufferSize+headerSize_, MPI_INFO_NULL, &bufferHeader[0]) ;
34      MPI_Alloc_mem(bufferSize+headerSize_, MPI_INFO_NULL, &bufferHeader[1]) ;
35      buffer[0] = bufferHeader[0]+headerSize_ ;
36      buffer[1] = bufferHeader[1]+headerSize_ ;
37      firstTimeLine[0]=(size_t*)bufferHeader[0] + timeLineOffset_ ;
38      firstTimeLine[1]=(size_t*)bufferHeader[1] + timeLineOffset_ ;
39      bufferCount[0]=(size_t*)bufferHeader[0] + countOffset_ ;
40      bufferCount[1]=(size_t*)bufferHeader[1] + countOffset_ ;
41      control[0]=(size_t*)bufferHeader[0] + controlOffset_ ;
42      control[1]=(size_t*)bufferHeader[1] + controlOffset_ ;
43      notify[0]=(size_t*)bufferHeader[0] + notifyOffset_ ;
44      notify[1]=(size_t*)bufferHeader[1] + notifyOffset_ ;
[1757]45
46      *firstTimeLine[0]=0 ;
47      *firstTimeLine[1]=0 ;
48      *bufferCount[0]=0 ;
49      *bufferCount[1]=0 ;
50      *control[0]=0 ;
51      *control[1]=0 ;
[2246]52      *notify[0]=notifyNothing_ ;
53      *notify[1]=notifyNothing_ ;
[1757]54      winState[0]=false ;
55      winState[1]=false ;
56
57
58    if (hasWindows)
59    { 
60   
[2246]61      MPI_Aint buffSize=bufferSize+headerSize_ ;
[2221]62      MPI_Win_attach(windows_[0], bufferHeader[0], buffSize) ;
63      MPI_Win_attach(windows_[1], bufferHeader[1], buffSize) ;
[1757]64   
65      MPI_Group group ;
66      int groupSize,groupRank ;
67      MPI_Win_get_group(windows_[0], &group) ;
68      MPI_Group_size(group, &groupSize) ;
69      MPI_Group_rank(group, &groupRank) ;
70      if (groupRank!=clientRank_) ERROR("CClientBuffer::CClientBuffer",<< " ClientRank != groupRank "<<clientRank_<<" "<<groupRank);
71
72      MPI_Win_get_group(windows_[1], &group) ;
73      MPI_Group_size(group, &groupSize) ;
74      MPI_Group_rank(group, &groupRank) ;
75      if (groupRank!=clientRank_) ERROR("CClientBuffer::CClientBuffer",<< " ClientRank != groupRank "<<clientRank_<<" "<<groupRank);
76
77      MPI_Win_lock(MPI_LOCK_EXCLUSIVE, clientRank_, 0, windows_[0]) ;
78      MPI_Win_lock(MPI_LOCK_EXCLUSIVE, clientRank_, 0, windows_[1]) ;
79
80      MPI_Win_unlock(clientRank_, windows_[1]) ;
81      MPI_Win_unlock(clientRank_, windows_[0]) ;
82    } 
[732]83    retBuffer = new CBufferOut(buffer[current], bufferSize);
[1757]84    info(10) << "CClientBuffer: allocated 2 x " << bufferSize << " bytes for server " << serverRank << endl;
[300]85  }
[509]86
[1757]87  MPI_Aint CClientBuffer::getWinAddress(int i)
88  {
[2259]89    MPI_Aint address ;
90    MPI_Get_address(bufferHeader[i], &address) ;
91    return address ;
92  }
[1757]93
[2259]94  void CClientBuffer::attachWindows(vector<MPI_Win>& windows)
95  {
96    windows_=windows ;
97    if (windows_[0]==MPI_WIN_NULL && windows_[1]==MPI_WIN_NULL) hasWindows=false ;
98    else hasWindows=true ;
99
100    if (hasWindows)
101    { 
102      MPI_Aint buffSize=bufferSize+headerSize_ ;
103      MPI_Win_attach(windows_[0], bufferHeader[0], buffSize) ;
104      MPI_Win_attach(windows_[1], bufferHeader[1], buffSize) ;
105   
106      MPI_Group group ;
107      int groupSize,groupRank ;
108      MPI_Win_get_group(windows_[0], &group) ;
109      MPI_Group_size(group, &groupSize) ;
110      MPI_Group_rank(group, &groupRank) ;
111      if (groupRank!=clientRank_) ERROR("CClientBuffer::CClientBuffer",<< " ClientRank != groupRank "<<clientRank_<<" "<<groupRank);
112
113      MPI_Win_get_group(windows_[1], &group) ;
114      MPI_Group_size(group, &groupSize) ;
115      MPI_Group_rank(group, &groupRank) ;
116      if (groupRank!=clientRank_) ERROR("CClientBuffer::CClientBuffer",<< " ClientRank != groupRank "<<clientRank_<<" "<<groupRank);
117
118      MPI_Win_lock(MPI_LOCK_EXCLUSIVE, clientRank_, 0, windows_[0]) ;
119      MPI_Win_lock(MPI_LOCK_EXCLUSIVE, clientRank_, 0, windows_[1]) ;
120
121      MPI_Win_unlock(clientRank_, windows_[1]) ;
122      MPI_Win_unlock(clientRank_, windows_[0]) ;
123    } 
124
[1757]125  }
126
[2259]127
[300]128  CClientBuffer::~CClientBuffer()
129  {
[1757]130     //freeWindows() ;
131     if (hasWindows)
132     {
133       MPI_Win_detach(windows_[0],bufferHeader[0]);
134       MPI_Win_detach(windows_[1],bufferHeader[1]);
135       MPI_Free_mem(bufferHeader[0]) ;
136       MPI_Free_mem(bufferHeader[1]) ;
137     }
138     delete retBuffer;
[300]139  }
[509]140
[1757]141  void CClientBuffer::lockBuffer(void)
142  {
[2246]143    CTimer::get("lock buffer").resume();
[1757]144    if (hasWindows)
145    {
146      MPI_Win_lock(MPI_LOCK_EXCLUSIVE,clientRank_, 0, windows_[current]) ;
147      winState[current]=true ;
148    }
[2246]149    CTimer::get("lock buffer").suspend();
[1757]150  }
151
152  void CClientBuffer::unlockBuffer(void)
153  {
[2246]154    CTimer::get("unlock buffer").resume();
[1757]155    if (hasWindows)
156    {
157      MPI_Win_unlock(clientRank_, windows_[current]) ;
158      winState[current]=false ;
159    }
[2246]160    CTimer::get("unlock buffer").suspend();
[1757]161  }
162
[1227]163  StdSize CClientBuffer::remain(void)
[300]164  {
[732]165    return bufferSize - count;
[300]166  }
[509]167
[1227]168  bool CClientBuffer::isBufferFree(StdSize size)
[300]169  {
[1757]170 
171    lockBuffer();
[2130]172    count=*bufferCount[current] ;
173   
174    if (resizingBufferStep_ > 0 ) return false ;
175
[732]176    if (size > bufferSize)
[2130]177    {
178      resizingBufferStep_=1 ;
[2246]179      *firstTimeLine[current]=0 ;
[2130]180      newBufferSize_=size ;
181      return false ;
182    }
[509]183
[1201]184    if (size > maxEventSize)
185    {
186      maxEventSize = size;
187
188      if (size > estimatedMaxEventSize)
189        error(0) << "WARNING: Unexpected event of size " << size << " for server " << serverRank
190                 << " (estimated max event size = " << estimatedMaxEventSize << ")" << std::endl;
191
192      if (size > maxRequestSize) maxRequestSize = size;
193    }
[2130]194   
195    if (size > remain())
196    {
197      if (isGrowableBuffer_)
198      {
199        resizingBufferStep_ = 1 ;
[2246]200        *firstTimeLine[current]=0 ;
[2130]201        newBufferSize_ = (count+size)*growFactor_ ;
202      } 
203      return false ;
204    }
205    else return true ;
[300]206  }
[509]207
208
[1757]209  CBufferOut* CClientBuffer::getBuffer(size_t timeLine, StdSize size)
[300]210  {
[732]211    if (size <= remain())
[300]212    {
[732]213      retBuffer->realloc(buffer[current] + count, size);
214      count += size;
[1757]215      if (*firstTimeLine[current]==0) *firstTimeLine[current]=timeLine ;
216      *bufferCount[current]=count ;
[732]217      return retBuffer;
[300]218    }
219    else
220    {
[1227]221      ERROR("CBufferOut* CClientBuffer::getBuffer(StdSize size)",
[732]222            << "Not enough space in buffer, this should not have happened...");
223      return NULL;
[300]224    }
[509]225  }
226
[1757]227  void CClientBuffer::infoBuffer(void)
[300]228  {
[1757]229     
230      char checksum=0 ;
231      for(size_t i=0;i<*bufferCount[current];i++) checksum=checksum+buffer[current][i] ;
232 
233      char checksumFirst=0 ;
234      for(size_t i=5; i<10 && i<*bufferCount[current] ;i++) checksumFirst=checksumFirst+buffer[current][i] ;
235 
236      char checksumLast=0 ;
237      for(size_t i=(*bufferCount[current]<10)?0:*bufferCount[current]-10; i<*bufferCount[current] ; i++) checksumLast=checksumLast+buffer[current][i] ;
238 
239      info(45)<<"CClientBuffer::infoBuffer "<<" clientRank_ "<<clientRank_<<" serverRank "<<serverRank <<" current "<<current<<" WinState "<<winState[current]
240              <<" firstTimeLine "<<*firstTimeLine[current]<<" count "<<*bufferCount[current]<<" checksum "<<(int)checksum<<" "
241              <<(int)buffer[current][0]<<" "<<(int)buffer[current][1]<<" "<<(int)buffer[current][2]<<" "<<(int)buffer[current][3]<<" "<<(int)buffer[current][4]<<" "<<(int)buffer[current][5]<<" "
242              <<(int)buffer[current][6]<<" "<<(int)buffer[current][7]<<" "<<(int)buffer[current][8]<<" "<<(int)buffer[current][9]<<" "<<(int)buffer[current][10]<<" "<<(int)buffer[current][11]<<endl ;
243
244  }
245
246  bool CClientBuffer::checkBuffer(bool send)
247  {
[1639]248    MPI_Status status;
[732]249    int flag;
[2260]250    MPI_Iprobe(MPI_ANY_SOURCE, MPI_ANY_TAG, MPI_COMM_WORLD, &flag, MPI_STATUS_IGNORE);
251 
[300]252    if (pending)
253    {
[732]254      traceOff();
[1639]255      MPI_Test(&request, &flag, &status);
[732]256      traceOn();
257      if (flag == true) pending = false;
[300]258    }
259
260    if (!pending)
261    {
[2130]262      if (!send && resizingBufferStep_==0 ) return false ;
263
[732]264      if (count > 0)
[300]265      {
[2246]266        double time=MPI_Wtime() ;
267        if (time - lastCheckedWithNothing_ > latency_)
[1757]268        {
[2246]269          lockBuffer() ;
270          if (*bufferCount[current] > 0)
271          {
272            MPI_Issend(buffer[current], count, MPI_CHAR, serverRank, 20, interComm, &request);
273            if (resizingBufferStep_==4) resizingBufferStep_=0 ;
274            pending = true;
275            *firstTimeLine[current]=0 ;
276            *bufferCount[current]=0 ;
[1757]277
[2246]278             unlockBuffer() ;
[1757]279
[2246]280            if (current == 1) current = 0;
281            else current = 1;
282            count = 0;
283          }
284          else 
285          {
286            unlockBuffer() ;
287            lastCheckedWithNothing_ = time ;
288          }
[1757]289        }
[300]290      }
[2130]291      else
292      {
293        if (resizingBufferStep_==1) resizeBufferNotify() ;
[2246]294        else if (resizingBufferStep_==2) isNotifiedChangeBufferSize() ;
295        else if (resizingBufferStep_==3) resizeBuffer(newBufferSize_) ;
[2130]296      }
[300]297    }
[732]298
299    return pending;
[300]300  }
[509]301
[2130]302  void CClientBuffer::resizeBufferNotify(void)
303  {
304    // notify server of changing buffers size
305    lockBuffer() ;
306    int size=sizeof(int)+sizeof(size_t) ;
307    CBufferOut* bufOut = this->getBuffer(timelineEventNotifyChangeBufferSize, size);
308    bufOut->put(size);
309    bufOut->put(timelineEventNotifyChangeBufferSize);
310    resizingBufferStep_ = 2 ;
311    unlockBuffer() ;
312  }
313
314  void CClientBuffer::resizeBuffer(size_t newSize)
315  {
[2246]316
[2130]317    if (hasWindows)
318    { 
319      MPI_Win_detach(windows_[0], bufferHeader[0]) ;
320      MPI_Win_detach(windows_[1], bufferHeader[1]) ;
321    }
322    MPI_Free_mem(bufferHeader[0]) ;
323    MPI_Free_mem(bufferHeader[1]) ;
324
325    bufferSize=newSize ;
[2246]326    MPI_Alloc_mem(bufferSize+headerSize_, MPI_INFO_NULL, &bufferHeader[0]) ;
327    MPI_Alloc_mem(bufferSize+headerSize_, MPI_INFO_NULL, &bufferHeader[1]) ;
328    buffer[0] = bufferHeader[0]+headerSize_ ;
329    buffer[1] = bufferHeader[1]+headerSize_ ;
330    firstTimeLine[0]=(size_t*)bufferHeader[0] + timeLineOffset_;
331    firstTimeLine[1]=(size_t*)bufferHeader[1] + timeLineOffset_;
332    bufferCount[0]=(size_t*)bufferHeader[0] + countOffset_ ;
333    bufferCount[1]=(size_t*)bufferHeader[1] + countOffset_ ;
334    control[0]=(size_t*)bufferHeader[0] + controlOffset_ ;  // control=0 => nothing ; control=1 => changeBufferSize
335    control[1]=(size_t*)bufferHeader[1] + controlOffset_ ;
336    notify[0]=(size_t*)bufferHeader[0] + notifyOffset_ ;
337    notify[1]=(size_t*)bufferHeader[1] + notifyOffset_ ;
[2130]338
339    *firstTimeLine[0]=0 ;
340    *firstTimeLine[1]=0 ;
341    *bufferCount[0]=0 ;
342    *bufferCount[1]=0 ;
343    *control[0]=0 ;
344    *control[1]=0 ;
[2246]345    *notify[0] = notifyNothing_ ;
346    *notify[1] = notifyNothing_ ;
[2130]347    winState[0]=false ;
348    winState[1]=false ;
349    current=0 ;
350   
351    if (hasWindows)
352    { 
353   
[2246]354      MPI_Win_attach(windows_[0], bufferHeader[0], bufferSize+headerSize_) ;
355      MPI_Win_attach(windows_[1], bufferHeader[1], bufferSize+headerSize_) ;
[2130]356         
357      MPI_Win_lock(MPI_LOCK_EXCLUSIVE, clientRank_, 0, windows_[0]) ;
358      MPI_Win_lock(MPI_LOCK_EXCLUSIVE, clientRank_, 0, windows_[1]) ;
359
360      MPI_Win_unlock(clientRank_, windows_[1]) ;
361      MPI_Win_unlock(clientRank_, windows_[0]) ;
362    } 
363
364    lockBuffer() ;
365 
[2221]366    int size=sizeof(int)+2*sizeof(size_t)+2*sizeof(MPI_Aint) ;
[2130]367    CBufferOut* bufOut = this->getBuffer(timelineEventChangeBufferSize, size);
368    bufOut->put(size);
369    bufOut->put(timelineEventChangeBufferSize);
370    bufOut->put(newBufferSize_);
371    bufOut->put(this->getWinAddress(0));
372    bufOut->put(this->getWinAddress(1));
373
[2246]374    resizingBufferStep_=4;
[2130]375    unlockBuffer() ;
[2246]376    info(100)<<"CClientBuffer::resizeBuffer(size_t newSize) : resizing buffer of server "<<serverRank<<" ; new size : "<<newSize<<" ; winAdress[0] "<<this->getWinAddress(0)<<" winAdress[1] "<<this->getWinAddress(1)<<endl;
[2130]377  }
378
[300]379  bool CClientBuffer::hasPendingRequest(void)
380  {
[1757]381   
382    lockBuffer() ;
383    count=*bufferCount[current] ;
384    unlockBuffer() ;
385
[732]386    return (pending || count > 0);
[300]387  }
[1757]388
[2246]389  bool CClientBuffer::isNotifiedChangeBufferSize(void)
390  {
391   
392    bool ret ;
393    lockBuffer() ;
394    ret=*notify[current] == notifyResizeBuffer_ ? true : false ;
[2298]395    if (ret || !hasWindows) 
[2246]396    {
397      *notify[current] = notifyNothing_ ;
398      resizingBufferStep_=3; 
399    }
400    unlockBuffer() ;
401
402    return ret;
403  }
404
[1757]405  bool CClientBuffer::isNotifiedFinalized(void)
406  {
[2258]407    if (!isFinalized_)
408    {
409      double time=MPI_Wtime() ;
410//      if (time - lastCheckedNotify_ > latency_)
411      {
412        int flag ;
413        MPI_Iprobe(MPI_ANY_SOURCE, MPI_ANY_TAG, MPI_COMM_WORLD, &flag, MPI_STATUS_IGNORE);
414        lockBuffer() ;
415        isFinalized_=*notify[current] == notifyFinalize_ ? true : false ;
416        unlockBuffer() ;
417        lastCheckedNotify_=time ;
418      }
419    }
420    return isFinalized_ ;
[1757]421  }
422
[509]423}
Note: See TracBrowser for help on using the repository browser.