quda-ref/v0.7.0/face__quda_8h_source.html

 #ifndef _FACE_QUDA_H

 #define _FACE_QUDA_H


 #include <map>

 #include <quda_internal.h>

 #include <color_spinor_field.h>

 #include <comm_quda.h>


 namespace quda {

   class FaceBuffer {


   private:


     // We cache pinned memory allocations so that Dirac objects can be created and

     // destroyed at will with minimal overhead.

     static std::multimap<size_t, void *> pinnedCache;


     // For convenience, we keep track of the sizes of active allocations (i.e., those not in the cache).

     static std::map<void *, size_t> pinnedSize;


     // set these both = 0 `for no overlap of qmp and cudamemcpyasync

     // sendBackIdx = 0, and sendFwdIdx = 1 for overlap

     int sendBackStrmIdx; // = 0;

     int sendFwdStrmIdx; // = 1;

     int recFwdStrmIdx; // = sendBackIdx;

     int recBackStrmIdx; // = sendFwdIdx;


     // CUDA pinned memory

     void *my_face;

     void *my_fwd_face[QUDA_MAX_DIM];

     void *my_back_face[QUDA_MAX_DIM];

     void *from_face;

     void *from_back_face[QUDA_MAX_DIM];

     void *from_fwd_face[QUDA_MAX_DIM];


     // IB pinned memory

     void* ib_my_fwd_face[QUDA_MAX_DIM];

     void* ib_my_back_face[QUDA_MAX_DIM];

     void* ib_from_back_face[QUDA_MAX_DIM];

     void* ib_from_fwd_face[QUDA_MAX_DIM];


     // Message handles

     MsgHandle* mh_recv_fwd[QUDA_MAX_DIM];

     MsgHandle* mh_recv_back[QUDA_MAX_DIM];

     MsgHandle* mh_send_fwd[QUDA_MAX_DIM];

     MsgHandle* mh_send_back[QUDA_MAX_DIM];


     int Ninternal; // number of internal degrees of freedom (12 for spin projected Wilson, 6 for staggered)

     QudaPrecision precision;


     int Volume;

     int VolumeCB;

     int faceVolume[QUDA_MAX_DIM];

     int faceVolumeCB[QUDA_MAX_DIM];

     int X[QUDA_MAX_DIM];

     int nDim; // the actual number of space-time communications

     int nDimComms; // the number of dimensions in which we communicate

     int nFace;

     size_t nbytes[QUDA_MAX_DIM];


     void setupDims(const int *X, int Ls);


     void *allocatePinned(size_t nbytes);

     void freePinned(void *ptr);


   public:

     FaceBuffer(const int *X, const int nDim, const int Ninternal,

                const int nFace, const QudaPrecision precision, const int Ls = 1);

     FaceBuffer(const FaceBuffer &);

     virtual ~FaceBuffer();


     void pack(quda::cudaColorSpinorField &in, quda::FullClover &clov, quda::FullClover &clovInv,

               int dim, int dir, int parity, int dagger, cudaStream_t *stream,

               bool zeroCopyPack=false, double a=0);


     void pack(quda::cudaColorSpinorField &in, quda::FullClover &clov, quda::FullClover &clovInv, int dir, int parity, int dagger,

               cudaStream_t *stream, bool zeroCopyPack=false, double a=0);


     void pack(quda::cudaColorSpinorField &in, quda::FullClover &clov, quda::FullClover &clovInv, int parity, int dagger,

               cudaStream_t *stream, bool zeroCopyPack=false, double a=0);


     void pack(quda::cudaColorSpinorField &in, int dim, int dir, int parity, int dagger,

               cudaStream_t *stream, bool zeroCopyPack=false, double a=0, double b=0);


     void pack(quda::cudaColorSpinorField &in, int dir, int parity, int dagger,

               cudaStream_t *stream, bool zeroCopyPack=false, double a=0, double b=0);


     void pack(quda::cudaColorSpinorField &in, int parity, int dagger,

               cudaStream_t *stream, bool zeroCopyPack=false, double a=0, double b=0);


     void gather(quda::cudaColorSpinorField &in, int dagger, int dir, int streamIdx);


     void gather(quda::cudaColorSpinorField &in, int dagger, int dir);


     void sendStart(int dir);

     void recvStart(int dir);

     void commsStart(int dir);

     int  commsQuery(int dir);

     void scatter(quda::cudaColorSpinorField &out, int dagger, int dir);


     void scatter(quda::cudaColorSpinorField &out, int dagger, int dir, int streamIdx);


     void exchangeCpuSpinor(quda::cpuColorSpinorField &in, int parity, int dagger);


     void exchangeLink(void** ghost_link, void** link_sendbuf, QudaFieldLocation location);


     static void flushPinnedCache();

   };

 }


 void reduceMaxDouble(double &);

 void reduceDouble(double &);

 void reduceDoubleArray(double *, const int len);

 int commDim(int);

 int commCoords(int);

 int commDimPartitioned(int dir);

 void commDimPartitionedSet(int dir);


 #ifdef __cplusplus

   extern "C" {

 #endif


     // implemented in face_gauge.cpp


     void exchange_cpu_sitelink(int* X,void** sitelink, void** ghost_sitelink,

                                void** ghost_sitelink_diag,

                                QudaPrecision gPrecision, QudaGaugeParam* param, int optflag);

     void exchange_cpu_sitelink_ex(int* X, int *R, void** sitelink, QudaGaugeFieldOrder cpu_order,

                                   QudaPrecision gPrecision, int optflag, int geometry);

     void exchange_gpu_staple_start(int* X, void* _cudaStaple, int dir, int whichway,  cudaStream_t * stream);

     void exchange_gpu_staple_comms(int* X, void* _cudaStaple, int dir, int whichway, cudaStream_t * stream);

     void exchange_gpu_staple_wait(int* X, void* _cudaStaple, int dir, int whichway, cudaStream_t * stream);

     void exchange_gpu_staple(int* X, void* _cudaStaple, cudaStream_t * stream);

     void exchange_gpu_staple(int* X, void* _cudaStaple, cudaStream_t * stream);

     void exchange_cpu_staple(int* X, void* staple, void** ghost_staple,

                              QudaPrecision gPrecision);

     void exchange_llfat_init(QudaPrecision prec);

     void exchange_llfat_cleanup(void);


     extern bool globalReduce;


 #ifdef __cplusplus

   }

 #endif


 #endif // _FACE_QUDA_H

commDim
int commDim(int)
Definition: face_buffer.cpp:535

reduceMaxDouble
void reduceMaxDouble(double &)
Definition: face_buffer.cpp:528

exchange_llfat_cleanup
void exchange_llfat_cleanup(void)

quda::FaceBuffer::pack
void pack(quda::cudaColorSpinorField &in, quda::FullClover &clov, quda::FullClover &clovInv, int dim, int dir, int parity, int dagger, cudaStream_t *stream, bool zeroCopyPack=false, double a=0)

QudaPrecision
enum QudaPrecision_s QudaPrecision

commDimPartitioned
int commDimPartitioned(int dir)
Definition: face_buffer.cpp:539

color_spinor_field.h

exchange_cpu_staple
void exchange_cpu_staple(int *X, void *staple, void **ghost_staple, QudaPrecision gPrecision)

quda::stream
cudaStream_t * stream
Definition: cuda_color_spinor_field.cu:816

quda::FaceBuffer::commsQuery
int commsQuery(int dir)
Definition: face_buffer.cpp:364

quda::cudaColorSpinorField
Definition: color_spinor_field.h:302

quda::FaceBuffer::sendStart
void sendStart(int dir)
Definition: face_buffer.cpp:343

commDimPartitionedSet
void commDimPartitionedSet(int dir)
Definition: face_buffer.cpp:541

dagger
QudaDagType dagger
Definition: test_util.cpp:1558

exchange_gpu_staple
void exchange_gpu_staple(int *X, void *_cudaStaple, cudaStream_t *stream)

quda::FaceBuffer
Definition: face_quda.h:10

Ls
int Ls
Definition: test_util.cpp:40

param
QudaGaugeParam param
Definition: pack_test.cpp:17

comm_quda.h

exchange_llfat_init
void exchange_llfat_init(QudaPrecision prec)

quda::FaceBuffer::exchangeLink
void exchangeLink(void **ghost_link, void **link_sendbuf, QudaFieldLocation location)
Definition: face_buffer.cpp:462

exchange_cpu_sitelink_ex
void exchange_cpu_sitelink_ex(int *X, int *R, void **sitelink, QudaGaugeFieldOrder cpu_order, QudaPrecision gPrecision, int optflag, int geometry)

exchange_gpu_staple_start
void exchange_gpu_staple_start(int *X, void *_cudaStaple, int dir, int whichway, cudaStream_t *stream)

quda::FaceBuffer::gather
void gather(quda::cudaColorSpinorField &in, int dagger, int dir, int streamIdx)
Definition: face_buffer.cpp:222

location
const QudaFieldLocation location
Definition: pack_test.cpp:46

quda::FaceBuffer::scatter
void scatter(quda::cudaColorSpinorField &out, int dagger, int dir)
Definition: face_buffer.cpp:401

QudaGaugeParam_s
Definition: quda.h:25

quda::FaceBuffer::flushPinnedCache
static void flushPinnedCache()
Definition: face_buffer.cpp:196

in
cpuColorSpinorField * in
Definition: staggered_invert_test.cpp:50

reduceDoubleArray
void reduceDoubleArray(double *, const int len)
Definition: face_buffer.cpp:532

quda::FaceBuffer::exchangeCpuSpinor
void exchangeCpuSpinor(quda::cpuColorSpinorField &in, int parity, int dagger)
Definition: face_buffer.cpp:407

dim
int dim
Definition: tm_ndeg_fused_exterior_dslash_core.h:195

quda::FaceBuffer::FaceBuffer
FaceBuffer(const int *X, const int nDim, const int Ninternal, const int nFace, const QudaPrecision precision, const int Ls=1)
Definition: face_buffer.cpp:14

QudaGaugeFieldOrder
enum QudaGaugeFieldOrder_s QudaGaugeFieldOrder

commCoords
int commCoords(int)
Definition: face_buffer.cpp:537

X
int X
Definition: asym_wilson_clover_dslash_dagger_fermi_core.h:394

exchange_gpu_staple_wait
void exchange_gpu_staple_wait(int *X, void *_cudaStaple, int dir, int whichway, cudaStream_t *stream)

QudaFieldLocation
enum QudaFieldLocation_s QudaFieldLocation

out
cpuColorSpinorField * out
Definition: staggered_invert_test.cpp:51

exchange_gpu_staple_comms
void exchange_gpu_staple_comms(int *X, void *_cudaStaple, int dir, int whichway, cudaStream_t *stream)

reduceDouble
void reduceDouble(double &)
Definition: face_buffer.cpp:530

quda::FaceBuffer::~FaceBuffer
virtual ~FaceBuffer()
Definition: face_buffer.cpp:86

quda::FaceBuffer::recvStart
void recvStart(int dir)
Definition: face_buffer.cpp:331

QUDA_MAX_DIM
#define QUDA_MAX_DIM
Maximum number of dimensions supported by QUDA. In practice, no routines make use of more than 5...
Definition: quda_constants.h:17

quda::FaceBuffer::commsStart
void commsStart(int dir)
Definition: face_buffer.cpp:309

quda::FullClover
Definition: clover_field.h:151

prec
QudaPrecision prec
Definition: test_util.cpp:1551

exchange_cpu_sitelink
void exchange_cpu_sitelink(int *X, void **sitelink, void **ghost_sitelink, void **ghost_sitelink_diag, QudaPrecision gPrecision, QudaGaugeParam *param, int optflag)

globalReduce
bool globalReduce
Definition: face_buffer.cpp:11

parity
const QudaParity parity
Definition: dslash_test.cpp:29

MsgHandle_s
Definition: comm_mpi.cpp:21

quda::cpuColorSpinorField
Definition: color_spinor_field.h:517

quda_internal.h