quda-ref/v1.1.0/lattice__field_8h_source.html

 #pragma once


 #include <map>

 #include <quda.h>

 #include <iostream>

 #include <comm_quda.h>

 #include <util_quda.h>

 #include <object.h>

 #include <quda_api.h>


 namespace quda {


   // LatticeField is an abstract base clase for all Field objects.


   // Forward declaration of all children

   class LatticeField;


   class ColorSpinorField;

   class cudaColorSpinorField;

   class cpuColorSpinorField;


   class EigValueSet;

   class cudaEigValueSet;

   class cpuEigValueSet;


   class EigVecSet;

   class cpuEigVecSet;

   class cudaEigVecSet;


   class GaugeField;

   class cpuGaugeField;

   class cudaGaugeField;


   class CloverField;

   class cudaCloverField;

   class cpuCloverField;


   enum class QudaOffsetCopyMode { COLLECT, DISPERSE };


   struct LatticeFieldParam {


   protected:

     QudaPrecision precision;


     QudaPrecision ghost_precision;


   public:

     QudaPrecision Precision() const { return precision; }


     QudaPrecision GhostPrecision() const { return ghost_precision; }


     int nDim;


     int x[QUDA_MAX_DIM];


     int pad;


     QudaSiteSubset siteSubset;


     QudaMemoryType mem_type;


     QudaGhostExchange ghostExchange;


     int r[QUDA_MAX_DIM];


     double scale;


     LatticeFieldParam()

     : precision(QUDA_INVALID_PRECISION), ghost_precision(QUDA_INVALID_PRECISION), nDim(4), pad(0),

       siteSubset(QUDA_INVALID_SITE_SUBSET), mem_type(QUDA_MEMORY_DEVICE),

       ghostExchange(QUDA_GHOST_EXCHANGE_PAD), scale(1.0)

     {

       for (int i=0; i<nDim; i++) {

         x[i] = 0;

         r[i] = 0;

       }

     }


     LatticeFieldParam(int nDim, const int *x, int pad, QudaPrecision precision,

                       QudaGhostExchange ghostExchange=QUDA_GHOST_EXCHANGE_PAD)

     : precision(precision), ghost_precision(precision), nDim(nDim), pad(pad),

       siteSubset(QUDA_FULL_SITE_SUBSET), mem_type(QUDA_MEMORY_DEVICE),

       ghostExchange(ghostExchange), scale(1.0)

     {

       if (nDim > QUDA_MAX_DIM) errorQuda("Number of dimensions too great");

       for (int i=0; i<nDim; i++) {

         this->x[i] = x[i];

         this->r[i] = 0;

       }

     }


     LatticeFieldParam(const QudaGaugeParam &param)

     :  precision(param.cpu_prec), ghost_precision(param.cpu_prec), nDim(4), pad(0),

       siteSubset(QUDA_FULL_SITE_SUBSET), mem_type(QUDA_MEMORY_DEVICE),

       ghostExchange(QUDA_GHOST_EXCHANGE_NO), scale(param.scale)

     {

       for (int i=0; i<nDim; i++) {

         this->x[i] = param.X[i];

         this->r[i] = 0;

       }

     }


     LatticeFieldParam(const LatticeField &field);

   };


   std::ostream& operator<<(std::ostream& output, const LatticeFieldParam& param);


   class LatticeField : public Object {


   protected:

     size_t volume;


     size_t volumeCB;


     size_t localVolume;


     size_t localVolumeCB;


     size_t stride;

     int pad;


     size_t total_bytes;


     int nDim;


     int x[QUDA_MAX_DIM];


     int surface[QUDA_MAX_DIM];

     int surfaceCB[QUDA_MAX_DIM];


     int r[QUDA_MAX_DIM];


     QudaPrecision precision;


     mutable QudaPrecision ghost_precision;


     mutable bool ghost_precision_reset;


     double scale;


     QudaSiteSubset siteSubset;


     QudaGhostExchange ghostExchange;


     // The below are additions for inter-GPU communication (merging FaceBuffer functionality)


     int nDimComms;


     /*

        The need for persistent message handlers (for GPUDirect support)

        means that we allocate different message handlers for each number of

        faces we can send.

     */


     static void *ghost_send_buffer_d[2];


     static void *ghost_recv_buffer_d[2];


     static void *ghost_pinned_send_buffer_h[2];


     static void *ghost_pinned_recv_buffer_h[2];


     static void *ghost_pinned_send_buffer_hd[2];


     static void *ghost_pinned_recv_buffer_hd[2];


     static void *ghost_remote_send_buffer_d[2][QUDA_MAX_DIM][2];


     static size_t ghostFaceBytes;


     static bool initGhostFaceBuffer;


     mutable size_t ghost_bytes;


     mutable size_t ghost_bytes_old;


     mutable size_t ghost_face_bytes[QUDA_MAX_DIM];


     mutable size_t ghost_face_bytes_aligned[QUDA_MAX_DIM];


     mutable size_t ghost_offset[QUDA_MAX_DIM][2];


     void *my_face_h[2];


     void *my_face_hd[2];


     void *my_face_d[2];


     void *my_face_dim_dir_h[2][QUDA_MAX_DIM][2];


     void *my_face_dim_dir_hd[2][QUDA_MAX_DIM][2];


     void *my_face_dim_dir_d[2][QUDA_MAX_DIM][2];


     void *from_face_h[2];


     void *from_face_hd[2];


     void *from_face_d[2];


     void *from_face_dim_dir_h[2][QUDA_MAX_DIM][2];


     void *from_face_dim_dir_hd[2][QUDA_MAX_DIM][2];


     void *from_face_dim_dir_d[2][QUDA_MAX_DIM][2];


     MsgHandle *mh_recv_fwd[2][QUDA_MAX_DIM];


     MsgHandle *mh_recv_back[2][QUDA_MAX_DIM];


     MsgHandle *mh_send_fwd[2][QUDA_MAX_DIM];


     MsgHandle *mh_send_back[2][QUDA_MAX_DIM];


     MsgHandle *mh_recv_rdma_fwd[2][QUDA_MAX_DIM];


     MsgHandle *mh_recv_rdma_back[2][QUDA_MAX_DIM];


     MsgHandle *mh_send_rdma_fwd[2][QUDA_MAX_DIM];


     MsgHandle *mh_send_rdma_back[2][QUDA_MAX_DIM];


     static MsgHandle *mh_send_p2p_fwd[2][QUDA_MAX_DIM];


     static MsgHandle *mh_send_p2p_back[2][QUDA_MAX_DIM];


     static MsgHandle *mh_recv_p2p_fwd[2][QUDA_MAX_DIM];


     static MsgHandle *mh_recv_p2p_back[2][QUDA_MAX_DIM];


     static int buffer_send_p2p_fwd[2][QUDA_MAX_DIM];


     static int buffer_recv_p2p_fwd[2][QUDA_MAX_DIM];


     static int buffer_send_p2p_back[2][QUDA_MAX_DIM];


     static int buffer_recv_p2p_back[2][QUDA_MAX_DIM];


     static cudaEvent_t ipcCopyEvent[2][2][QUDA_MAX_DIM];


     static cudaEvent_t ipcRemoteCopyEvent[2][2][QUDA_MAX_DIM];


     bool initComms;


     static bool initIPCComms;


     char vol_string[TuneKey::volume_n];


     char aux_string[TuneKey::aux_n];


     virtual void setTuningString();


     QudaMemoryType mem_type;


     void precisionCheck()

     {

       switch (precision) {

       case QUDA_QUARTER_PRECISION:

       case QUDA_HALF_PRECISION:

       case QUDA_SINGLE_PRECISION:

       case QUDA_DOUBLE_PRECISION: break;

       default: errorQuda("Unknown precision %d\n", precision);

       }

     }


     mutable char *backup_h;

     mutable char *backup_norm_h;

     mutable bool backed_up;


   public:


     LatticeField(const LatticeFieldParam &param);


     LatticeField(const LatticeField &field);


     virtual ~LatticeField();


     void allocateGhostBuffer(size_t ghost_bytes) const;


     static void freeGhostBuffer(void);


     void createComms(bool no_comms_fill=false, bool bidir=true);


     void destroyComms();


     void createIPCComms();


     static void destroyIPCComms();


     inline bool ipcCopyComplete(int dir, int dim);


     inline bool ipcRemoteCopyComplete(int dir, int dim);


     const cudaEvent_t& getIPCCopyEvent(int dir, int dim) const;


     const cudaEvent_t& getIPCRemoteCopyEvent(int dir, int dim) const;


     static int bufferIndex;


     static bool ghost_field_reset;


     int Ndim() const { return nDim; }


     const int* X() const { return x; }


     virtual int full_dim(int d) const = 0;


     size_t Volume() const { return volume; }


     size_t VolumeCB() const { return volumeCB; }


     size_t LocalVolume() const { return localVolume; }


     size_t LocalVolumeCB() const { return localVolumeCB; }


     const int* SurfaceCB() const { return surfaceCB; }


     int SurfaceCB(const int i) const { return surfaceCB[i]; }


     size_t Stride() const { return stride; }


     int Pad() const { return pad; }


     const int* R() const { return r; }


     QudaGhostExchange GhostExchange() const { return ghostExchange; }


     QudaPrecision Precision() const { return precision; }


     QudaPrecision GhostPrecision() const { return ghost_precision; }


     double Scale() const { return scale; }


     void Scale(double scale_) { scale = scale_; }


     virtual QudaSiteSubset SiteSubset() const { return siteSubset; }


     virtual QudaMemoryType MemType() const { return mem_type; }


     int Nvec() const;


     QudaFieldLocation Location() const;


     size_t GBytes() const { return total_bytes / (1<<30); }


     void checkField(const LatticeField &a) const;


     virtual void read(char *filename);


     virtual void write(char *filename);


     void *myFace_h(int dir, int dim) const { return my_face_dim_dir_h[bufferIndex][dim][dir]; }


     void *myFace_hd(int dir, int dim) const { return my_face_dim_dir_hd[bufferIndex][dim][dir]; }


     void *myFace_d(int dir, int dim) const { return my_face_dim_dir_d[bufferIndex][dim][dir]; }


     void *remoteFace_d(int dir, int dim) const { return ghost_remote_send_buffer_d[bufferIndex][dim][dir]; }


     void *remoteFace_r() const { return ghost_recv_buffer_d[bufferIndex]; }


     virtual void gather(int nFace, int dagger, int dir, qudaStream_t *stream_p = NULL) { errorQuda("Not implemented"); }


     virtual void commsStart(int nFace, int dir, int dagger = 0, qudaStream_t *stream_p = NULL, bool gdr_send = false,

                             bool gdr_recv = true)

     { errorQuda("Not implemented"); }


     virtual int commsQuery(int nFace, int dir, int dagger = 0, qudaStream_t *stream_p = NULL, bool gdr_send = false,

                            bool gdr_recv = true)

     { errorQuda("Not implemented"); return 0; }


     virtual void commsWait(int nFace, int dir, int dagger = 0, qudaStream_t *stream_p = NULL, bool gdr_send = false,

                            bool gdr_recv = true)

     { errorQuda("Not implemented"); }


     virtual void scatter(int nFace, int dagger, int dir)

     { errorQuda("Not implemented"); }


     inline const char *VolString() const { return vol_string; }


     inline const char *AuxString() const { return aux_string; }


     virtual void backup() const { errorQuda("Not implemented"); }


     virtual void restore() const { errorQuda("Not implemented"); }


     virtual void prefetch(QudaFieldLocation mem_space, qudaStream_t stream = 0) const { ; }


     virtual bool isNative() const = 0;


     virtual void copy_to_buffer(void *buffer) const = 0;


     virtual void copy_from_buffer(void *buffer) = 0;

   };


   inline QudaFieldLocation Location_(const char *func, const char *file, int line,

                                      const LatticeField &a, const LatticeField &b) {

     QudaFieldLocation location = QUDA_INVALID_FIELD_LOCATION;

     if (a.Location() == b.Location()) location = a.Location();

     else errorQuda("Locations %d %d do not match  (%s:%d in %s())\n",

                    a.Location(), b.Location(), file, line, func);

     return location;

   }


   template <typename... Args>

   inline QudaFieldLocation Location_(const char *func, const char *file, int line,

                                      const LatticeField &a, const LatticeField &b, const Args &... args) {

     return static_cast<QudaFieldLocation>(Location_(func,file,line,a,b) & Location_(func,file,line,a,args...));

   }


 #define checkLocation(...) Location_(__func__, __FILE__, __LINE__, __VA_ARGS__)


   inline QudaPrecision Precision_(const char *func, const char *file, int line,

                                   const LatticeField &a, const LatticeField &b) {

     QudaPrecision precision = QUDA_INVALID_PRECISION;

     if (a.Precision() == b.Precision()) precision = a.Precision();

     else errorQuda("Precisions %d %d do not match (%s:%d in %s())\n",

                    a.Precision(), b.Precision(), file, line, func);

     return precision;

   }


   template <typename... Args>

   inline QudaPrecision Precision_(const char *func, const char *file, int line,

                                   const LatticeField &a, const LatticeField &b,

                                   const Args &... args) {

     return static_cast<QudaPrecision>(Precision_(func,file,line,a,b) & Precision_(func,file,line,a,args...));

   }


 #define checkPrecision(...) Precision_(__func__, __FILE__, __LINE__, __VA_ARGS__)


   inline bool Native_(const char *func, const char *file, int line, const LatticeField &a)

   {

     if (!a.isNative()) errorQuda("Non-native field detected (%s:%d in %s())\n", file, line, func);

     return true;

   }


   template <typename... Args>

   inline bool Native_(const char *func, const char *file, int line, const LatticeField &a, const Args &... args)

   {

     return (Native_(func, file, line, a) & Native_(func, file, line, args...));

   }


 #define checkNative(...) Native_(__func__, __FILE__, __LINE__, __VA_ARGS__)


   QudaFieldLocation reorder_location();


   void reorder_location_set(QudaFieldLocation reorder_location_);


   inline const char *compile_type_str(const LatticeField &meta, QudaFieldLocation location_ = QUDA_INVALID_FIELD_LOCATION)

   {

     QudaFieldLocation location = (location_ == QUDA_INVALID_FIELD_LOCATION ? meta.Location() : location_);

 #ifdef JITIFY

     return location == QUDA_CUDA_FIELD_LOCATION ? "GPU-jitify," : "CPU,";

 #else

     return location == QUDA_CUDA_FIELD_LOCATION ? "GPU-offline," : "CPU,";

 #endif

   }


 } // namespace quda

quda::LatticeField
Definition: lattice_field.h:145

quda::LatticeField::my_face_d
void * my_face_d[2]
Definition: lattice_field.h:289

quda::LatticeField::initComms
bool initComms
Definition: lattice_field.h:379

quda::LatticeField::ghostExchange
QudaGhostExchange ghostExchange
Definition: lattice_field.h:193

quda::LatticeField::stride
size_t stride
Definition: lattice_field.h:160

quda::LatticeField::createIPCComms
void createIPCComms()
Definition: lattice_field.cpp:418

quda::LatticeField::remoteFace_r
void * remoteFace_r() const
Return base pointer to the ghost recv buffer. Since this is a base pointer, one still needs to take c...
Definition: lattice_field.h:673

quda::LatticeField::scatter
virtual void scatter(int nFace, int dagger, int dir)
Definition: lattice_field.h:689

quda::LatticeField::SurfaceCB
int SurfaceCB(const int i) const
Definition: lattice_field.h:542

quda::LatticeField::initGhostFaceBuffer
static bool initGhostFaceBuffer
Definition: lattice_field.h:249

quda::LatticeField::mh_send_fwd
MsgHandle * mh_send_fwd[2][QUDA_MAX_DIM]
Definition: lattice_field.h:331

quda::LatticeField::siteSubset
QudaSiteSubset siteSubset
Definition: lattice_field.h:190

quda::LatticeField::commsStart
virtual void commsStart(int nFace, int dir, int dagger=0, qudaStream_t *stream_p=NULL, bool gdr_send=false, bool gdr_recv=true)
Definition: lattice_field.h:677

quda::LatticeField::backed_up
bool backed_up
Definition: lattice_field.h:409

quda::LatticeField::myFace_h
void * myFace_h(int dir, int dim) const
Return pointer to the local pinned my_face buffer in a given direction and dimension.
Definition: lattice_field.h:636

quda::LatticeField::buffer_recv_p2p_fwd
static int buffer_recv_p2p_fwd[2][QUDA_MAX_DIM]
Definition: lattice_field.h:364

quda::LatticeField::copy_from_buffer
virtual void copy_from_buffer(void *buffer)=0
Copy all contents of the field from a host buffer to this field.

quda::LatticeField::bufferIndex
static int bufferIndex
Definition: lattice_field.h:490

quda::LatticeField::mh_recv_rdma_back
MsgHandle * mh_recv_rdma_back[2][QUDA_MAX_DIM]
Definition: lattice_field.h:340

quda::LatticeField::LocalVolumeCB
size_t LocalVolumeCB() const
Definition: lattice_field.h:530

quda::LatticeField::ghost_precision_reset
bool ghost_precision_reset
Definition: lattice_field.h:184

quda::LatticeField::mh_send_rdma_fwd
MsgHandle * mh_send_rdma_fwd[2][QUDA_MAX_DIM]
Definition: lattice_field.h:343

quda::LatticeField::from_face_dim_dir_d
void * from_face_dim_dir_d[2][QUDA_MAX_DIM][2]
Definition: lattice_field.h:322

quda::LatticeField::AuxString
const char * AuxString() const
Definition: lattice_field.h:696

quda::LatticeField::mh_recv_p2p_back
static MsgHandle * mh_recv_p2p_back[2][QUDA_MAX_DIM]
Definition: lattice_field.h:358

quda::LatticeField::ipcCopyComplete
bool ipcCopyComplete(int dir, int dim)
Definition: lattice_field.cpp:624

quda::LatticeField::backup
virtual void backup() const
Backs up the LatticeField.
Definition: lattice_field.h:699

quda::LatticeField::SiteSubset
virtual QudaSiteSubset SiteSubset() const
Definition: lattice_field.h:588

quda::LatticeField::localVolumeCB
size_t localVolumeCB
Definition: lattice_field.h:158

quda::LatticeField::volume
size_t volume
Definition: lattice_field.h:149

quda::LatticeField::VolString
const char * VolString() const
Definition: lattice_field.h:693

quda::LatticeField::mh_send_rdma_back
MsgHandle * mh_send_rdma_back[2][QUDA_MAX_DIM]
Definition: lattice_field.h:346

quda::LatticeField::nDimComms
int nDimComms
Definition: lattice_field.h:198

quda::LatticeField::ghost_pinned_send_buffer_hd
static void * ghost_pinned_send_buffer_hd[2]
Definition: lattice_field.h:229

quda::LatticeField::x
int x[QUDA_MAX_DIM]
Definition: lattice_field.h:169

quda::LatticeField::my_face_dim_dir_h
void * my_face_dim_dir_h[2][QUDA_MAX_DIM][2]
Definition: lattice_field.h:292

quda::LatticeField::from_face_dim_dir_h
void * from_face_dim_dir_h[2][QUDA_MAX_DIM][2]
Definition: lattice_field.h:316

quda::LatticeField::remoteFace_d
void * remoteFace_d(int dir, int dim) const
Return base pointer to a remote device buffer for direct sending in a given direction and dimension....
Definition: lattice_field.h:665

quda::LatticeField::pad
int pad
Definition: lattice_field.h:161

quda::LatticeField::myFace_d
void * myFace_d(int dir, int dim) const
Return pointer to the device send buffer in a given direction and dimension.
Definition: lattice_field.h:654

quda::LatticeField::mh_send_p2p_fwd
static MsgHandle * mh_send_p2p_fwd[2][QUDA_MAX_DIM]
Definition: lattice_field.h:349

quda::LatticeField::nDim
int nDim
Definition: lattice_field.h:166

quda::LatticeField::Volume
size_t Volume() const
Definition: lattice_field.h:515

quda::LatticeField::mh_recv_p2p_fwd
static MsgHandle * mh_recv_p2p_fwd[2][QUDA_MAX_DIM]
Definition: lattice_field.h:355

quda::LatticeField::ghost_pinned_recv_buffer_h
static void * ghost_pinned_recv_buffer_h[2]
Definition: lattice_field.h:224

quda::LatticeField::GhostPrecision
QudaPrecision GhostPrecision() const
Definition: lattice_field.h:572

quda::LatticeField::from_face_d
void * from_face_d[2]
Definition: lattice_field.h:313

quda::LatticeField::ghost_offset
size_t ghost_offset[QUDA_MAX_DIM][2]
Definition: lattice_field.h:274

quda::LatticeField::Pad
int Pad() const
Definition: lattice_field.h:552

quda::LatticeField::ghost_precision
QudaPrecision ghost_precision
Definition: lattice_field.h:181

quda::LatticeField::Precision
QudaPrecision Precision() const
Definition: lattice_field.h:567

quda::LatticeField::LocalVolume
size_t LocalVolume() const
Definition: lattice_field.h:525

quda::LatticeField::Location
QudaFieldLocation Location() const
Definition: lattice_field.cpp:683

quda::LatticeField::SurfaceCB
const int * SurfaceCB() const
Definition: lattice_field.h:536

quda::LatticeField::precision
QudaPrecision precision
Definition: lattice_field.h:178

quda::LatticeField::myFace_hd
void * myFace_hd(int dir, int dim) const
Return pointer to the local mapped my_face buffer in a given direction and dimension.
Definition: lattice_field.h:645

quda::LatticeField::my_face_dim_dir_d
void * my_face_dim_dir_d[2][QUDA_MAX_DIM][2]
Definition: lattice_field.h:298

quda::LatticeField::destroyIPCComms
static void destroyIPCComms()
Definition: lattice_field.cpp:572

quda::LatticeField::ghost_pinned_recv_buffer_hd
static void * ghost_pinned_recv_buffer_hd[2]
Definition: lattice_field.h:234

quda::LatticeField::Nvec
int Nvec() const
Definition: lattice_field.cpp:707

quda::LatticeField::ghost_face_bytes
size_t ghost_face_bytes[QUDA_MAX_DIM]
Definition: lattice_field.h:264

quda::LatticeField::aux_string
char aux_string[TuneKey::aux_n]
Definition: lattice_field.h:388

quda::LatticeField::ghost_bytes
size_t ghost_bytes
Definition: lattice_field.h:254

quda::LatticeField::commsWait
virtual void commsWait(int nFace, int dir, int dagger=0, qudaStream_t *stream_p=NULL, bool gdr_send=false, bool gdr_recv=true)
Definition: lattice_field.h:685

quda::LatticeField::write
virtual void write(char *filename)
Definition: lattice_field.cpp:703

quda::LatticeField::Scale
void Scale(double scale_)
Set the scale factor for a fixed-point field.
Definition: lattice_field.h:583

quda::LatticeField::~LatticeField
virtual ~LatticeField()
Definition: lattice_field.cpp:226

quda::LatticeField::ghostFaceBytes
static size_t ghostFaceBytes
Definition: lattice_field.h:244

quda::LatticeField::mem_type
QudaMemoryType mem_type
Definition: lattice_field.h:394

quda::LatticeField::isNative
virtual bool isNative() const =0

quda::LatticeField::vol_string
char vol_string[TuneKey::volume_n]
Definition: lattice_field.h:385

quda::LatticeField::GBytes
size_t GBytes() const
Definition: lattice_field.h:609

quda::LatticeField::my_face_h
void * my_face_h[2]
Definition: lattice_field.h:279

quda::LatticeField::volumeCB
size_t volumeCB
Definition: lattice_field.h:152

quda::LatticeField::ghost_pinned_send_buffer_h
static void * ghost_pinned_send_buffer_h[2]
Definition: lattice_field.h:219

quda::LatticeField::ghost_remote_send_buffer_d
static void * ghost_remote_send_buffer_d[2][QUDA_MAX_DIM][2]
Definition: lattice_field.h:239

quda::LatticeField::my_face_hd
void * my_face_hd[2]
Definition: lattice_field.h:284

quda::LatticeField::from_face_dim_dir_hd
void * from_face_dim_dir_hd[2][QUDA_MAX_DIM][2]
Definition: lattice_field.h:319

quda::LatticeField::mh_send_p2p_back
static MsgHandle * mh_send_p2p_back[2][QUDA_MAX_DIM]
Definition: lattice_field.h:352

quda::LatticeField::restore
virtual void restore() const
Restores the LatticeField.
Definition: lattice_field.h:702

quda::LatticeField::VolumeCB
size_t VolumeCB() const
Definition: lattice_field.h:520

quda::LatticeField::buffer_send_p2p_fwd
static int buffer_send_p2p_fwd[2][QUDA_MAX_DIM]
Definition: lattice_field.h:361

quda::LatticeField::setTuningString
virtual void setTuningString()
Definition: lattice_field.cpp:642

quda::LatticeField::ghost_field_reset
static bool ghost_field_reset
Definition: lattice_field.h:495

quda::LatticeField::R
const int * R() const
Definition: lattice_field.h:557

quda::LatticeField::X
const int * X() const
Definition: lattice_field.h:505

quda::LatticeField::surfaceCB
int surfaceCB[QUDA_MAX_DIM]
Definition: lattice_field.h:172

quda::LatticeField::destroyComms
void destroyComms()
Definition: lattice_field.cpp:386

quda::LatticeField::surface
int surface[QUDA_MAX_DIM]
Definition: lattice_field.h:171

quda::LatticeField::prefetch
virtual void prefetch(QudaFieldLocation mem_space, qudaStream_t stream=0) const
If managed memory and prefetch is enabled, prefetch all relevant memory fields to the current device ...
Definition: lattice_field.h:709

quda::LatticeField::buffer_recv_p2p_back
static int buffer_recv_p2p_back[2][QUDA_MAX_DIM]
Definition: lattice_field.h:370

quda::LatticeField::ipcRemoteCopyComplete
bool ipcRemoteCopyComplete(int dir, int dim)
Definition: lattice_field.cpp:629

quda::LatticeField::checkField
void checkField(const LatticeField &a) const
Definition: lattice_field.cpp:653

quda::LatticeField::getIPCCopyEvent
const cudaEvent_t & getIPCCopyEvent(int dir, int dim) const
Definition: lattice_field.cpp:634

quda::LatticeField::ghost_bytes_old
size_t ghost_bytes_old
Definition: lattice_field.h:259

quda::LatticeField::initIPCComms
static bool initIPCComms
Definition: lattice_field.h:382

quda::LatticeField::backup_norm_h
char * backup_norm_h
Definition: lattice_field.h:408

quda::LatticeField::r
int r[QUDA_MAX_DIM]
Definition: lattice_field.h:175

quda::LatticeField::gather
virtual void gather(int nFace, int dagger, int dir, qudaStream_t *stream_p=NULL)
Definition: lattice_field.h:675

quda::LatticeField::Stride
size_t Stride() const
Definition: lattice_field.h:547

quda::LatticeField::full_dim
virtual int full_dim(int d) const =0

quda::LatticeField::mh_send_back
MsgHandle * mh_send_back[2][QUDA_MAX_DIM]
Definition: lattice_field.h:334

quda::LatticeField::MemType
virtual QudaMemoryType MemType() const
Definition: lattice_field.h:593

quda::LatticeField::my_face_dim_dir_hd
void * my_face_dim_dir_hd[2][QUDA_MAX_DIM][2]
Definition: lattice_field.h:295

quda::LatticeField::GhostExchange
QudaGhostExchange GhostExchange() const
Definition: lattice_field.h:562

quda::LatticeField::scale
double scale
Definition: lattice_field.h:187

quda::LatticeField::Ndim
int Ndim() const
Definition: lattice_field.h:500

quda::LatticeField::ipcCopyEvent
static cudaEvent_t ipcCopyEvent[2][2][QUDA_MAX_DIM]
Definition: lattice_field.h:373

quda::LatticeField::ipcRemoteCopyEvent
static cudaEvent_t ipcRemoteCopyEvent[2][2][QUDA_MAX_DIM]
Definition: lattice_field.h:376

quda::LatticeField::getIPCRemoteCopyEvent
const cudaEvent_t & getIPCRemoteCopyEvent(int dir, int dim) const
Definition: lattice_field.cpp:638

quda::LatticeField::mh_recv_fwd
MsgHandle * mh_recv_fwd[2][QUDA_MAX_DIM]
Definition: lattice_field.h:325

quda::LatticeField::buffer_send_p2p_back
static int buffer_send_p2p_back[2][QUDA_MAX_DIM]
Definition: lattice_field.h:367

quda::LatticeField::allocateGhostBuffer
void allocateGhostBuffer(size_t ghost_bytes) const
Allocate the static ghost buffers.
Definition: lattice_field.cpp:228

quda::LatticeField::read
virtual void read(char *filename)
Definition: lattice_field.cpp:699

quda::LatticeField::localVolume
size_t localVolume
Definition: lattice_field.h:155

quda::LatticeField::mh_recv_rdma_fwd
MsgHandle * mh_recv_rdma_fwd[2][QUDA_MAX_DIM]
Definition: lattice_field.h:337

quda::LatticeField::ghost_face_bytes_aligned
size_t ghost_face_bytes_aligned[QUDA_MAX_DIM]
Definition: lattice_field.h:269

quda::LatticeField::commsQuery
virtual int commsQuery(int nFace, int dir, int dagger=0, qudaStream_t *stream_p=NULL, bool gdr_send=false, bool gdr_recv=true)
Definition: lattice_field.h:681

quda::LatticeField::precisionCheck
void precisionCheck()
Definition: lattice_field.h:396

quda::LatticeField::ghost_recv_buffer_d
static void * ghost_recv_buffer_d[2]
Definition: lattice_field.h:214

quda::LatticeField::mh_recv_back
MsgHandle * mh_recv_back[2][QUDA_MAX_DIM]
Definition: lattice_field.h:328

quda::LatticeField::Scale
double Scale() const
Definition: lattice_field.h:577

quda::LatticeField::createComms
void createComms(bool no_comms_fill=false, bool bidir=true)
Definition: lattice_field.cpp:312

quda::LatticeField::from_face_hd
void * from_face_hd[2]
Definition: lattice_field.h:308

quda::LatticeField::total_bytes
size_t total_bytes
Definition: lattice_field.h:163

quda::LatticeField::LatticeField
LatticeField(const LatticeFieldParam &param)
Definition: lattice_field.cpp:61

quda::LatticeField::freeGhostBuffer
static void freeGhostBuffer(void)
Free statically allocated ghost buffers.
Definition: lattice_field.cpp:283

quda::LatticeField::from_face_h
void * from_face_h[2]
Definition: lattice_field.h:303

quda::LatticeField::ghost_send_buffer_d
static void * ghost_send_buffer_d[2]
Definition: lattice_field.h:209

quda::LatticeField::backup_h
char * backup_h
Definition: lattice_field.h:407

quda::LatticeField::copy_to_buffer
virtual void copy_to_buffer(void *buffer) const =0
Copy all contents of the field to a host buffer.

quda::Object
Definition: object.h:17

comm_quda.h

dim
std::array< int, 4 > dim
Definition: command_line_params.cpp:34

dagger
bool dagger
Definition: command_line_params.cpp:40

QudaPrecision
enum QudaPrecision_s QudaPrecision

QUDA_CUDA_FIELD_LOCATION
@ QUDA_CUDA_FIELD_LOCATION
Definition: enum_quda.h:326

QUDA_INVALID_FIELD_LOCATION
@ QUDA_INVALID_FIELD_LOCATION
Definition: enum_quda.h:327

QUDA_INVALID_SITE_SUBSET
@ QUDA_INVALID_SITE_SUBSET
Definition: enum_quda.h:334

QUDA_FULL_SITE_SUBSET
@ QUDA_FULL_SITE_SUBSET
Definition: enum_quda.h:333

QUDA_MEMORY_DEVICE
@ QUDA_MEMORY_DEVICE
Definition: enum_quda.h:13

QudaSiteSubset
enum QudaSiteSubset_s QudaSiteSubset

QudaFieldLocation
enum QudaFieldLocation_s QudaFieldLocation

QUDA_GHOST_EXCHANGE_NO
@ QUDA_GHOST_EXCHANGE_NO
Definition: enum_quda.h:508

QUDA_GHOST_EXCHANGE_PAD
@ QUDA_GHOST_EXCHANGE_PAD
Definition: enum_quda.h:509

QudaGhostExchange
enum QudaGhostExchange_s QudaGhostExchange

QudaMemoryType
enum QudaMemoryType_s QudaMemoryType

QUDA_DOUBLE_PRECISION
@ QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:65

QUDA_SINGLE_PRECISION
@ QUDA_SINGLE_PRECISION
Definition: enum_quda.h:64

QUDA_INVALID_PRECISION
@ QUDA_INVALID_PRECISION
Definition: enum_quda.h:66

QUDA_QUARTER_PRECISION
@ QUDA_QUARTER_PRECISION
Definition: enum_quda.h:62

QUDA_HALF_PRECISION
@ QUDA_HALF_PRECISION
Definition: enum_quda.h:63

cpu_prec
QudaPrecision & cpu_prec
Definition: host_utils.cpp:57

quda
Definition: blas_lapack.h:24

quda::compile_type_str
const char * compile_type_str(const LatticeField &meta, QudaFieldLocation location_=QUDA_INVALID_FIELD_LOCATION)
Helper function for setting auxilary string.
Definition: lattice_field.h:839

quda::QudaOffsetCopyMode
QudaOffsetCopyMode
Definition: lattice_field.h:46

quda::QudaOffsetCopyMode::COLLECT
@ COLLECT

quda::QudaOffsetCopyMode::DISPERSE
@ DISPERSE

quda::stream
qudaStream_t * stream
Definition: cuda_color_spinor_field.cpp:644

quda::reorder_location
QudaFieldLocation reorder_location()
Return whether data is reordered on the CPU or GPU. This can set at QUDA initialization using the env...
Definition: lattice_field.cpp:748

quda::reorder_location_set
void reorder_location_set(QudaFieldLocation reorder_location_)
Set whether data is reorderd on the CPU or GPU. This can set at QUDA initialization using the environ...
Definition: lattice_field.cpp:749

quda::Precision_
QudaPrecision Precision_(const char *func, const char *file, int line, const LatticeField &a, const LatticeField &b)
Helper function for determining if the precision of the fields is the same.
Definition: lattice_field.h:768

quda::Location_
QudaFieldLocation Location_(const char *func, const char *file, int line, const LatticeField &a, const LatticeField &b)
Helper function for determining if the location of the fields is the same.
Definition: lattice_field.h:738

quda::Native_
bool Native_(const char *func, const char *file, int line, const LatticeField &a)
Helper function for determining if the field is in native order.
Definition: lattice_field.h:798

quda::operator<<
std::ostream & operator<<(std::ostream &output, const CloverFieldParam &param)
Definition: clover_field.cpp:441

object.h

param
QudaGaugeParam param
Definition: pack_test.cpp:18

quda.h
Main header file for the QUDA library.

quda_api.h

qudaStream_t
cudaStream_t qudaStream_t
Definition: quda_api.h:9

QUDA_MAX_DIM
#define QUDA_MAX_DIM
Maximum number of dimensions supported by QUDA. In practice, no routines make use of more than 5.
Definition: quda_constants.h:17

MsgHandle_s
Definition: communicator_mpi.cpp:15

QudaGaugeParam_s
Definition: quda.h:31

QudaGaugeParam_s::X
int X[4]
Definition: quda.h:35

quda::LatticeFieldParam
Definition: lattice_field.h:48

quda::LatticeFieldParam::LatticeFieldParam
LatticeFieldParam(int nDim, const int *x, int pad, QudaPrecision precision, QudaGhostExchange ghostExchange=QUDA_GHOST_EXCHANGE_PAD)
Constructor for creating a LatticeFieldParam from a set of parameters.
Definition: lattice_field.h:107

quda::LatticeFieldParam::pad
int pad
Definition: lattice_field.h:70

quda::LatticeFieldParam::precision
QudaPrecision precision
Definition: lattice_field.h:52

quda::LatticeFieldParam::LatticeFieldParam
LatticeFieldParam()
Default constructor for LatticeFieldParam.
Definition: lattice_field.h:88

quda::LatticeFieldParam::mem_type
QudaMemoryType mem_type
Definition: lattice_field.h:74

quda::LatticeFieldParam::r
int r[QUDA_MAX_DIM]
Definition: lattice_field.h:80

quda::LatticeFieldParam::scale
double scale
Definition: lattice_field.h:83

quda::LatticeFieldParam::GhostPrecision
QudaPrecision GhostPrecision() const
Definition: lattice_field.h:62

quda::LatticeFieldParam::ghostExchange
QudaGhostExchange ghostExchange
Definition: lattice_field.h:77

quda::LatticeFieldParam::nDim
int nDim
Definition: lattice_field.h:65

quda::LatticeFieldParam::LatticeFieldParam
LatticeFieldParam(const QudaGaugeParam &param)
Constructor for creating a LatticeFieldParam from a QudaGaugeParam. Used for wrapping around a CPU re...
Definition: lattice_field.h:126

quda::LatticeFieldParam::ghost_precision
QudaPrecision ghost_precision
Definition: lattice_field.h:55

quda::LatticeFieldParam::x
int x[QUDA_MAX_DIM]
Definition: lattice_field.h:68

quda::LatticeFieldParam::siteSubset
QudaSiteSubset siteSubset
Definition: lattice_field.h:72

quda::LatticeFieldParam::Precision
QudaPrecision Precision() const
Definition: lattice_field.h:59

quda::TuneKey::aux_n
static const int aux_n
Definition: tune_key.h:12

quda::TuneKey::volume_n
static const int volume_n
Definition: tune_key.h:10

util_quda.h

errorQuda
#define errorQuda(...)
Definition: util_quda.h:120