quda-ref/v1.0.0/lattice__field_8h_source.html

 #ifndef _LATTICE_FIELD_H
 #define _LATTICE_FIELD_H

 #include <map>
 #include <quda.h>
 #include <iostream>
 #include <comm_quda.h>
 #include <util_quda.h>
 #include <object.h>
 #include <cuda_runtime.h>

 namespace quda {

   // LatticeField is an abstract base clase for all Field objects.

   // Forward declaration of all children
   class LatticeField;

   class ColorSpinorField;
   class cudaColorSpinorField;
   class cpuColorSpinorField;

   class EigValueSet;
   class cudaEigValueSet;
   class cpuEigValueSet;

   class EigVecSet;
   class cpuEigVecSet;
   class cudaEigVecSet;

   class GaugeField;
   class cpuGaugeField;
   class cudaGaugeField;

   class CloverField;
   class cudaCloverField;
   class cpuCloverField;

   struct LatticeFieldParam {

   protected:
     QudaPrecision precision;

     QudaPrecision ghost_precision;

   public:
     QudaPrecision Precision() const { return precision; }

     QudaPrecision GhostPrecision() const { return ghost_precision; }

     int nDim;

     int x[QUDA_MAX_DIM];

     int pad;

     QudaSiteSubset siteSubset;

     QudaMemoryType mem_type;

     QudaGhostExchange ghostExchange;

     int r[QUDA_MAX_DIM];

     double scale;

     LatticeFieldParam()
     : precision(QUDA_INVALID_PRECISION), ghost_precision(QUDA_INVALID_PRECISION), nDim(4), pad(0),
       siteSubset(QUDA_INVALID_SITE_SUBSET), mem_type(QUDA_MEMORY_DEVICE),
       ghostExchange(QUDA_GHOST_EXCHANGE_PAD), scale(1.0)
     {
       for (int i=0; i<nDim; i++) {
   x[i] = 0;
   r[i] = 0;
       }
     }

     LatticeFieldParam(int nDim, const int *x, int pad, QudaPrecision precision,
           QudaGhostExchange ghostExchange=QUDA_GHOST_EXCHANGE_PAD)
     : precision(precision), ghost_precision(precision), nDim(nDim), pad(pad),
       siteSubset(QUDA_FULL_SITE_SUBSET), mem_type(QUDA_MEMORY_DEVICE),
       ghostExchange(ghostExchange), scale(1.0)
     {
       if (nDim > QUDA_MAX_DIM) errorQuda("Number of dimensions too great");
       for (int i=0; i<nDim; i++) {
   this->x[i] = x[i];
   this->r[i] = 0;
       }
     }

     LatticeFieldParam(const QudaGaugeParam &param)
     :  precision(param.cpu_prec), ghost_precision(param.cpu_prec), nDim(4), pad(0),
       siteSubset(QUDA_FULL_SITE_SUBSET), mem_type(QUDA_MEMORY_DEVICE),
       ghostExchange(QUDA_GHOST_EXCHANGE_NO), scale(param.scale)
     {
       for (int i=0; i<nDim; i++) {
   this->x[i] = param.X[i];
   this->r[i] = 0;
       }
     }

     LatticeFieldParam(const LatticeField &field);
   };

   std::ostream& operator<<(std::ostream& output, const LatticeFieldParam& param);

   class LatticeField : public Object {

   protected:
     int volume;

     int volumeCB;

     int stride;
     int pad;

     size_t total_bytes;

     int nDim;

     int x[QUDA_MAX_DIM];

     int surface[QUDA_MAX_DIM];
     int surfaceCB[QUDA_MAX_DIM];

     int r[QUDA_MAX_DIM];

     QudaPrecision precision;

     mutable QudaPrecision ghost_precision;

     mutable bool ghost_precision_reset;

     double scale;

     QudaSiteSubset siteSubset;

     QudaGhostExchange ghostExchange;

     // The below are additions for inter-GPU communication (merging FaceBuffer functionality)

     int nDimComms;

     /*
        The need for persistent message handlers (for GPUDirect support)
        means that we allocate different message handlers for each number of
        faces we can send.
     */

     static void *ghost_send_buffer_d[2];

     static void *ghost_recv_buffer_d[2];

     static void *ghost_pinned_send_buffer_h[2];

     static void *ghost_pinned_recv_buffer_h[2];

     static void *ghost_pinned_send_buffer_hd[2];

     static void *ghost_pinned_recv_buffer_hd[2];

     static void *ghost_remote_send_buffer_d[2][QUDA_MAX_DIM][2];

     static size_t ghostFaceBytes;

     static bool initGhostFaceBuffer;

     mutable size_t ghost_bytes;

     mutable size_t ghost_bytes_old;

     mutable size_t ghost_face_bytes[QUDA_MAX_DIM];

     mutable int ghostOffset[QUDA_MAX_DIM][2];

     mutable int ghostNormOffset[QUDA_MAX_DIM][2];

     void *my_face_h[2];

     void *my_face_hd[2];

     void *my_face_d[2];

     void *my_face_dim_dir_h[2][QUDA_MAX_DIM][2];

     void *my_face_dim_dir_hd[2][QUDA_MAX_DIM][2];

     void *my_face_dim_dir_d[2][QUDA_MAX_DIM][2];

     void *from_face_h[2];

     void *from_face_hd[2];

     void *from_face_d[2];

     void *from_face_dim_dir_h[2][QUDA_MAX_DIM][2];

     void *from_face_dim_dir_hd[2][QUDA_MAX_DIM][2];

     void *from_face_dim_dir_d[2][QUDA_MAX_DIM][2];

     MsgHandle *mh_recv_fwd[2][QUDA_MAX_DIM];

     MsgHandle *mh_recv_back[2][QUDA_MAX_DIM];

     MsgHandle *mh_send_fwd[2][QUDA_MAX_DIM];

     MsgHandle *mh_send_back[2][QUDA_MAX_DIM];

     MsgHandle *mh_recv_rdma_fwd[2][QUDA_MAX_DIM];

     MsgHandle *mh_recv_rdma_back[2][QUDA_MAX_DIM];

     MsgHandle *mh_send_rdma_fwd[2][QUDA_MAX_DIM];

     MsgHandle *mh_send_rdma_back[2][QUDA_MAX_DIM];

     static MsgHandle* mh_send_p2p_fwd[2][QUDA_MAX_DIM];

     static MsgHandle* mh_send_p2p_back[2][QUDA_MAX_DIM];

     static MsgHandle* mh_recv_p2p_fwd[2][QUDA_MAX_DIM];

     static MsgHandle* mh_recv_p2p_back[2][QUDA_MAX_DIM];

     static int buffer_send_p2p_fwd[2][QUDA_MAX_DIM];

     static int buffer_recv_p2p_fwd[2][QUDA_MAX_DIM];

     static int buffer_send_p2p_back[2][QUDA_MAX_DIM];

     static int buffer_recv_p2p_back[2][QUDA_MAX_DIM];

     static cudaEvent_t ipcCopyEvent[2][2][QUDA_MAX_DIM];

     static cudaEvent_t ipcRemoteCopyEvent[2][2][QUDA_MAX_DIM];

     bool initComms;

     static bool initIPCComms;

     char vol_string[TuneKey::volume_n];

     char aux_string[TuneKey::aux_n];

     virtual void setTuningString();

     QudaMemoryType mem_type;

     void precisionCheck() {
       switch(precision) {
       case QUDA_QUARTER_PRECISION:
       case QUDA_HALF_PRECISION:
       case QUDA_SINGLE_PRECISION:
       case QUDA_DOUBLE_PRECISION:
   break;
       default:
   errorQuda("Unknown precision %d\n", precision);
       }
     }

     mutable char *backup_h;
     mutable char *backup_norm_h;
     mutable bool backed_up;

   public:

     LatticeField(const LatticeFieldParam &param);

     LatticeField(const LatticeField &field);

     virtual ~LatticeField();

     void allocateGhostBuffer(size_t ghost_bytes) const;

     static void freeGhostBuffer(void);

     void createComms(bool no_comms_fill=false, bool bidir=true);

     void destroyComms();

     void createIPCComms();

     static void destroyIPCComms();

     inline bool ipcCopyComplete(int dir, int dim);

     inline bool ipcRemoteCopyComplete(int dir, int dim);

     const cudaEvent_t& getIPCCopyEvent(int dir, int dim) const;

     const cudaEvent_t& getIPCRemoteCopyEvent(int dir, int dim) const;

     static int bufferIndex;

     static bool ghost_field_reset;

     int Ndim() const { return nDim; }

     const int* X() const { return x; }

     int Volume() const { return volume; }

     int VolumeCB() const { return volumeCB; }

     const int* SurfaceCB() const { return surfaceCB; }

     int SurfaceCB(const int i) const { return surfaceCB[i]; }

     int Stride() const { return stride; }

     int Pad() const { return pad; }

     const int* R() const { return r; }

     QudaGhostExchange GhostExchange() const { return ghostExchange; }

     QudaPrecision Precision() const { return precision; }

     QudaPrecision GhostPrecision() const { return ghost_precision; }

     double Scale() const { return scale; }

     void Scale(double scale_) { scale = scale_; }

     virtual QudaSiteSubset SiteSubset() const { return siteSubset; }

     virtual QudaMemoryType MemType() const { return mem_type; }

     int Nvec() const;

     QudaFieldLocation Location() const;

     size_t GBytes() const { return total_bytes / (1<<30); }

     void checkField(const LatticeField &a) const;

     virtual void read(char *filename);

     virtual void write(char *filename);

     virtual void gather(int nFace, int dagger, int dir, cudaStream_t *stream_p=NULL)
     { errorQuda("Not implemented"); }

     virtual void commsStart(int nFace, int dir, int dagger=0, cudaStream_t *stream_p=NULL, bool gdr_send=false, bool gdr_recv=true)
     { errorQuda("Not implemented"); }

     virtual int commsQuery(int nFace, int dir, int dagger=0, cudaStream_t *stream_p=NULL, bool gdr_send=false, bool gdr_recv=true)
     { errorQuda("Not implemented"); return 0; }

     virtual void commsWait(int nFace, int dir, int dagger=0, cudaStream_t *stream_p=NULL, bool gdr_send=false, bool gdr_recv=true)
     { errorQuda("Not implemented"); }

     virtual void scatter(int nFace, int dagger, int dir)
     { errorQuda("Not implemented"); }

     inline const char *VolString() const { return vol_string; }

     inline const char *AuxString() const { return aux_string; }

     virtual void backup() const { errorQuda("Not implemented"); }

     virtual void restore() const { errorQuda("Not implemented"); }
   };

   inline QudaFieldLocation Location_(const char *func, const char *file, int line,
              const LatticeField &a, const LatticeField &b) {
     QudaFieldLocation location = QUDA_INVALID_FIELD_LOCATION;
     if (a.Location() == b.Location()) location = a.Location();
     else errorQuda("Locations %d %d do not match  (%s:%d in %s())\n",
        a.Location(), b.Location(), file, line, func);
     return location;
   }

   template <typename... Args>
   inline QudaFieldLocation Location_(const char *func, const char *file, int line,
              const LatticeField &a, const LatticeField &b, const Args &... args) {
     return static_cast<QudaFieldLocation>(Location_(func,file,line,a,b) & Location_(func,file,line,a,args...));
   }

 #define checkLocation(...)Location_(__func__, __FILE__, __LINE__, __VA_ARGS__)

   inline QudaPrecision Precision_(const char *func, const char *file, int line,
           const LatticeField &a, const LatticeField &b) {
     QudaPrecision precision = QUDA_INVALID_PRECISION;
     if (a.Precision() == b.Precision()) precision = a.Precision();
     else errorQuda("Precisions %d %d do not match (%s:%d in %s())\n",
        a.Precision(), b.Precision(), file, line, func);
     return precision;
   }

   template <typename... Args>
   inline QudaPrecision Precision_(const char *func, const char *file, int line,
           const LatticeField &a, const LatticeField &b,
           const Args &... args) {
     return static_cast<QudaPrecision>(Precision_(func,file,line,a,b) & Precision_(func,file,line,a,args...));
   }

 #define checkPrecision(...) Precision_(__func__, __FILE__, __LINE__, __VA_ARGS__)

   QudaFieldLocation reorder_location();

   void reorder_location_set(QudaFieldLocation reorder_location_);

   inline const char *compile_type_str(const LatticeField &meta, QudaFieldLocation location_ = QUDA_INVALID_FIELD_LOCATION)
   {
     QudaFieldLocation location = (location_ == QUDA_INVALID_FIELD_LOCATION ? meta.Location() : location_);
 #ifdef JITIFY
     return location == QUDA_CUDA_FIELD_LOCATION ? "GPU-jitify," : "CPU,";
 #else
     return location == QUDA_CUDA_FIELD_LOCATION ? "GPU-offline," : "CPU,";
 #endif
   }

 } // namespace quda

 #endif // _LATTICE_FIELD_H
quda::Precision_
QudaPrecision Precision_(const char *func, const char *file, int line, const LatticeField &a, const LatticeField &b)
Helper function for determining if the precision of the fields is the same.
Definition: lattice_field.h:672

quda::reorder_location
QudaFieldLocation reorder_location()
Return whether data is reordered on the CPU or GPU. This can set at QUDA initialization using the env...
Definition: lattice_field.cpp:725

quda::LatticeField::backed_up
bool backed_up
Definition: lattice_field.h:403

quda::LatticeFieldParam::ghostExchange
QudaGhostExchange ghostExchange
Definition: lattice_field.h:76

QudaPrecision
enum QudaPrecision_s QudaPrecision

quda::LatticeField::AuxString
const char * AuxString() const
Definition: lattice_field.h:627

quda::LatticeField::pad
int pad
Definition: lattice_field.h:154

quda::LatticeField::initComms
bool initComms
Definition: lattice_field.h:372

quda::LatticeField::total_bytes
size_t total_bytes
Definition: lattice_field.h:156

QUDA_INVALID_PRECISION
Definition: enum_quda.h:63

quda::LatticeField::commsWait
virtual void commsWait(int nFace, int dir, int dagger=0, cudaStream_t *stream_p=NULL, bool gdr_send=false, bool gdr_recv=true)
Definition: lattice_field.h:617

quda::LatticeFieldParam
Definition: lattice_field.h:47

quda::LatticeField::volumeCB
int volumeCB
Definition: lattice_field.h:151

quda::LatticeField::Stride
int Stride() const
Definition: lattice_field.h:526

errorQuda
#define errorQuda(...)
Definition: util_quda.h:121

QUDA_CUDA_FIELD_LOCATION
Definition: enum_quda.h:326

QUDA_QUARTER_PRECISION
Definition: enum_quda.h:59

quda::LatticeField::siteSubset
QudaSiteSubset siteSubset
Definition: lattice_field.h:183

QUDA_HALF_PRECISION
Definition: enum_quda.h:60

quda::LatticeField::GhostPrecision
QudaPrecision GhostPrecision() const
Definition: lattice_field.h:551

quda::LatticeField::backup_h
char * backup_h
Definition: lattice_field.h:401

quda::LatticeField::commsQuery
virtual int commsQuery(int nFace, int dir, int dagger=0, cudaStream_t *stream_p=NULL, bool gdr_send=false, bool gdr_recv=true)
Definition: lattice_field.h:614

QUDA_FULL_SITE_SUBSET
Definition: enum_quda.h:333

quda::LatticeField::nDimComms
int nDimComms
Definition: lattice_field.h:191

quda::LatticeField::Scale
double Scale() const
Definition: lattice_field.h:556

quda::LatticeField::SurfaceCB
int SurfaceCB(const int i) const
Definition: lattice_field.h:521

quda::LatticeField::ghost_bytes_old
size_t ghost_bytes_old
Definition: lattice_field.h:252

quda::LatticeFieldParam::GhostPrecision
QudaPrecision GhostPrecision() const
Definition: lattice_field.h:61

quda::LatticeField::VolString
const char * VolString() const
Definition: lattice_field.h:624

quda::LatticeFieldParam::precision
QudaPrecision precision
Definition: lattice_field.h:51

quda::LatticeField::SurfaceCB
const int * SurfaceCB() const
Definition: lattice_field.h:515

quda::LatticeField::volume
int volume
Definition: lattice_field.h:148

util_quda.h

quda::LatticeFieldParam::LatticeFieldParam
LatticeFieldParam(const QudaGaugeParam &param)
Constructor for creating a LatticeFieldParam from a QudaGaugeParam. Used for wrapping around a CPU re...
Definition: lattice_field.h:125

quda::LatticeField::scale
double scale
Definition: lattice_field.h:180

QUDA_INVALID_SITE_SUBSET
Definition: enum_quda.h:334

quda::LatticeField::ghost_precision_reset
bool ghost_precision_reset
Definition: lattice_field.h:177

quda::LatticeField::initGhostFaceBuffer
static bool initGhostFaceBuffer
Definition: lattice_field.h:242

quda::compile_type_str
const char * compile_type_str(const LatticeField &meta, QudaFieldLocation location_=QUDA_INVALID_FIELD_LOCATION)
Helper function for setting auxilary string.
Definition: lattice_field.h:718

quda
Definition: blas_cublas.h:5

quda::LatticeFieldParam::siteSubset
QudaSiteSubset siteSubset
Definition: lattice_field.h:71

quda::operator<<
std::ostream & operator<<(std::ostream &output, const CloverFieldParam &param)
Definition: clover_field.cpp:427

quda::LatticeFieldParam::scale
double scale
Definition: lattice_field.h:82

param
QudaGaugeParam param
Definition: pack_test.cpp:17

comm_quda.h

quda::LatticeField::MemType
virtual QudaMemoryType MemType() const
Definition: lattice_field.h:572

quda::LatticeFieldParam::x
int x[QUDA_MAX_DIM]
Definition: lattice_field.h:67

quda::LatticeField::R
const int * R() const
Definition: lattice_field.h:536

quda::LatticeField::Ndim
int Ndim() const
Definition: lattice_field.h:494

quda::LatticeField::ghost_field_reset
static bool ghost_field_reset
Definition: lattice_field.h:489

quda::LatticeField::bufferIndex
static int bufferIndex
Definition: lattice_field.h:484

quda::LatticeField::Pad
int Pad() const
Definition: lattice_field.h:531

QudaGaugeParam_s
Definition: quda.h:32

quda::blas::write
Definition: multi_blas_quda.cu:20

quda::LatticeField
Definition: lattice_field.h:144

QudaGhostExchange
enum QudaGhostExchange_s QudaGhostExchange

QUDA_INVALID_FIELD_LOCATION
Definition: enum_quda.h:327

quda::LatticeField::ghostExchange
QudaGhostExchange ghostExchange
Definition: lattice_field.h:186

quda::LatticeField::backup_norm_h
char * backup_norm_h
Definition: lattice_field.h:402

quda::LatticeField::ghost_bytes
size_t ghost_bytes
Definition: lattice_field.h:247

QUDA_GHOST_EXCHANGE_NO
Definition: enum_quda.h:482

quda::Object
Definition: object.h:17

quda::LatticeField::Volume
int Volume() const
Definition: lattice_field.h:504

quda::LatticeField::backup
virtual void backup() const
Backs up the LatticeField.
Definition: lattice_field.h:630

QudaGaugeParam_s::X
int X[4]
Definition: quda.h:36

quda::LatticeField::nDim
int nDim
Definition: lattice_field.h:159

QUDA_MEMORY_DEVICE
Definition: enum_quda.h:12

quda::LatticeFieldParam::nDim
int nDim
Definition: lattice_field.h:64

QudaSiteSubset
enum QudaSiteSubset_s QudaSiteSubset

quda::LatticeField::Location
QudaFieldLocation Location() const
Definition: lattice_field.cpp:660

quda::reorder_location_
static QudaFieldLocation reorder_location_
Definition: lattice_field.cpp:723

quda::LatticeField::ghostFaceBytes
static size_t ghostFaceBytes
Definition: lattice_field.h:237

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:62

QudaFieldLocation
enum QudaFieldLocation_s QudaFieldLocation

object.h

quda::LatticeField::Scale
void Scale(double scale_)
Set the scale factor for a fixed-point field.
Definition: lattice_field.h:562

quda::LatticeField::ghost_precision
QudaPrecision ghost_precision
Definition: lattice_field.h:174

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:61

quda::LatticeField::scatter
virtual void scatter(int nFace, int dagger, int dir)
Definition: lattice_field.h:620

quda.h
Main header file for the QUDA library.

quda::LatticeFieldParam::Precision
QudaPrecision Precision() const
Definition: lattice_field.h:58

quda::TuneKey::aux_n
static const int aux_n
Definition: tune_key.h:12

quda::LatticeField::SiteSubset
virtual QudaSiteSubset SiteSubset() const
Definition: lattice_field.h:567

quda::LatticeFieldParam::mem_type
QudaMemoryType mem_type
Definition: lattice_field.h:73

quda::LatticeField::VolumeCB
int VolumeCB() const
Definition: lattice_field.h:509

quda::LatticeFieldParam::LatticeFieldParam
LatticeFieldParam()
Default constructor for LatticeFieldParam.
Definition: lattice_field.h:87

quda::LatticeFieldParam::ghost_precision
QudaPrecision ghost_precision
Definition: lattice_field.h:54

cpu_prec
QudaPrecision & cpu_prec
Definition: contract_test.cpp:66

QUDA_MAX_DIM
#define QUDA_MAX_DIM
Maximum number of dimensions supported by QUDA. In practice, no routines make use of more than 5...
Definition: quda_constants.h:17

volumeCB
static int volumeCB
Definition: face_gauge.cpp:43

quda::LatticeField::GhostExchange
QudaGhostExchange GhostExchange() const
Definition: lattice_field.h:541

quda::LatticeField::commsStart
virtual void commsStart(int nFace, int dir, int dagger=0, cudaStream_t *stream_p=NULL, bool gdr_send=false, bool gdr_recv=true)
Definition: lattice_field.h:611

quda::TuneKey::volume_n
static const int volume_n
Definition: tune_key.h:10

quda::LatticeFieldParam::LatticeFieldParam
LatticeFieldParam(int nDim, const int *x, int pad, QudaPrecision precision, QudaGhostExchange ghostExchange=QUDA_GHOST_EXCHANGE_PAD)
Constructor for creating a LatticeFieldParam from a set of parameters.
Definition: lattice_field.h:106

QUDA_GHOST_EXCHANGE_PAD
Definition: enum_quda.h:483

quda::LatticeField::Precision
QudaPrecision Precision() const
Definition: lattice_field.h:546

dagger
QudaDagType dagger
Definition: test_util.cpp:1620

quda::LatticeFieldParam::r
int r[QUDA_MAX_DIM]
Definition: lattice_field.h:79

quda::LatticeField::precisionCheck
void precisionCheck()
Definition: lattice_field.h:389

quda::reorder_location_set
void reorder_location_set(QudaFieldLocation reorder_location_)
Set whether data is reorderd on the CPU or GPU. This can set at QUDA initialization using the environ...
Definition: lattice_field.cpp:726

quda::LatticeField::mem_type
QudaMemoryType mem_type
Definition: lattice_field.h:387

quda::LatticeField::precision
QudaPrecision precision
Definition: lattice_field.h:171

quda::Location_
QudaFieldLocation Location_(const char *func, const char *file, int line, const LatticeField &a, const LatticeField &b)
Helper function for determining if the location of the fields is the same.
Definition: lattice_field.h:642

quda::LatticeField::gather
virtual void gather(int nFace, int dagger, int dir, cudaStream_t *stream_p=NULL)
Definition: lattice_field.h:608

quda::LatticeField::restore
virtual void restore() const
Restores the LatticeField.
Definition: lattice_field.h:633

quda::LatticeField::stride
int stride
Definition: lattice_field.h:153

QudaMemoryType
enum QudaMemoryType_s QudaMemoryType

MsgHandle_s
Definition: comm_mpi.cpp:24

quda::LatticeField::initIPCComms
static bool initIPCComms
Definition: lattice_field.h:375

quda::LatticeField::GBytes
size_t GBytes() const
Definition: lattice_field.h:588

quda::LatticeField::X
const int * X() const
Definition: lattice_field.h:499

quda::LatticeFieldParam::pad
int pad
Definition: lattice_field.h:69