v0.9.0/doc/dslash__constants_8h_source.html

 #include <unistd.h>
 #include <fast_intdiv.h>
 #include <convert.h>

 enum KernelType {
   INTERIOR_KERNEL = 5,
   EXTERIOR_KERNEL_ALL = 6,
   EXTERIOR_KERNEL_X = 0,
   EXTERIOR_KERNEL_Y = 1,
   EXTERIOR_KERNEL_Z = 2,
   EXTERIOR_KERNEL_T = 3,
   KERNEL_POLICY = 7
 };

   struct DslashParam {
     int threads; // the desired number of active threads
     int parity;  // Even-Odd or Odd-Even

     int_fastdiv block[4]; // dslash tile block parameter
     int_fastdiv grid[4]; // dslash tile grid parameter
     int_fastdiv swizzle; // block index swizzle factor

     DslashConstant dc;

     KernelType kernel_type; //is it INTERIOR_KERNEL, EXTERIOR_KERNEL_X/Y/Z/T

     int commDim[QUDA_MAX_DIM]; // Whether to do comms or not
     int ghostDim[QUDA_MAX_DIM]; // Whether a ghost zone has been allocated for a given dimension
     int ghostOffset[QUDA_MAX_DIM+1][2];
     int ghostNormOffset[QUDA_MAX_DIM+1][2];
     int sp_stride; // spinor stride

 #ifdef GPU_CLOVER_DIRAC
     int cl_stride; // clover stride
 #endif
 #if (defined GPU_TWISTED_MASS_DIRAC) || (defined GPU_NDEG_TWISTED_MASS_DIRAC)
     int fl_stride; // twisted-mass flavor stride
 #endif
     int gauge_stride;
 #ifdef GPU_STAGGERED_DIRAC
     int long_gauge_stride;
     float fat_link_max;
 #endif

     int gauge_fixed; // whether the gauge field is fixed to axial gauge

     double t_boundary;
     float t_boundary_f;

     bool Pt0;
     bool PtNm1;

     double anisotropy;
     float anisotropy_f;

     float2 An2;
     float2 TB2;
     float2 No2;

     int threadDimMapLower[4];
     int threadDimMapUpper[4];

     double coeff; // used as a gauge field scaling factor by the staggered kernels
     float coeff_f;

     double a;
     float a_f;

     double b;
     float b_f;

     double c;
     float c_f;

     double d;
     float d_f;

     double a_inv;
     float a_inv_f;

     double rho;
     float rho_f;

     double mferm;
     float mferm_f;

     // domain wall constants
     double m5_d;
     float m5_f;

     // the coefficients used in MDWF
     double mdwf_b5_d[QUDA_MAX_DWF_LS];
     double mdwf_c5_d[QUDA_MAX_DWF_LS];

     float mdwf_b5_f[QUDA_MAX_DWF_LS];
     float mdwf_c5_f[QUDA_MAX_DWF_LS];

     double tProjScale;
     float tProjScale_f;

     void *out;
     float *outNorm;

     void *in;
     float *inNorm;

     void *ghost[2*QUDA_MAX_DIM];
     float *ghostNorm[2*QUDA_MAX_DIM];

     void *x;
     float *xNorm;

     void *gauge0;
     void *gauge1;

     void *longGauge0;
     void *longGauge1;

     void *longPhase0;
     void *longPhase1;

     void *clover;
     float *cloverNorm;

     void *cloverInv;
     float *cloverInvNorm;

     double twist_a;
     double twist_b;

     int Vsh; // used by contraction kernels

 #ifdef USE_TEXTURE_OBJECTS
     cudaTextureObject_t inTex;
     cudaTextureObject_t inTexNorm;
     cudaTextureObject_t ghostTex[2*QUDA_MAX_DIM];
     cudaTextureObject_t ghostTexNorm[2*QUDA_MAX_DIM];
     cudaTextureObject_t xTex;
     cudaTextureObject_t xTexNorm;
     cudaTextureObject_t outTex;
     cudaTextureObject_t outTexNorm;
     cudaTextureObject_t gauge0Tex; // also applies to fat gauge
     cudaTextureObject_t gauge1Tex; // also applies to fat gauge
     cudaTextureObject_t longGauge0Tex;
     cudaTextureObject_t longGauge1Tex;
     cudaTextureObject_t longPhase0Tex;
     cudaTextureObject_t longPhase1Tex;
     cudaTextureObject_t cloverTex;
     cudaTextureObject_t cloverNormTex;
     cudaTextureObject_t cloverInvTex;
     cudaTextureObject_t cloverInvNormTex;
 #endif

     // used by the autotuner to switch on/off remote writing vs using copy engines
     bool remote_write;

     void print() {
       printfQuda("threads = %d\n", threads);
       printfQuda("parity = %d\n", parity);
       printfQuda("X = {%d, %d, %d, %d}\n", (int)dc.X[0], (int)dc.X[1], (int)dc.X[2], (int)dc.X[3]);
       printfQuda("Xh = {%d, %d, %d, %d}\n", (int)dc.Xh[0], (int)dc.Xh[1], (int)dc.Xh[2], (int)dc.Xh[3]);
       printfQuda("volume4CB = %d\n", (int)dc.volume_4d_cb);
       printfQuda("Ls = %d\n", dc.Ls);
       printfQuda("kernel_type = %d\n", kernel_type);
       printfQuda("commDim = {%d, %d, %d, %d}\n", commDim[0], commDim[1], commDim[2], commDim[3]);
       printfQuda("ghostDim = {%d, %d, %d, %d}\n", ghostDim[0], ghostDim[1], ghostDim[2], ghostDim[3]);
       printfQuda("ghostOffset = {{%d, %d}, {%d, %d}, {%d, %d}, {%d, %d}}\n", ghostOffset[0][0], ghostOffset[0][1],
                                                                               ghostOffset[1][0], ghostOffset[1][1],
                                                                               ghostOffset[2][0], ghostOffset[2][1],
                                                                               ghostOffset[3][0], ghostOffset[3][1]);
       printfQuda("ghostNormOffset = {{%d, %d}, {%d, %d}, {%d, %d}, {%d, %d}}\n", ghostNormOffset[0][0], ghostNormOffset[0][1],
                                                                                  ghostNormOffset[1][0], ghostNormOffset[1][1],
                                                                                  ghostNormOffset[2][0], ghostNormOffset[2][1],
                                                                                  ghostNormOffset[3][0], ghostNormOffset[3][1]);
       printfQuda("sp_stride = %d\n", sp_stride);
 #ifdef GPU_CLOVER_DIRAC
       printfQuda("cl_stride = %d\n", cl_stride);
 #endif
 #if (defined GPU_TWISTED_MASS_DIRAC) || (defined GPU_NDEG_TWISTED_MASS_DIRAC)
       printfQuda("fl_stride = %d\n", fl_stride);
 #endif
 #ifdef GPU_STAGGERED_DIRAC
       printfQuda("gauge_stride = %d\n", gauge_stride);
       printfQuda("long_gauge_stride = %d\n", long_gauge_stride);
       printfQuda("fat_link_max = %e\n", fat_link_max);
 #endif
       printfQuda("threadDimMapLower = {%d, %d, %d, %d}\n", threadDimMapLower[0], threadDimMapLower[1],
      threadDimMapLower[2], threadDimMapLower[3]);
       printfQuda("threadDimMapUpper = {%d, %d, %d, %d}\n", threadDimMapUpper[0], threadDimMapUpper[1],
      threadDimMapUpper[2], threadDimMapUpper[3]);
       printfQuda("a = %e\n", a);
       printfQuda("b = %e\n", b);
       printfQuda("c = %e\n", c);
       printfQuda("d = %e\n", d);
       printfQuda("a_inv = %e\n", a_inv);
       printfQuda("rho = %e\n", rho);
       printfQuda("mferm = %e\n", mferm);
       printfQuda("tProjScale = %e\n", tProjScale);
       printfQuda("twist_a = %e\n", twist_a);
       printfQuda("twist_b = %e\n", twist_b);
     }
   };
fast_intdiv.h

DslashParam::out
void * out
Definition: dslash_constants.h:101

DslashParam::remote_write
bool remote_write
Definition: dslash_constants.h:155

DslashParam::PtNm1
bool PtNm1
Definition: dslash_constants.h:51

DslashParam::TB2
float2 TB2
Definition: dslash_constants.h:57

DslashParam::anisotropy_f
float anisotropy_f
Definition: dslash_constants.h:54

DslashParam::commDim
int commDim[QUDA_MAX_DIM]
Definition: dslash_constants.h:27

DslashParam::t_boundary
double t_boundary
Definition: dslash_constants.h:47

DslashParam::d_f
float d_f
Definition: dslash_constants.h:76

EXTERIOR_KERNEL_X
Definition: dslash_constants.h:8

DslashParam::threadDimMapLower
int threadDimMapLower[4]
Definition: dslash_constants.h:60

DslashParam::grid
int_fastdiv grid[4]
Definition: dslash_constants.h:20

DslashParam::m5_f
float m5_f
Definition: dslash_constants.h:89

DslashParam::c
double c
Definition: dslash_constants.h:72

DslashParam::ghostNorm
float * ghostNorm[2 *QUDA_MAX_DIM]
Definition: dslash_constants.h:108

DslashParam::twist_b
double twist_b
Definition: dslash_constants.h:129

DslashParam::in
void * in
Definition: dslash_constants.h:104

DslashParam::m5_d
double m5_d
Definition: dslash_constants.h:88

DslashParam::ghostOffset
int ghostOffset[QUDA_MAX_DIM+1][2]
Definition: dslash_constants.h:29

int_fastdiv
Definition: fast_intdiv.h:20

DslashParam::a_inv_f
float a_inv_f
Definition: dslash_constants.h:79

DslashParam::a_inv
double a_inv
Definition: dslash_constants.h:78

DslashParam::b
double b
Definition: dslash_constants.h:69

KernelType
KernelType
Definition: dslash_constants.h:5

DslashParam::Vsh
int Vsh
Definition: dslash_constants.h:131

DslashParam::longPhase1
void * longPhase1
Definition: dslash_constants.h:120

DslashParam::d
double d
Definition: dslash_constants.h:75

DslashParam::parity
int parity
Definition: dslash_constants.h:17

DslashParam::rho_f
float rho_f
Definition: dslash_constants.h:82

DslashParam::tProjScale_f
float tProjScale_f
Definition: dslash_constants.h:99

DslashParam::mdwf_b5_d
double mdwf_b5_d[QUDA_MAX_DWF_LS]
Definition: dslash_constants.h:92

DslashParam::clover
void * clover
Definition: dslash_constants.h:122

DslashParam::mdwf_c5_d
double mdwf_c5_d[QUDA_MAX_DWF_LS]
Definition: dslash_constants.h:93

DslashParam::ghost
void * ghost[2 *QUDA_MAX_DIM]
Definition: dslash_constants.h:107

DslashParam::outNorm
float * outNorm
Definition: dslash_constants.h:102

DslashParam::mdwf_c5_f
float mdwf_c5_f[QUDA_MAX_DWF_LS]
Definition: dslash_constants.h:96

DslashParam::anisotropy
double anisotropy
Definition: dslash_constants.h:53

EXTERIOR_KERNEL_Y
Definition: dslash_constants.h:9

DslashParam::block
int_fastdiv block[4]
Definition: dslash_constants.h:19

DslashParam::dc
DslashConstant dc
Definition: dslash_constants.h:23

DslashParam::kernel_type
KernelType kernel_type
Definition: dslash_constants.h:25

DslashParam::No2
float2 No2
Definition: dslash_constants.h:58

DslashParam::coeff
double coeff
Definition: dslash_constants.h:63

DslashParam::b_f
float b_f
Definition: dslash_constants.h:70

DslashParam::xNorm
float * xNorm
Definition: dslash_constants.h:111

DslashParam::mdwf_b5_f
float mdwf_b5_f[QUDA_MAX_DWF_LS]
Definition: dslash_constants.h:95

INTERIOR_KERNEL
Definition: dslash_constants.h:6

DslashParam::print
void print()
Definition: dslash_constants.h:157

DslashParam::gauge0
void * gauge0
Definition: dslash_constants.h:113

DslashParam::An2
float2 An2
Definition: dslash_constants.h:56

EXTERIOR_KERNEL_Z
Definition: dslash_constants.h:10

EXTERIOR_KERNEL_ALL
Definition: dslash_constants.h:7

DslashParam::gauge_fixed
int gauge_fixed
Definition: dslash_constants.h:45

DslashParam::longPhase0
void * longPhase0
Definition: dslash_constants.h:119

DslashParam::longGauge1
void * longGauge1
Definition: dslash_constants.h:117

DslashParam::threadDimMapUpper
int threadDimMapUpper[4]
Definition: dslash_constants.h:61

EXTERIOR_KERNEL_T
Definition: dslash_constants.h:11

DslashParam::mferm
double mferm
Definition: dslash_constants.h:84

DslashParam::t_boundary_f
float t_boundary_f
Definition: dslash_constants.h:48

DslashParam::gauge_stride
int gauge_stride
Definition: dslash_constants.h:39

KERNEL_POLICY
Definition: dslash_constants.h:12

QUDA_MAX_DWF_LS
#define QUDA_MAX_DWF_LS
Maximum length of the Ls dimension for domain-wall fermions.
Definition: quda_constants.h:49

DslashParam::gauge1
void * gauge1
Definition: dslash_constants.h:114

DslashParam::cloverNorm
float * cloverNorm
Definition: dslash_constants.h:123

printfQuda
#define printfQuda(...)
Definition: util_quda.h:84

DslashParam::a_f
float a_f
Definition: dslash_constants.h:67

DslashParam::swizzle
int_fastdiv swizzle
Definition: dslash_constants.h:21

DslashParam::ghostDim
int ghostDim[QUDA_MAX_DIM]
Definition: dslash_constants.h:28

DslashParam::inNorm
float * inNorm
Definition: dslash_constants.h:105

DslashParam::sp_stride
int sp_stride
Definition: dslash_constants.h:31

QUDA_MAX_DIM
#define QUDA_MAX_DIM
Maximum number of dimensions supported by QUDA. In practice, no routines make use of more than 5...
Definition: quda_constants.h:17

DslashParam::Pt0
bool Pt0
Definition: dslash_constants.h:50

DslashParam::rho
double rho
Definition: dslash_constants.h:81

DslashParam::a
double a
Definition: dslash_constants.h:66

DslashParam::x
void * x
Definition: dslash_constants.h:110

DslashParam::cloverInvNorm
float * cloverInvNorm
Definition: dslash_constants.h:126

DslashParam::tProjScale
double tProjScale
Definition: dslash_constants.h:98

DslashParam::threads
int threads
Definition: dslash_constants.h:16

DslashParam
Definition: dslash_constants.h:15

DslashParam::coeff_f
float coeff_f
Definition: dslash_constants.h:64

DslashParam::cloverInv
void * cloverInv
Definition: dslash_constants.h:125

DslashParam::longGauge0
void * longGauge0
Definition: dslash_constants.h:116

convert.h

DslashParam::ghostNormOffset
int ghostNormOffset[QUDA_MAX_DIM+1][2]
Definition: dslash_constants.h:30

DslashParam::c_f
float c_f
Definition: dslash_constants.h:73

fat_link_max
float fat_link_max

DslashParam::mferm_f
float mferm_f
Definition: dslash_constants.h:85

DslashParam::twist_a
double twist_a
Definition: dslash_constants.h:128