v0.9.0/doc/covdev__test_8cpp_source.html

 #include <iostream>
 #include <stdio.h>
 #include <stdlib.h>
 #include <string.h>

 #include <quda.h>
 #include <quda_internal.h>
 #include <dirac_quda.h>
 #include <dslash_quda.h>
 #include <invert_quda.h>
 #include <util_quda.h>
 #include <blas_quda.h>

 #include <misc.h>
 #include <test_util.h>
 #include <dslash_util.h>
 #include <covdev_reference.h>
 #include <gauge_field.h>

 #include <assert.h>
 #include <gtest.h>

 using namespace quda;

 #define MAX(a,b) ((a)>(b)?(a):(b))

 extern void usage(char** argv );

 extern QudaDslashType dslash_type;

 extern int test_type;

 QudaPrecision cpu_prec = QUDA_DOUBLE_PRECISION;
 QudaPrecision cuda_prec;

 QudaGaugeParam gaugeParam;
 QudaInvertParam inv_param;

 cpuGaugeField *cpuLink = NULL;

 cpuColorSpinorField *spinor, *spinorOut, *spinorRef, *tmpCpu;
 cudaColorSpinorField *cudaSpinor, *cudaSpinorOut;

 cudaColorSpinorField* tmp;

 void *hostGauge[4];
 void *links[4];

 #ifdef MULTI_GPU
 void **ghostLink;
 #endif

 QudaParity parity = QUDA_EVEN_PARITY;
 extern QudaDagType dagger;
 int transfer = 0; // include transfer time in the benchmark?
 extern int xdim;
 extern int ydim;
 extern int zdim;
 extern int tdim;
 extern int gridsize_from_cmdline[];
 extern QudaReconstructType link_recon;
 extern QudaPrecision prec;

 extern int device;
 extern bool verify_results;
 extern int niter;

 extern bool kernel_pack_t;

 extern double mass; // the mass of the Dirac operator

 int X[4];
 extern int Nsrc; // number of spinors to apply to simultaneously

 GaugeCovDev* dirac;

 const int nColor = 3;

 void init()
 {

   initQuda(device);

   setKernelPackT(kernel_pack_t);

   setVerbosity(QUDA_VERBOSE);

   gaugeParam = newQudaGaugeParam();
   inv_param = newQudaInvertParam();

   cuda_prec = prec;

   gaugeParam.X[0] = X[0] = xdim;
   gaugeParam.X[1] = X[1] = ydim;
   gaugeParam.X[2] = X[2] = zdim;
   gaugeParam.X[3] = X[3] = tdim;

   setDims(gaugeParam.X);
   Ls = 1;

   if (Nsrc != 1)
     printfQuda ("The covariant derivative doesn't support 5-d indexing, only source 0 will be tested.\n");

   setSpinorSiteSize(24);

   gaugeParam.cpu_prec = cpu_prec;
   gaugeParam.cuda_prec = cuda_prec;
   gaugeParam.reconstruct = link_recon;
   gaugeParam.reconstruct_sloppy = gaugeParam.reconstruct;
   gaugeParam.cuda_prec_sloppy = gaugeParam.cuda_prec;

   // ensure we use the right dslash
   dslash_type = QUDA_COVDEV_DSLASH;

   gaugeParam.anisotropy = 1.0;
   gaugeParam.tadpole_coeff = 0.8;
   gaugeParam.scale = 1.0;
   gaugeParam.type = QUDA_WILSON_LINKS;
   gaugeParam.gauge_order = QUDA_QDP_GAUGE_ORDER;
   gaugeParam.t_boundary = QUDA_ANTI_PERIODIC_T;
   gaugeParam.gauge_fix = QUDA_GAUGE_FIXED_NO;
   gaugeParam.gaugeGiB = 0;

   inv_param.cpu_prec = cpu_prec;
   inv_param.cuda_prec = cuda_prec;
   inv_param.dirac_order = QUDA_DIRAC_ORDER;
   inv_param.gamma_basis = QUDA_UKQCD_GAMMA_BASIS;
   inv_param.dagger = dagger;
   inv_param.matpc_type = QUDA_MATPC_EVEN_EVEN;
   inv_param.dslash_type = dslash_type;
   inv_param.mass = mass;

   inv_param.input_location = QUDA_CPU_FIELD_LOCATION;
   inv_param.output_location = QUDA_CPU_FIELD_LOCATION;

   int tmpint = MAX(X[1]*X[2]*X[3], X[0]*X[2]*X[3]);
   tmpint = MAX(tmpint, X[0]*X[1]*X[3]);
   tmpint = MAX(tmpint, X[0]*X[1]*X[2]);


   gaugeParam.ga_pad = tmpint;
   inv_param.sp_pad = tmpint;

   ColorSpinorParam csParam;
   csParam.nColor=nColor;
   csParam.nSpin=4;
   csParam.nDim=4;
   for(int d = 0; d < 4; d++) {
     csParam.x[d] = gaugeParam.X[d];
   }
 //  csParam.x[4] = Nsrc; // number of sources becomes the fifth dimension

   csParam.precision = inv_param.cpu_prec;
   csParam.pad = 0;
   inv_param.solution_type = QUDA_MAT_SOLUTION;
   csParam.siteSubset = QUDA_FULL_SITE_SUBSET;

   csParam.siteOrder = QUDA_EVEN_ODD_SITE_ORDER;
   csParam.fieldOrder  = QUDA_SPACE_SPIN_COLOR_FIELD_ORDER;
   csParam.gammaBasis = inv_param.gamma_basis; // this parameter is meaningless for staggered
   csParam.create = QUDA_ZERO_FIELD_CREATE;

   spinor = new cpuColorSpinorField(csParam);
   spinorOut = new cpuColorSpinorField(csParam);
   spinorRef = new cpuColorSpinorField(csParam);
   tmpCpu = new cpuColorSpinorField(csParam);

   csParam.siteSubset = QUDA_FULL_SITE_SUBSET;
   csParam.x[0] = gaugeParam.X[0];

   printfQuda("Randomizing fields ...\n");

   spinor->Source(QUDA_RANDOM_SOURCE);

   size_t gSize = (gaugeParam.cpu_prec == QUDA_DOUBLE_PRECISION) ? sizeof(double) : sizeof(float);

   for (int dir = 0; dir < 4; dir++) {
     links[dir] = malloc(V*gaugeSiteSize*gSize);

     if (links[dir] == NULL) {
       errorQuda("ERROR: malloc failed for gauge links");
     }
   }

   construct_gauge_field(links, 1, gaugeParam.cpu_prec, &gaugeParam);

 #ifdef MULTI_GPU
   gaugeParam.type = QUDA_SU3_LINKS;
   gaugeParam.reconstruct = QUDA_RECONSTRUCT_NO;
   GaugeFieldParam cpuParam(links, gaugeParam);
   cpuParam.ghostExchange = QUDA_GHOST_EXCHANGE_PAD;
   cpuLink   = new cpuGaugeField(cpuParam);
   ghostLink = cpuLink->Ghost();

   int x_face_size = X[1]*X[2]*X[3]/2;
   int y_face_size = X[0]*X[2]*X[3]/2;
   int z_face_size = X[0]*X[1]*X[3]/2;
   int t_face_size = X[0]*X[1]*X[2]/2;
   int pad_size = MAX(x_face_size, y_face_size);
   pad_size = MAX(pad_size, z_face_size);
   pad_size = MAX(pad_size, t_face_size);
   gaugeParam.ga_pad = pad_size;
 #endif

   gaugeParam.type = QUDA_SU3_LINKS;
   gaugeParam.reconstruct = gaugeParam.reconstruct_sloppy = link_recon;

   printfQuda("Links sending...");
   loadGaugeQuda(links, &gaugeParam);
   printfQuda("Links sent\n");

   printfQuda("Sending fields to GPU...");

   if (!transfer) {
     csParam.gammaBasis = QUDA_UKQCD_GAMMA_BASIS;
     csParam.pad = inv_param.sp_pad;
     csParam.precision = inv_param.cuda_prec;
     if (csParam.precision == QUDA_DOUBLE_PRECISION ) {
       csParam.fieldOrder = QUDA_FLOAT2_FIELD_ORDER;
     } else {
       /* Single and half */
       csParam.fieldOrder = QUDA_FLOAT4_FIELD_ORDER;
     }

     printfQuda("Creating cudaSpinor\n");
     cudaSpinor = new cudaColorSpinorField(csParam);

     printfQuda("Creating cudaSpinorOut\n");
     cudaSpinorOut = new cudaColorSpinorField(csParam);

     printfQuda("Sending spinor field to GPU\n");
     *cudaSpinor = *spinor;

     cudaDeviceSynchronize();
     checkCudaError();

     double spinor_norm2 = blas::norm2(*spinor);
     double cuda_spinor_norm2=  blas::norm2(*cudaSpinor);
     printfQuda("Source CPU = %f, CUDA=%f\n", spinor_norm2, cuda_spinor_norm2);

     csParam.siteSubset = QUDA_FULL_SITE_SUBSET;
     tmp = new cudaColorSpinorField(csParam);

     DiracParam diracParam;
     setDiracParam(diracParam, &inv_param, false);

     diracParam.tmp1=tmp;

     dirac = new GaugeCovDev(diracParam);

   } else {
     errorQuda("Error not suppported");
   }

   return;
 }

 void end(void)
 {
   for (int dir = 0; dir < 4; dir++) {
     free(links[dir]);
   }

   if (!transfer){
     delete dirac;
     delete cudaSpinor;
     delete cudaSpinorOut;
     delete tmp;
   }

   delete spinor;
   delete spinorOut;
   delete spinorRef;
   delete tmpCpu;

   if (cpuLink) delete cpuLink;

   endQuda();
 }

 double dslashCUDA(int niter, int mu) {

   cudaEvent_t start, end;
   cudaEventCreate(&start);
   cudaEventRecord(start, 0);
   cudaEventSynchronize(start);

   for (int i = 0; i < niter; i++) {
     if (transfer){
       //MatQuda(spinorGPU, spinor, &inv_param);
     } else {
         dirac->MCD(*cudaSpinorOut, *cudaSpinor, mu);
     }
   }

   cudaEventCreate(&end);
   cudaEventRecord(end, 0);
   cudaEventSynchronize(end);
   float runTime;
   cudaEventElapsedTime(&runTime, start, end);
   cudaEventDestroy(start);
   cudaEventDestroy(end);

   double secs = runTime / 1000; //stopwatchReadSeconds();

   // check for errors
   cudaError_t stat = cudaGetLastError();
   if (stat != cudaSuccess)
     errorQuda("with ERROR: %s\n", cudaGetErrorString(stat));

   return secs;
 }

 void covdevRef(int mu)
 {

   // compare to dslash reference implementation
   printfQuda("Calculating reference implementation...");
   fflush(stdout);
 #ifdef MULTI_GPU
   mat_mg4dir(spinorRef, links, ghostLink, spinor, dagger, mu, inv_param.cpu_prec, gaugeParam.cpu_prec);
 #else
   mat(spinorRef->V(), links, spinor->V(), dagger, mu, inv_param.cpu_prec, gaugeParam.cpu_prec);
 #endif
   printfQuda("done.\n");

 }

 TEST(dslash, verify) {
   double deviation = pow(10, -(double)(cpuColorSpinorField::Compare(*spinorRef, *spinorOut)));
   double tol = (inv_param.cuda_prec == QUDA_DOUBLE_PRECISION ? 1e-12 :
     (inv_param.cuda_prec == QUDA_SINGLE_PRECISION ? 1e-3 : 1e-1));
   ASSERT_LE(deviation, tol) << "CPU and CUDA implementations do not agree";
 }

 static int dslashTest()
 {
   // return code for google test
   int test_rc = 0;
   init();

   int attempts = 1;

   for (int i=0; i<attempts; i++) {
     for (int mu=0; mu<4; mu++) { // We test all directions in one go
       int muCuda = mu + (dagger ? 4 : 0);
       int muCpu  = mu*2 + (dagger ? 1 : 0);

       { // warm-up run
         printfQuda("Tuning...\n");
         dslashCUDA(1,muCuda);
       }
       printfQuda("Executing %d kernel loops...", niter);

       double secs = dslashCUDA(niter, muCuda);

       if (!transfer) *spinorOut = *cudaSpinorOut;

       printfQuda("\n%fms per loop\n", 1000*secs);
       covdevRef(muCpu);

       unsigned long long flops = niter * 8*nColor*nColor*2*(long long)cudaSpinor->VolumeCB();
       printfQuda("GFLOPS = %f\n", 1.0e-9*flops/secs);
       printfQuda("Effective halo bi-directional bandwidth = %f for aggregate message size %lu bytes\n",
      1.0e-9*2*cudaSpinor->GhostBytes()*niter/secs, 2*cudaSpinor->GhostBytes());

       double spinor_ref_norm2 = blas::norm2(*spinorRef);
       double spinor_out_norm2 =  blas::norm2(*spinorOut);

       if (!transfer) {
         double cuda_spinor_out_norm2 =  blas::norm2(*cudaSpinorOut);
         printfQuda("Results mu = %d: CPU=%f, CUDA=%f, CPU-CUDA=%f\n", mu, spinor_ref_norm2, cuda_spinor_out_norm2,
        spinor_out_norm2);
       } else {
         printfQuda("Result mu = %d: CPU=%f , CPU-CUDA=%f", mu, spinor_ref_norm2, spinor_out_norm2);
       }

       if (verify_results) {
         test_rc = RUN_ALL_TESTS();
         if (test_rc != 0) warningQuda("Tests failed");
       }
     }  // Directions
   }

   end();

   return test_rc;
 }


 void display_test_info()
 {
   printfQuda("running the following test:\n");

   printfQuda("prec recon   test_type     dagger   S_dim         T_dimension\n");
   printfQuda("%s   %s       %d           %d       %d/%d/%d        %d \n",
       get_prec_str(prec), get_recon_str(link_recon),
       test_type, dagger, xdim, ydim, zdim, tdim);
   printfQuda("Grid partition info:     X  Y  Z  T\n");
   printfQuda("                         %d  %d  %d  %d\n",
       dimPartitioned(0),
       dimPartitioned(1),
       dimPartitioned(2),
       dimPartitioned(3));

   return ;

 }


   void
 usage_extra(char** argv )
 {
   return ;
 }

 int main(int argc, char **argv)
 {
   // initalize google test
   ::testing::InitGoogleTest(&argc, argv);
   for (int i=1 ;i < argc; i++){

     if(process_command_line_option(argc, argv, &i) == 0){
       continue;
     }

     fprintf(stderr, "ERROR: Invalid option:%s\n", argv[i]);
     usage(argv);
   }

   initComms(argc, argv, gridsize_from_cmdline);

   display_test_info();

   // return result of RUN_ALL_TESTS
   int test_rc = dslashTest();

   finalizeComms();

   return test_rc;
 }

invert_quda.h

dimPartitioned
int dimPartitioned(int dim)
Definition: test_util.cpp:1686

QudaInvertParam_s::dirac_order
QudaDiracFieldOrder dirac_order
Definition: quda.h:195

QUDA_VERBOSE
Definition: enum_quda.h:237

QudaGaugeParam_s::reconstruct_sloppy
QudaReconstructType reconstruct_sloppy
Definition: quda.h:46

QudaGaugeParam_s::anisotropy
double anisotropy
Definition: quda.h:31

QUDA_RECONSTRUCT_NO
Definition: enum_quda.h:66

quda::LatticeFieldParam::ghostExchange
QudaGhostExchange ghostExchange
Definition: lattice_field.h:60

gaugeParam
QudaGaugeParam gaugeParam
Definition: covdev_test.cpp:36

QUDA_MAT_SOLUTION
Definition: enum_quda.h:130

endQuda
void endQuda(void)
Definition: interface_quda.cpp:1290

free
void free(void *)

construct_gauge_field
void construct_gauge_field(void **gauge, int type, QudaPrecision precision, QudaGaugeParam *param)
Definition: test_util.cpp:1054

mu
double mu
Definition: test_util.cpp:1643

QudaPrecision
enum QudaPrecision_s QudaPrecision

init
void init()
Definition: covdev_test.cpp:79

QudaGaugeParam_s::ga_pad
int ga_pad
Definition: quda.h:53

misc.h

mass
double mass
Definition: staggered_invertmsrc_test.cpp:71

QudaGaugeParam_s::gauge_fix
QudaGaugeFixed gauge_fix
Definition: quda.h:51

quda::ColorSpinorParam::nColor
int nColor
Definition: color_spinor_field.h:85

QudaGaugeParam_s::type
QudaLinkType type
Definition: quda.h:35

fflush
int fflush(FILE *)

usage
void usage(char **argv)
Definition: test_util.cpp:1693

verify_results
bool verify_results
Definition: test_util.cpp:1641

errorQuda
#define errorQuda(...)
Definition: util_quda.h:90

quda::blas::norm2
double norm2(const ColorSpinorField &a)
Definition: reduce_quda.cu:241

QudaInvertParam_s::dslash_type
QudaDslashType dslash_type
Definition: quda.h:93

QUDA_GAUGE_FIXED_NO
Definition: enum_quda.h:76

quda::ColorSpinorField::VolumeCB
int VolumeCB() const
Definition: color_spinor_field.h:370

start
cudaEvent_t start
Definition: CMakeCUDACompilerId.cpp1.ii:2453

test_util.h

QudaInvertParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:191

QUDA_SPACE_SPIN_COLOR_FIELD_ORDER
Definition: enum_quda.h:321

tmpCpu
cpuColorSpinorField * tmpCpu
Definition: covdev_test.cpp:41

QUDA_QDP_GAUGE_ORDER
Definition: enum_quda.h:41

loadGaugeQuda
void loadGaugeQuda(void *h_gauge, QudaGaugeParam *param)
Definition: interface_quda.cpp:602

covdev_reference.h

links
void * links[4]
Definition: covdev_test.cpp:47

QUDA_WILSON_LINKS
Definition: enum_quda.h:29

QudaInvertParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:190

process_command_line_option
int process_command_line_option(int argc, char **argv, int *idx)
Definition: test_util.cpp:1795

quda::cpuColorSpinorField::Source
void Source(const QudaSourceType sourceType, const int st=0, const int s=0, const int c=0)
Definition: cpu_color_spinor_field.cpp:245

tmp
cudaColorSpinorField * tmp
Definition: covdev_test.cpp:44

QUDA_FULL_SITE_SUBSET
Definition: enum_quda.h:304

QUDA_COVDEV_DSLASH
Definition: enum_quda.h:96

quda::LatticeFieldParam::precision
QudaPrecision precision
Definition: lattice_field.h:54

QudaInvertParam_s::dagger
QudaDagType dagger
Definition: quda.h:184

finalizeComms
void finalizeComms()
Definition: test_util.cpp:107

quda::cudaColorSpinorField
Definition: color_spinor_field.h:504

end
void end(void)
Definition: covdev_test.cpp:258

dslashTest
static int dslashTest()
Definition: covdev_test.cpp:336

QudaGaugeParam_s::gauge_order
QudaGaugeFieldOrder gauge_order
Definition: quda.h:36

util_quda.h

usage_extra
void usage_extra(char **argv)
Definition: covdev_test.cpp:412

get_prec_str
const char * get_prec_str(QudaPrecision prec)
Definition: misc.cpp:704

QUDA_UKQCD_GAMMA_BASIS
Definition: enum_quda.h:339

dslash_type
QudaDslashType dslash_type
Definition: test_util.cpp:1626

quda
Definition: blas_cublas.h:6

quda::LatticeFieldParam::siteSubset
QudaSiteSubset siteSubset
Definition: lattice_field.h:55

setDims
void setDims(int *)
Definition: test_util.cpp:130

QudaInvertParam_s::input_location
QudaFieldLocation input_location
Definition: quda.h:90

dirac_quda.h

cpu_prec
QudaPrecision cpu_prec
Definition: covdev_test.cpp:33

gSize
static size_t gSize
Definition: llfat_test.cpp:36

Ls
int Ls
Definition: test_util.cpp:39

prec
QudaPrecision prec
Definition: test_util.cpp:1615

quda::setDiracParam
void setDiracParam(DiracParam &diracParam, QudaInvertParam *inv_param, bool pc)
Definition: interface_quda.cpp:1386

QudaInvertParam_s::solution_type
QudaSolutionType solution_type
Definition: quda.h:181

return
else return(__swbuf(_c, _p))

quda::LatticeFieldParam::x
int x[QUDA_MAX_DIM]
Definition: lattice_field.h:50

quda::GaugeFieldParam
Definition: gauge_field.h:10

quda::DiracParam
Definition: dirac_quda.h:19

QudaGaugeParam_s::scale
double scale
Definition: quda.h:33

initQuda
void initQuda(int device)
Definition: interface_quda.cpp:546

QUDA_EVEN_ODD_SITE_ORDER
Definition: enum_quda.h:311

tol
double tol
Definition: test_util.cpp:1647

QudaInvertParam_s::output_location
QudaFieldLocation output_location
Definition: quda.h:91

malloc
void * malloc(size_t __size) __attribute__((__warn_unused_result__)) __attribute__((alloc_size(1)))

inv_param
QudaInvertParam inv_param
Definition: covdev_test.cpp:37

QudaGaugeParam_s
Definition: quda.h:25

quda::ColorSpinorParam::fieldOrder
QudaFieldOrder fieldOrder
Definition: color_spinor_field.h:92

link_recon
QudaReconstructType link_recon
Definition: test_util.cpp:1612

cuda_prec
QudaPrecision cuda_prec
Definition: covdev_test.cpp:34

nColor
const int nColor
Definition: covdev_test.cpp:77

setSpinorSiteSize
void setSpinorSiteSize(int n)
Definition: test_util.cpp:192

MAX
#define MAX(a, b)
Definition: covdev_test.cpp:25

csParam
ColorSpinorParam csParam
Definition: pack_test.cpp:24

zdim
int zdim
Definition: test_util.cpp:1622

newQudaInvertParam
QudaInvertParam newQudaInvertParam(void)

get_recon_str
const char * get_recon_str(QudaReconstructType recon)
Definition: misc.cpp:770

quda::cpuGaugeField
Definition: gauge_field.h:464

display_test_info
void display_test_info()
Definition: covdev_test.cpp:391

V
int V
Definition: test_util.cpp:28

quda::ColorSpinorParam::gammaBasis
QudaGammaBasis gammaBasis
Definition: color_spinor_field.h:93

spinorOut
cpuColorSpinorField * spinorOut
Definition: covdev_test.cpp:41

gaugeSiteSize
#define gaugeSiteSize
Definition: test_util.h:6

fused_exterior_ndeg_tm_dslash_cuda_gen.i
int i
start here
Definition: fused_exterior_ndeg_tm_dslash_cuda_gen.py:816

warningQuda
#define warningQuda(...)
Definition: util_quda.h:101

quda::pow
__host__ __device__ ValueType pow(ValueType x, ExponentType e)
Definition: complex_quda.h:100

QudaInvertParam_s::gamma_basis
QudaGammaBasis gamma_basis
Definition: quda.h:197

QUDA_FLOAT2_FIELD_ORDER
Definition: enum_quda.h:319

QudaGaugeParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:45

quda::GaugeField::Ghost
const void ** Ghost() const
Definition: gauge_field.h:254

cudaSpinor
cudaColorSpinorField * cudaSpinor
Definition: covdev_test.cpp:42

dslash_util.h

niter
int niter
Definition: test_util.cpp:1630

main
int main(int argc, char **argv)
Definition: covdev_test.cpp:417

cudaSpinorOut
cudaColorSpinorField * cudaSpinorOut
Definition: covdev_test.cpp:42

X
int X[4]
Definition: covdev_test.cpp:72

QudaDagType
enum QudaDagType_s QudaDagType

QudaParity
enum QudaParity_s QudaParity

QudaGaugeParam_s::reconstruct
QudaReconstructType reconstruct
Definition: quda.h:43

QudaGaugeParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:42

QudaGaugeParam_s::X
int X[4]
Definition: quda.h:29

QudaInvertParam_s::mass
double mass
Definition: quda.h:96

fprintf
int fprintf(FILE *, const char *,...) __attribute__((__format__(__printf__

covdevRef
void covdevRef(int mu)
Definition: covdev_test.cpp:314

device
int device
Definition: CMakeCUDACompilerId.cpp1.ii:2238

quda::LatticeFieldParam::nDim
int nDim
Definition: lattice_field.h:47

quda::cpuColorSpinorField::Compare
static int Compare(const cpuColorSpinorField &a, const cpuColorSpinorField &b, const int resolution=1)
Definition: cpu_color_spinor_field.cpp:249

QudaInvertParam_s::sp_pad
int sp_pad
Definition: quda.h:221

blas_quda.h

TEST
TEST(dslash, verify)
Definition: covdev_test.cpp:329

quda::ColorSpinorParam
Definition: color_spinor_field.h:80

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:61

dirac
GaugeCovDev * dirac
Definition: covdev_test.cpp:75

QudaGaugeParam_s::tadpole_coeff
double tadpole_coeff
Definition: quda.h:32

QudaGaugeParam_s::gaugeGiB
double gaugeGiB
Definition: quda.h:60

tdim
int tdim
Definition: test_util.cpp:1623

ydim
int ydim
Definition: test_util.cpp:1621

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:60

quda::ColorSpinorParam::nSpin
int nSpin
Definition: color_spinor_field.h:86

QudaReconstructType
enum QudaReconstructType_s QudaReconstructType

quda.h
Main header file for the QUDA library.

dslash_quda.h

Nsrc
int Nsrc
Definition: test_util.cpp:1628

printfQuda
#define printfQuda(...)
Definition: util_quda.h:84

QudaGaugeParam_s::t_boundary
QudaTboundary t_boundary
Definition: quda.h:38

kernel_pack_t
bool kernel_pack_t
Definition: test_util.cpp:1650

quda::blas::flops
unsigned long long flops
Definition: blas_quda.cu:42

quda::ColorSpinorParam::siteOrder
QudaSiteOrder siteOrder
Definition: color_spinor_field.h:90

e
return e
Definition: CMakeCUDACompilerId.cpp1.ii:3026

QUDA_DIRAC_ORDER
Definition: enum_quda.h:215

transfer
int transfer
Definition: covdev_test.cpp:55

QudaDslashType
enum QudaDslashType_s QudaDslashType

QUDA_ANTI_PERIODIC_T
Definition: enum_quda.h:53

QUDA_RANDOM_SOURCE
Definition: enum_quda.h:346

quda::setKernelPackT
void setKernelPackT(bool pack)
Definition: dslash_quda.cu:59

xdim
int xdim
Definition: test_util.cpp:1620

spinorRef
cpuColorSpinorField * spinorRef
Definition: covdev_test.cpp:41

hostGauge
void * hostGauge[4]
Definition: covdev_test.cpp:46

gridsize_from_cmdline
int gridsize_from_cmdline[]
Definition: test_util.cpp:50

QUDA_EVEN_PARITY
Definition: enum_quda.h:259

cpuLink
cpuGaugeField * cpuLink
Definition: covdev_test.cpp:39

checkCudaError
#define checkCudaError()
Definition: util_quda.h:129

QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:331

float
float
Definition: CMakeCUDACompilerId.cpp1.ii:12791

QUDA_FLOAT4_FIELD_ORDER
Definition: enum_quda.h:320

quda::ColorSpinorParam::create
QudaFieldCreate create
Definition: color_spinor_field.h:94

QUDA_GHOST_EXCHANGE_PAD
Definition: enum_quda.h:435

mat
void mat(void *out, void **link, void *in, int dagger_bit, int mu, QudaPrecision sPrecision, QudaPrecision gPrecision)
Definition: covdev_reference.cpp:117

mat_mg4dir
void mat_mg4dir(cpuColorSpinorField *out, void **link, void **ghostLink, cpuColorSpinorField *in, int daggerBit, int mu, QudaPrecision sPrecision, QudaPrecision gPrecision)

d
static __inline__ size_t size_t d
Definition: CMakeCUDACompilerId.cpp1.ii:3019

QUDA_MATPC_EVEN_EVEN
Definition: enum_quda.h:182

dagger
QudaDagType dagger
Definition: deg_tm_dslash_cuda_gen.py:960

quda::ColorSpinorField::GhostBytes
size_t GhostBytes() const
Definition: color_spinor_field.h:374

QUDA_SU3_LINKS
Definition: enum_quda.h:23

dslashCUDA
double dslashCUDA(int niter, int mu)
Definition: covdev_test.cpp:281

parity
QudaParity parity
Definition: covdev_test.cpp:53

QudaInvertParam_s
Definition: quda.h:88

quda::GaugeCovDev
Full Covariant Derivative operator. Although not a Dirac operator per se, it&#39;s a linear operator so i...
Definition: dirac_quda.h:948

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:296

initComms
void initComms(int argc, char **argv, const int *commDims)
Definition: test_util.cpp:72

gauge_field.h

setVerbosity
void setVerbosity(const QudaVerbosity verbosity)
Definition: util_quda.cpp:24

QudaInvertParam_s::matpc_type
QudaMatPCType matpc_type
Definition: quda.h:183

quda::DiracParam::tmp1
ColorSpinorField * tmp1
Definition: dirac_quda.h:40

dslash
Definition: dslash_events.cuh:1

spinor
cpuColorSpinorField * spinor
Definition: covdev_test.cpp:41

quda::cpuColorSpinorField
Definition: color_spinor_field.h:789

QudaGaugeParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:40

quda::ColorSpinorField::V
void * V()
Definition: color_spinor_field.h:380

quda::GaugeCovDev::MCD
virtual void MCD(ColorSpinorField &out, const ColorSpinorField &in, const int mu) const
Definition: gauge_covdev.cpp:30

newQudaGaugeParam
QudaGaugeParam newQudaGaugeParam(void)

test_type
int test_type
Definition: test_util.cpp:1634

quda_internal.h

quda::LatticeFieldParam::pad
int pad
Definition: lattice_field.h:52