quda-ref/v0.7.0/staggered__dslash__test_8cpp_source.html

 #include <iostream>

 #include <stdio.h>

 #include <stdlib.h>

 #include <string.h>


 #include <quda.h>

 #include <quda_internal.h>

 #include <dirac_quda.h>

 #include <dslash_quda.h>

 #include <invert_quda.h>

 #include <util_quda.h>

 #include <blas_quda.h>


 #include <misc.h>

 #include <test_util.h>

 #include <dslash_util.h>

 #include <staggered_dslash_reference.h>

 #include <gauge_field.h>


 #include <face_quda.h>


 #include <assert.h>

 #include <gtest.h>


 using namespace quda;


 #define MAX(a,b) ((a)>(b)?(a):(b))

 #define staggeredSpinorSiteSize 6

 // What test are we doing (0 = dslash, 1 = MatPC, 2 = Mat)


 extern void usage(char** argv );


 extern QudaDslashType dslash_type;


 extern int test_type;


 extern bool tune;


 QudaGaugeParam gaugeParam;

 QudaInvertParam inv_param;


 cpuGaugeField *cpuFat = NULL;

 cpuGaugeField *cpuLong = NULL;


 cpuColorSpinorField *spinor, *spinorOut, *spinorRef;

 cudaColorSpinorField *cudaSpinor, *cudaSpinorOut;


 cudaColorSpinorField* tmp;


 void *hostGauge[4];

 void *fatlink[4], *longlink[4];


 #ifdef MULTI_GPU

 const void **ghost_fatlink, **ghost_longlink;

 #endif


 const int loops = 100;


 QudaParity parity;

 extern QudaDagType dagger;

 int transfer = 0; // include transfer time in the benchmark?

 extern int xdim;

 extern int ydim;

 extern int zdim;

 extern int tdim;

 extern int gridsize_from_cmdline[];

 extern QudaReconstructType link_recon;

 extern QudaPrecision prec;


 extern int device;

 extern bool verify_results;


 extern bool kernel_pack_t;


 int X[4];


 Dirac* dirac;


 void init()

 {


   initQuda(device);


   setKernelPackT(kernel_pack_t);


   setVerbosity(QUDA_VERBOSE);


   gaugeParam = newQudaGaugeParam();

   inv_param = newQudaInvertParam();


   gaugeParam.X[0] = X[0] = xdim;

   gaugeParam.X[1] = X[1] = ydim;

   gaugeParam.X[2] = X[2] = zdim;

   gaugeParam.X[3] = X[3] = tdim;


   setDims(gaugeParam.X);

   setSpinorSiteSize(6);


   gaugeParam.cpu_prec = QUDA_DOUBLE_PRECISION;

   gaugeParam.cuda_prec = prec;

   gaugeParam.reconstruct = link_recon;

   gaugeParam.reconstruct_sloppy = gaugeParam.reconstruct;

   gaugeParam.cuda_prec_sloppy = gaugeParam.cuda_prec;


   gaugeParam.anisotropy = 1.0;

   gaugeParam.tadpole_coeff = 0.8;

   gaugeParam.scale = -1.0/(24.0*gaugeParam.tadpole_coeff*gaugeParam.tadpole_coeff);

   gaugeParam.gauge_order = QUDA_QDP_GAUGE_ORDER;

   gaugeParam.t_boundary = QUDA_ANTI_PERIODIC_T;

   gaugeParam.gauge_fix = QUDA_GAUGE_FIXED_NO;

   gaugeParam.gaugeGiB = 0;


   inv_param.cpu_prec = QUDA_DOUBLE_PRECISION;

   inv_param.cuda_prec = prec;

   inv_param.dirac_order = QUDA_DIRAC_ORDER;

   inv_param.gamma_basis = QUDA_DEGRAND_ROSSI_GAMMA_BASIS;

   inv_param.dagger = dagger;

   inv_param.matpc_type = QUDA_MATPC_EVEN_EVEN;

   inv_param.dslash_type = dslash_type;


   // ensure that the default is improved staggered

   if (inv_param.dslash_type != QUDA_STAGGERED_DSLASH &&

       inv_param.dslash_type != QUDA_ASQTAD_DSLASH)

     inv_param.dslash_type = QUDA_ASQTAD_DSLASH;


   inv_param.input_location = QUDA_CPU_FIELD_LOCATION;

   inv_param.output_location = QUDA_CPU_FIELD_LOCATION;


   int tmpint = MAX(X[1]*X[2]*X[3], X[0]*X[2]*X[3]);

   tmpint = MAX(tmpint, X[0]*X[1]*X[3]);

   tmpint = MAX(tmpint, X[0]*X[1]*X[2]);


   gaugeParam.ga_pad = tmpint;

   inv_param.sp_pad = tmpint;


   ColorSpinorParam csParam;

   csParam.nColor=3;

   csParam.nSpin=1;

   csParam.nDim=4;

   for(int d = 0; d < 4; d++) {

     csParam.x[d] = gaugeParam.X[d];

   }

   csParam.precision = inv_param.cpu_prec;

   csParam.pad = 0;

   if (test_type < 2) {

     inv_param.solution_type = QUDA_MATPC_SOLUTION;

     csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;

     csParam.x[0] /= 2;

   } else {

     inv_param.solution_type = QUDA_MAT_SOLUTION;

     csParam.siteSubset = QUDA_FULL_SITE_SUBSET;

   }


   csParam.siteOrder = QUDA_EVEN_ODD_SITE_ORDER;

   csParam.fieldOrder  = QUDA_SPACE_SPIN_COLOR_FIELD_ORDER;

   csParam.gammaBasis = inv_param.gamma_basis; // this parameter is meaningless for staggered

   csParam.create = QUDA_ZERO_FIELD_CREATE;


   spinor = new cpuColorSpinorField(csParam);

   spinorOut = new cpuColorSpinorField(csParam);

   spinorRef = new cpuColorSpinorField(csParam);


   csParam.siteSubset = QUDA_FULL_SITE_SUBSET;

   csParam.x[0] = gaugeParam.X[0];


   printfQuda("Randomizing fields ...\n");


   spinor->Source(QUDA_RANDOM_SOURCE);


   size_t gSize = (gaugeParam.cpu_prec == QUDA_DOUBLE_PRECISION) ? sizeof(double) : sizeof(float);


   for (int dir = 0; dir < 4; dir++) {

     fatlink[dir] = malloc(V*gaugeSiteSize*gSize);

     longlink[dir] = malloc(V*gaugeSiteSize*gSize);

   }

   if (fatlink == NULL || longlink == NULL){

     errorQuda("ERROR: malloc failed for fatlink/longlink");

   }

   construct_fat_long_gauge_field(fatlink, longlink, 1, gaugeParam.cpu_prec, &gaugeParam, dslash_type);


   if(link_recon == QUDA_RECONSTRUCT_9 || link_recon == QUDA_RECONSTRUCT_13){ // incorporate non-trivial phase into long links

     const double cos_pi_3 = 0.5; // Cos(pi/3)

     const double sin_pi_3 = sqrt(0.75); // Sin(pi/3)

     for(int dir=0; dir<4; ++dir){

       for(int i=0; i<V; ++i){

         for(int j=0; j<gaugeSiteSize; j+=2){

           if(gaugeParam.cpu_prec == QUDA_DOUBLE_PRECISION){

             const double real = ((double*)longlink[dir])[i*gaugeSiteSize + j];

             const double imag = ((double*)longlink[dir])[i*gaugeSiteSize + j + 1];

             ((double*)longlink[dir])[i*gaugeSiteSize + j] = real*cos_pi_3 - imag*sin_pi_3;

             ((double*)longlink[dir])[i*gaugeSiteSize + j + 1] = real*sin_pi_3 + imag*cos_pi_3;

           }else{

             const float real = ((float*)longlink[dir])[i*gaugeSiteSize + j];

             const float imag = ((float*)longlink[dir])[i*gaugeSiteSize + j + 1];

             ((float*)longlink[dir])[i*gaugeSiteSize + j] = real*cos_pi_3 - imag*sin_pi_3;

             ((float*)longlink[dir])[i*gaugeSiteSize + j + 1] = real*sin_pi_3 + imag*cos_pi_3;

           }

         }

       }

     }

   }


 #ifdef MULTI_GPU

   gaugeParam.type = QUDA_ASQTAD_FAT_LINKS;

   gaugeParam.reconstruct = QUDA_RECONSTRUCT_NO;

   GaugeFieldParam cpuFatParam(fatlink, gaugeParam);

   cpuFat = new cpuGaugeField(cpuFatParam);

   ghost_fatlink = cpuFat->Ghost();


   gaugeParam.type = QUDA_ASQTAD_LONG_LINKS;

   GaugeFieldParam cpuLongParam(longlink, gaugeParam);

   cpuLong = new cpuGaugeField(cpuLongParam);

   ghost_longlink = cpuLong->Ghost();


   int x_face_size = X[1]*X[2]*X[3]/2;

   int y_face_size = X[0]*X[2]*X[3]/2;

   int z_face_size = X[0]*X[1]*X[3]/2;

   int t_face_size = X[0]*X[1]*X[2]/2;

   int pad_size =MAX(x_face_size, y_face_size);

   pad_size = MAX(pad_size, z_face_size);

   pad_size = MAX(pad_size, t_face_size);

   gaugeParam.ga_pad = pad_size;

 #endif


   gaugeParam.type = QUDA_ASQTAD_FAT_LINKS;

   gaugeParam.reconstruct = gaugeParam.reconstruct_sloppy = QUDA_RECONSTRUCT_NO;


   printfQuda("Fat links sending...");

   loadGaugeQuda(fatlink, &gaugeParam);

   printfQuda("Fat links sent\n");


   gaugeParam.type = QUDA_ASQTAD_LONG_LINKS;


 #ifdef MULTI_GPU

   gaugeParam.ga_pad = 3*pad_size;

 #endif


   gaugeParam.reconstruct = gaugeParam.reconstruct_sloppy = link_recon;

   printfQuda("Long links sending...");

   loadGaugeQuda(longlink, &gaugeParam);

   printfQuda("Long links sent...\n");


   printfQuda("Sending fields to GPU...");


   if (!transfer) {


     csParam.fieldOrder = QUDA_FLOAT2_FIELD_ORDER;

     csParam.pad = inv_param.sp_pad;

     csParam.precision = inv_param.cuda_prec;

     if (test_type < 2){

       csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;

       csParam.x[0] /=2;

     }


     printfQuda("Creating cudaSpinor\n");

     cudaSpinor = new cudaColorSpinorField(csParam);


     printfQuda("Creating cudaSpinorOut\n");

     cudaSpinorOut = new cudaColorSpinorField(csParam);


     printfQuda("Sending spinor field to GPU\n");

     *cudaSpinor = *spinor;


     cudaDeviceSynchronize();

     checkCudaError();


     double spinor_norm2 = norm2(*spinor);

     double cuda_spinor_norm2=  norm2(*cudaSpinor);

     printfQuda("Source CPU = %f, CUDA=%f\n", spinor_norm2, cuda_spinor_norm2);


     if(test_type == 2){

       csParam.x[0] /=2;

     }

     csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;

     tmp = new cudaColorSpinorField(csParam);


     bool pc = (test_type != 2);

     DiracParam diracParam;

     setDiracParam(diracParam, &inv_param, pc);


     diracParam.tmp1=tmp;


     dirac = Dirac::create(diracParam);


   } else {

     errorQuda("Error not suppported");

   }


   return;

 }


 void end(void)

 {

   for (int dir = 0; dir < 4; dir++) {

     free(fatlink[dir]);

     free(longlink[dir]);

   }


   if (!transfer){

     delete dirac;

     delete cudaSpinor;

     delete cudaSpinorOut;

     delete tmp;

   }


   delete spinor;

   delete spinorOut;

   delete spinorRef;


   if (cpuFat) delete cpuFat;

   if (cpuLong) delete cpuLong;


   endQuda();

 }


 double dslashCUDA(int niter) {


   cudaEvent_t start, end;

   cudaEventCreate(&start);

   cudaEventRecord(start, 0);

   cudaEventSynchronize(start);


   for (int i = 0; i < niter; i++) {

     switch (test_type) {

       case 0:

         parity = QUDA_EVEN_PARITY;

         if (transfer){

           //dslashQuda(spinorOdd, spinorEven, &inv_param, parity);

         } else {

           dirac->Dslash(*cudaSpinorOut, *cudaSpinor, parity);

         }

         break;

       case 1:

         parity = QUDA_ODD_PARITY;

         if (transfer){

           //MatPCQuda(spinorOdd, spinorEven, &inv_param);

         } else {

           dirac->Dslash(*cudaSpinorOut, *cudaSpinor, parity);

         }

         break;

       case 2:

         errorQuda("Staggered operator acting on full-site not supported");

         if (transfer){

           //MatQuda(spinorGPU, spinor, &inv_param);

         } else {

           dirac->M(*cudaSpinorOut, *cudaSpinor);

         }

     }

   }


   cudaEventCreate(&end);

   cudaEventRecord(end, 0);

   cudaEventSynchronize(end);

   float runTime;

   cudaEventElapsedTime(&runTime, start, end);

   cudaEventDestroy(start);

   cudaEventDestroy(end);


   double secs = runTime / 1000; //stopwatchReadSeconds();


   // check for errors

   cudaError_t stat = cudaGetLastError();

   if (stat != cudaSuccess)

     errorQuda("with ERROR: %s\n", cudaGetErrorString(stat));


   return secs;

 }


 void staggeredDslashRef()

 {

 #ifndef MULTI_GPU

   int cpu_parity = 0;

 #endif


   // compare to dslash reference implementation

   printfQuda("Calculating reference implementation...");

   fflush(stdout);

   switch (test_type) {

     case 0:

 #ifdef MULTI_GPU


       staggered_dslash_mg4dir(spinorRef, fatlink, longlink, (void**)ghost_fatlink, (void**)ghost_longlink,

           spinor, parity, dagger, inv_param.cpu_prec, gaugeParam.cpu_prec);

 #else

       cpu_parity = 0; //EVEN

       staggered_dslash(spinorRef->V(), fatlink, longlink, spinor->V(), cpu_parity, dagger,

           inv_param.cpu_prec, gaugeParam.cpu_prec);


 #endif


       break;

     case 1:

 #ifdef MULTI_GPU

       staggered_dslash_mg4dir(spinorRef, fatlink, longlink, (void**)ghost_fatlink, (void**)ghost_longlink,

           spinor, parity, dagger, inv_param.cpu_prec, gaugeParam.cpu_prec);


 #else

       cpu_parity=1; //ODD

       staggered_dslash(spinorRef->V(), fatlink, longlink, spinor->V(), cpu_parity, dagger,

           inv_param.cpu_prec, gaugeParam.cpu_prec);

 #endif

       break;

     case 2:

       //mat(spinorRef->V(), fatlink, longlink, spinor->V(), kappa, dagger,

       //inv_param.cpu_prec, gaugeParam.cpu_prec);

       break;

     default:

       errorQuda("Test type not defined");

   }


   printfQuda("done.\n");


 }


 TEST(dslash, verify) {

   double deviation = pow(10, -(double)(cpuColorSpinorField::Compare(*spinorRef, *spinorOut)));

   double tol = (inv_param.cuda_prec == QUDA_DOUBLE_PRECISION ? 1e-12 :

                 (inv_param.cuda_prec == QUDA_SINGLE_PRECISION ? 1e-3 : 1e-1));

   ASSERT_LE(deviation, tol) << "CPU and CUDA implementations do not agree";

 }


 static int dslashTest(int argc, char **argv)

 {

   int accuracy_level = 0;


   init();


   int attempts = 1;


   for (int i=0; i<attempts; i++) {


     if (tune) { // warm-up run

       printfQuda("Tuning...\n");

       setTuning(QUDA_TUNE_YES);

       dslashCUDA(1);

     }

     printfQuda("Executing %d kernel loops...", loops);

     double secs = dslashCUDA(loops);


     if (!transfer) *spinorOut = *cudaSpinorOut;


     printfQuda("\n%fms per loop\n", 1000*secs);

     staggeredDslashRef();


     unsigned long long flops = dirac->Flops();

     int link_floats = 8*gaugeParam.reconstruct+8*18;

     int spinor_floats = 8*6*2 + 6;

     int link_float_size = prec;

     int spinor_float_size = 0;


     link_floats = test_type ? (2*link_floats) : link_floats;

     spinor_floats = test_type ? (2*spinor_floats) : spinor_floats;


     int bytes_for_one_site = link_floats * link_float_size + spinor_floats * spinor_float_size;

     if (prec == QUDA_HALF_PRECISION) bytes_for_one_site += (8*2 + 1)*4;


     printfQuda("GFLOPS = %f\n", 1.0e-9*flops/secs);

     printfQuda("GB/s = %f\n\n", 1.0*Vh*bytes_for_one_site/((secs/loops)*1e+9));


     double norm2_cpu = norm2(*spinorRef);

     double norm2_cpu_cuda= norm2(*spinorOut);

     if (!transfer) {

       double norm2_cuda= norm2(*cudaSpinorOut);

       printfQuda("Results: CPU = %f, CUDA=%f, CPU-CUDA = %f\n", norm2_cpu, norm2_cuda, norm2_cpu_cuda);

     } else {

       printfQuda("Result: CPU = %f, CPU-QUDA = %f\n",  norm2_cpu, norm2_cpu_cuda);

     }


     if (verify_results) {

       ::testing::InitGoogleTest(&argc, argv);

       if (RUN_ALL_TESTS() != 0) warningQuda("Tests failed");

     }

   }

   end();


   return accuracy_level;

 }


 void display_test_info()

 {

   printfQuda("running the following test:\n");


   printfQuda("prec recon   test_type     dagger   S_dim         T_dimension\n");

   printfQuda("%s   %s       %d           %d       %d/%d/%d        %d \n",

       get_prec_str(prec), get_recon_str(link_recon),

       test_type, dagger, xdim, ydim, zdim, tdim);

   printfQuda("Grid partition info:     X  Y  Z  T\n");

   printfQuda("                         %d  %d  %d  %d\n",

       dimPartitioned(0),

       dimPartitioned(1),

       dimPartitioned(2),

       dimPartitioned(3));


   return ;


 }


   void

 usage_extra(char** argv )

 {

   printfQuda("Extra options:\n");

   printfQuda("    --test <0/1>                             # Test method\n");

   printfQuda("                                                0: Even destination spinor\n");

   printfQuda("                                                1: Odd destination spinor\n");

   return ;

 }


 int main(int argc, char **argv)

 {


   int i;

   for (i =1;i < argc; i++){


     if(process_command_line_option(argc, argv, &i) == 0){

       continue;

     }


     fprintf(stderr, "ERROR: Invalid option:%s\n", argv[i]);

     usage(argv);

   }


   initComms(argc, argv, gridsize_from_cmdline);


   display_test_info();


   int ret =1;

   int accuracy_level = dslashTest(argc, argv);


   printfQuda("accuracy_level =%d\n", accuracy_level);


   if (accuracy_level >= 1) ret = 0;    //probably no error, -1 means no matching


   finalizeComms();


   return ret;

 }


invert_quda.h

dimPartitioned
int dimPartitioned(int dim)
Definition: test_util.cpp:1577

QudaInvertParam_s::dirac_order
QudaDiracFieldOrder dirac_order
Definition: quda.h:156

QUDA_VERBOSE
Definition: enum_quda.h:217

dslash_type
QudaDslashType dslash_type
Definition: test_util.cpp:1560

QudaGaugeParam_s::reconstruct_sloppy
QudaReconstructType reconstruct_sloppy
Definition: quda.h:46

QudaGaugeParam_s::anisotropy
double anisotropy
Definition: quda.h:31

spinorOut
cpuColorSpinorField * spinorOut
Definition: staggered_dslash_test.cpp:45

QUDA_RECONSTRUCT_NO
Definition: enum_quda.h:55

Vh
__constant__ int Vh
Definition: dslash_constants.h:152

device
int device
Definition: test_util.cpp:1546

hostGauge
void * hostGauge[4]
Definition: staggered_dslash_test.cpp:50

quda::DiracParam::tmp1
cudaColorSpinorField * tmp1
Definition: dirac_quda.h:39

QUDA_MAT_SOLUTION
Definition: enum_quda.h:119

endQuda
void endQuda(void)
Definition: interface_quda.cpp:1018

quda::GaugeField::Ghost
const void ** Ghost() const
Definition: gauge_field.h:209

QudaPrecision
enum QudaPrecision_s QudaPrecision

V
int V
Definition: test_util.cpp:29

attempts
int attempts
Definition: gauge_force_test.cpp:33

zdim
int zdim
Definition: test_util.cpp:1555

QudaGaugeParam_s::ga_pad
int ga_pad
Definition: quda.h:53

misc.h

ASSERT_LE
#define ASSERT_LE(val1, val2)
Definition: gtest.h:19789

main
int main(int argc, char **argv)
Definition: staggered_dslash_test.cpp:514

QudaGaugeParam_s::gauge_fix
QudaGaugeFixed gauge_fix
Definition: quda.h:51

quda::ColorSpinorParam::nColor
int nColor
Definition: color_spinor_field.h:16

QUDA_ASQTAD_DSLASH
Definition: enum_quda.h:81

QudaGaugeParam_s::type
QudaLinkType type
Definition: quda.h:35

spinorRef
cpuColorSpinorField * spinorRef
Definition: staggered_dslash_test.cpp:45

staggered_dslash_reference.h

dagger
QudaDagType dagger
Definition: test_util.cpp:1558

link_recon
QudaReconstructType link_recon
Definition: test_util.cpp:1549

errorQuda
#define errorQuda(...)
Definition: util_quda.h:73

QudaInvertParam_s::dslash_type
QudaDslashType dslash_type
Definition: quda.h:85

QUDA_GAUGE_FIXED_NO
Definition: enum_quda.h:65

test_util.h

gaugeParam
QudaGaugeParam gaugeParam
Definition: staggered_dslash_test.cpp:39

QudaInvertParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:152

QUDA_ODD_PARITY
Definition: enum_quda.h:240

setDims
void setDims(int *)
Definition: test_util.cpp:88

QUDA_SPACE_SPIN_COLOR_FIELD_ORDER
Definition: enum_quda.h:295

QUDA_HALF_PRECISION
Definition: enum_quda.h:48

QUDA_QDP_GAUGE_ORDER
Definition: enum_quda.h:32

quda::sqrt
__host__ __device__ ValueType sqrt(ValueType x)
Definition: complex_quda.h:105

loadGaugeQuda
void loadGaugeQuda(void *h_gauge, QudaGaugeParam *param)
Definition: interface_quda.cpp:452

staggered_dslash
void staggered_dslash(void *res, void **fatlink, void **longlink, void *spinorField, int oddBit, int daggerBit, QudaPrecision sPrecision, QudaPrecision gPrecision)
Definition: staggered_dslash_reference.cpp:96

QudaInvertParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:151

process_command_line_option
int process_command_line_option(int argc, char **argv, int *idx)
Definition: test_util.cpp:1635

quda::cpuColorSpinorField::Source
void Source(const QudaSourceType sourceType, const int st=0, const int s=0, const int c=0)
Definition: cpu_color_spinor_field.cpp:176

QUDA_FULL_SITE_SUBSET
Definition: enum_quda.h:277

quda::LatticeFieldParam::precision
QudaPrecision precision
Definition: lattice_field.h:41

gaugeSiteSize
#define gaugeSiteSize
Definition: fat_force_quda.h:11

QudaInvertParam_s::dagger
QudaDagType dagger
Definition: quda.h:145

finalizeComms
void finalizeComms()
Definition: test_util.cpp:65

quda::cudaColorSpinorField
Definition: color_spinor_field.h:302

usage
void usage(char **argv)
Definition: test_util.cpp:1584

spinor
cpuColorSpinorField * spinor
Definition: staggered_dslash_test.cpp:45

cudaSpinor
cudaColorSpinorField * cudaSpinor
Definition: staggered_dslash_test.cpp:46

QudaGaugeParam_s::gauge_order
QudaGaugeFieldOrder gauge_order
Definition: quda.h:36

util_quda.h

get_prec_str
const char * get_prec_str(QudaPrecision prec)
Definition: misc.cpp:658

gtest.h

quda::LatticeFieldParam::siteSubset
QudaSiteSubset siteSubset
Definition: lattice_field.h:42

QudaInvertParam_s::input_location
QudaFieldLocation input_location
Definition: quda.h:82

longlink
void * longlink[4]
Definition: staggered_dslash_test.cpp:51

dirac_quda.h

test_type
int test_type
Definition: test_util.cpp:1564

quda::setDiracParam
void setDiracParam(DiracParam &diracParam, QudaInvertParam *inv_param, bool pc)
Definition: interface_quda.cpp:1102

QudaInvertParam_s::solution_type
QudaSolutionType solution_type
Definition: quda.h:142

verify_results
bool verify_results
Definition: test_util.cpp:1568

QUDA_MATPC_SOLUTION
Definition: enum_quda.h:121

prec
QudaPrecision prec
Definition: test_util.cpp:1551

dirac
Dirac * dirac
Definition: staggered_dslash_test.cpp:77

QUDA_TUNE_YES
Definition: enum_quda.h:224

dslashCUDA
double dslashCUDA(int niter)
Definition: staggered_dslash_test.cpp:319

quda::Dirac::Dslash
virtual void Dslash(cudaColorSpinorField &out, const cudaColorSpinorField &in, const QudaParity parity) const =0

quda::LatticeFieldParam::x
int x[QUDA_MAX_DIM]
Definition: lattice_field.h:38

QUDA_RECONSTRUCT_9
Definition: enum_quda.h:58

quda::GaugeFieldParam
Definition: gauge_field.h:10

quda::DiracParam
Definition: dirac_quda.h:18

setTuning
void setTuning(QudaTune tune)
Definition: util_quda.cpp:33

usage_extra
void usage_extra(char **argv)
Definition: staggered_dslash_test.cpp:505

QudaGaugeParam_s::scale
double scale
Definition: quda.h:33

initQuda
void initQuda(int device)
Definition: interface_quda.cpp:428

tmp
cudaColorSpinorField * tmp
Definition: staggered_dslash_test.cpp:48

QUDA_EVEN_ODD_SITE_ORDER
Definition: enum_quda.h:285

QudaInvertParam_s::output_location
QudaFieldLocation output_location
Definition: quda.h:83

xdim
int xdim
Definition: test_util.cpp:1553

QudaGaugeParam_s
Definition: quda.h:25

quda::ColorSpinorParam::fieldOrder
QudaFieldOrder fieldOrder
Definition: color_spinor_field.h:23

quda::Dirac::Flops
unsigned long long Flops() const
Definition: dirac_quda.h:136

setSpinorSiteSize
void setSpinorSiteSize(int n)
Definition: test_util.cpp:150

csParam
ColorSpinorParam csParam
Definition: pack_test.cpp:24

newQudaInvertParam
QudaInvertParam newQudaInvertParam(void)

get_recon_str
const char * get_recon_str(QudaReconstructType recon)
Definition: misc.cpp:724

MAX
#define MAX(a, b)
Definition: staggered_dslash_test.cpp:27

quda::cpuGaugeField
Definition: gauge_field.h:278

testing::InitGoogleTest
GTEST_API_ void InitGoogleTest(int *argc, char **argv)

face_quda.h

quda::ColorSpinorParam::gammaBasis
QudaGammaBasis gammaBasis
Definition: color_spinor_field.h:24

TEST
TEST(dslash, verify)
Definition: staggered_dslash_test.cpp:419

warningQuda
#define warningQuda(...)
Definition: util_quda.h:84

quda::pow
__host__ __device__ ValueType pow(ValueType x, ExponentType e)
Definition: complex_quda.h:100

QUDA_PARITY_SITE_SUBSET
Definition: enum_quda.h:278

parity
QudaParity parity
Definition: staggered_dslash_test.cpp:59

QudaInvertParam_s::gamma_basis
QudaGammaBasis gamma_basis
Definition: quda.h:158

niter
int niter
Definition: test_util.cpp:1563

QUDA_FLOAT2_FIELD_ORDER
Definition: enum_quda.h:293

cudaSpinorOut
cudaColorSpinorField * cudaSpinorOut
Definition: staggered_dslash_test.cpp:46

QudaGaugeParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:45

dslash_util.h

QudaDagType
enum QudaDagType_s QudaDagType

QudaParity
enum QudaParity_s QudaParity

QudaGaugeParam_s::reconstruct
QudaReconstructType reconstruct
Definition: quda.h:43

QudaGaugeParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:42

QUDA_ASQTAD_LONG_LINKS
Definition: enum_quda.h:22

QudaGaugeParam_s::X
int X[4]
Definition: quda.h:29

quda::LatticeFieldParam::nDim
int nDim
Definition: lattice_field.h:37

X
int X[4]
Definition: staggered_dslash_test.cpp:75

quda::cpuColorSpinorField::Compare
static int Compare(const cpuColorSpinorField &a, const cpuColorSpinorField &b, const int resolution=1)
Definition: cpu_color_spinor_field.cpp:180

QudaInvertParam_s::sp_pad
int sp_pad
Definition: quda.h:176

blas_quda.h

construct_fat_long_gauge_field
void construct_fat_long_gauge_field(void **fatlink, void **longlink, int type, QudaPrecision precision, QudaGaugeParam *param, QudaDslashType dslash_type)
Definition: test_util.cpp:1018

init
void init()
Definition: staggered_dslash_test.cpp:79

quda::ColorSpinorParam
Definition: color_spinor_field.h:14

cpuLong
cpuGaugeField * cpuLong
Definition: staggered_dslash_test.cpp:43

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:50

transfer
int transfer
Definition: staggered_dslash_test.cpp:61

QudaGaugeParam_s::tadpole_coeff
double tadpole_coeff
Definition: quda.h:32

QudaGaugeParam_s::gaugeGiB
double gaugeGiB
Definition: quda.h:60

tdim
int tdim
Definition: test_util.cpp:1556

QUDA_STAGGERED_DSLASH
Definition: enum_quda.h:80

ydim
int ydim
Definition: test_util.cpp:1554

tune
bool tune
Definition: test_util.cpp:1562

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:49

quda::ColorSpinorParam::nSpin
int nSpin
Definition: color_spinor_field.h:17

display_test_info
void display_test_info()
Definition: staggered_dslash_test.cpp:484

QudaReconstructType
enum QudaReconstructType_s QudaReconstructType

quda.h
Main header file for the QUDA library.

quda::Dirac::M
virtual void M(cudaColorSpinorField &out, const cudaColorSpinorField &in) const =0

QUDA_DEGRAND_ROSSI_GAMMA_BASIS
Definition: enum_quda.h:311

dslash_quda.h

printfQuda
#define printfQuda(...)
Definition: util_quda.h:67

QudaGaugeParam_s::t_boundary
QudaTboundary t_boundary
Definition: quda.h:38

inv_param
QudaInvertParam inv_param
Definition: staggered_dslash_test.cpp:40

quda::ColorSpinorParam::siteOrder
QudaSiteOrder siteOrder
Definition: color_spinor_field.h:21

QUDA_DIRAC_ORDER
Definition: enum_quda.h:196

RUN_ALL_TESTS
int RUN_ALL_TESTS() GTEST_MUST_USE_RESULT_
Definition: gtest.h:20057

staggered_dslash_mg4dir
void staggered_dslash_mg4dir(cpuColorSpinorField *out, void **fatlink, void **longlink, void **ghost_fatlink, void **ghost_longlink, cpuColorSpinorField *in, int oddBit, int daggerBit, QudaPrecision sPrecision, QudaPrecision gPrecision)

QUDA_RECONSTRUCT_13
Definition: enum_quda.h:59

QudaDslashType
enum QudaDslashType_s QudaDslashType

QUDA_ANTI_PERIODIC_T
Definition: enum_quda.h:42

QUDA_RANDOM_SOURCE
Definition: enum_quda.h:319

quda::setKernelPackT
void setKernelPackT(bool pack)
Definition: dslash_quda.cu:82

staggeredDslashRef
void staggeredDslashRef()
Definition: staggered_dslash_test.cpp:372

QUDA_EVEN_PARITY
Definition: enum_quda.h:239

end
void end(void)
Definition: staggered_dslash_test.cpp:295

kernel_pack_t
bool kernel_pack_t
Definition: test_util.cpp:1571

return
return
Definition: hisq_paths_force_core.h:380

checkCudaError
#define checkCudaError()
Definition: util_quda.h:110

QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:304

quda::Dirac::create
static Dirac * create(const DiracParam &param)
Definition: dirac.cpp:134

quda::ColorSpinorParam::create
QudaFieldCreate create
Definition: color_spinor_field.h:25

QUDA_MATPC_EVEN_EVEN
Definition: enum_quda.h:163

quda::norm2
double norm2(const ColorSpinorField &)
Definition: color_spinor_field.cpp:486

QudaInvertParam_s
Definition: quda.h:80

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:270

initComms
void initComms(int argc, char **argv, const int *commDims)
Definition: test_util.cpp:48

gridsize_from_cmdline
int gridsize_from_cmdline[]
Definition: test_util.cpp:1559

QUDA_ASQTAD_FAT_LINKS
Definition: enum_quda.h:21

gauge_field.h

cpuFat
cpuGaugeField * cpuFat
Definition: staggered_dslash_test.cpp:42

setVerbosity
void setVerbosity(const QudaVerbosity verbosity)
Definition: util_quda.cpp:24

QudaInvertParam_s::matpc_type
QudaMatPCType matpc_type
Definition: quda.h:144

loops
const int loops
Definition: staggered_dslash_test.cpp:57

quda::cpuColorSpinorField
Definition: color_spinor_field.h:517

QudaGaugeParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:40

quda::ColorSpinorField::V
void * V()
Definition: color_spinor_field.h:262

quda::Dirac
Definition: dirac_quda.h:79

newQudaGaugeParam
QudaGaugeParam newQudaGaugeParam(void)

quda_internal.h

quda::LatticeFieldParam::pad
int pad
Definition: lattice_field.h:39

fatlink
void * fatlink[4]
Definition: staggered_dslash_test.cpp:51