v0.9.0/doc/staggered__dslash__test_8cpp_source.html

 #include <iostream>
 #include <stdio.h>
 #include <stdlib.h>
 #include <string.h>

 #include <quda.h>
 #include <quda_internal.h>
 #include <dirac_quda.h>
 #include <dslash_quda.h>
 #include <invert_quda.h>
 #include <util_quda.h>
 #include <blas_quda.h>

 #include <misc.h>
 #include <test_util.h>
 #include <dslash_util.h>
 #include <staggered_dslash_reference.h>
 #include <gauge_field.h>

 #include <assert.h>
 #include <gtest.h>

 using namespace quda;

 #define MAX(a,b) ((a)>(b)?(a):(b))
 #define staggeredSpinorSiteSize 6
 // What test are we doing (0 = dslash, 1 = MatPC, 2 = Mat)

 extern void usage(char** argv );

 extern QudaDslashType dslash_type;

 extern int test_type;

 QudaGaugeParam gaugeParam;
 QudaInvertParam inv_param;

 cpuGaugeField *cpuFat = NULL;
 cpuGaugeField *cpuLong = NULL;

 cpuColorSpinorField *spinor, *spinorOut, *spinorRef, *tmpCpu;
 cudaColorSpinorField *cudaSpinor, *cudaSpinorOut;

 cudaColorSpinorField* tmp;

 void *hostGauge[4];
 void *fatlink[4], *longlink[4];

 #ifdef MULTI_GPU
 void **ghost_fatlink, **ghost_longlink;
 #endif

 QudaParity parity = QUDA_EVEN_PARITY;
 extern QudaDagType dagger;
 int transfer = 0; // include transfer time in the benchmark?
 extern int xdim;
 extern int ydim;
 extern int zdim;
 extern int tdim;
 extern int gridsize_from_cmdline[];
 extern QudaReconstructType link_recon;
 extern QudaPrecision prec;

 extern int device;
 extern bool verify_results;
 extern int niter;

 extern bool kernel_pack_t;

 extern double mass; // the mass of the Dirac operator

 int X[4];
 extern int Nsrc; // number of spinors to apply to simultaneously

 Dirac* dirac;

 void init()
 {

   initQuda(device);

   setKernelPackT(kernel_pack_t);

   setVerbosity(QUDA_VERBOSE);

   gaugeParam = newQudaGaugeParam();
   inv_param = newQudaInvertParam();

   gaugeParam.X[0] = X[0] = xdim;
   gaugeParam.X[1] = X[1] = ydim;
   gaugeParam.X[2] = X[2] = zdim;
   gaugeParam.X[3] = X[3] = tdim;

   setDims(gaugeParam.X);
   dw_setDims(gaugeParam.X,Nsrc); // so we can use 5-d indexing from dwf
   setSpinorSiteSize(6);

   gaugeParam.cpu_prec = QUDA_DOUBLE_PRECISION;
   gaugeParam.cuda_prec = prec;
   gaugeParam.reconstruct = link_recon;
   gaugeParam.reconstruct_sloppy = gaugeParam.reconstruct;
   gaugeParam.cuda_prec_sloppy = gaugeParam.cuda_prec;

     // ensure that the default is improved staggered
   if (dslash_type != QUDA_STAGGERED_DSLASH &&
       dslash_type != QUDA_ASQTAD_DSLASH)
     dslash_type = QUDA_ASQTAD_DSLASH;

   gaugeParam.anisotropy = 1.0;
   gaugeParam.tadpole_coeff = 0.8;
   gaugeParam.scale = (dslash_type == QUDA_ASQTAD_DSLASH) ? -1.0/(24.0*gaugeParam.tadpole_coeff*gaugeParam.tadpole_coeff) : 1.0;
   gaugeParam.gauge_order = QUDA_QDP_GAUGE_ORDER;
   gaugeParam.t_boundary = QUDA_ANTI_PERIODIC_T;
   gaugeParam.gauge_fix = QUDA_GAUGE_FIXED_NO;
   gaugeParam.gaugeGiB = 0;

   inv_param.cpu_prec = QUDA_DOUBLE_PRECISION;
   inv_param.cuda_prec = prec;
   inv_param.dirac_order = QUDA_DIRAC_ORDER;
   inv_param.gamma_basis = QUDA_DEGRAND_ROSSI_GAMMA_BASIS;
   inv_param.dagger = dagger;
   inv_param.matpc_type = QUDA_MATPC_EVEN_EVEN;
   inv_param.dslash_type = dslash_type;
   inv_param.mass = mass;

   // ensure that the default is improved staggered
   if (inv_param.dslash_type != QUDA_STAGGERED_DSLASH &&
       inv_param.dslash_type != QUDA_ASQTAD_DSLASH)
     inv_param.dslash_type = QUDA_ASQTAD_DSLASH;

   inv_param.input_location = QUDA_CPU_FIELD_LOCATION;
   inv_param.output_location = QUDA_CPU_FIELD_LOCATION;

   int tmpint = MAX(X[1]*X[2]*X[3], X[0]*X[2]*X[3]);
   tmpint = MAX(tmpint, X[0]*X[1]*X[3]);
   tmpint = MAX(tmpint, X[0]*X[1]*X[2]);


   gaugeParam.ga_pad = tmpint;
   inv_param.sp_pad = tmpint;

   ColorSpinorParam csParam;
   csParam.nColor=3;
   csParam.nSpin=1;
   csParam.nDim=5;
   for(int d = 0; d < 4; d++) {
     csParam.x[d] = gaugeParam.X[d];
   }
   csParam.x[4] = Nsrc; // number of sources becomes the fifth dimension

   csParam.precision = inv_param.cpu_prec;
   csParam.pad = 0;
   if (test_type < 2) {
     inv_param.solution_type = QUDA_MATPC_SOLUTION;
     csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;
     csParam.x[0] /= 2;
   } else {
     inv_param.solution_type = QUDA_MAT_SOLUTION;
     csParam.siteSubset = QUDA_FULL_SITE_SUBSET;
   }

   csParam.siteOrder = QUDA_EVEN_ODD_SITE_ORDER;
   csParam.fieldOrder  = QUDA_SPACE_SPIN_COLOR_FIELD_ORDER;
   csParam.gammaBasis = inv_param.gamma_basis; // this parameter is meaningless for staggered
   csParam.create = QUDA_ZERO_FIELD_CREATE;

   spinor = new cpuColorSpinorField(csParam);
   spinorOut = new cpuColorSpinorField(csParam);
   spinorRef = new cpuColorSpinorField(csParam);
   tmpCpu = new cpuColorSpinorField(csParam);

   csParam.siteSubset = QUDA_FULL_SITE_SUBSET;
   csParam.x[0] = gaugeParam.X[0];

   printfQuda("Randomizing fields ...\n");

   spinor->Source(QUDA_RANDOM_SOURCE);

   size_t gSize = (gaugeParam.cpu_prec == QUDA_DOUBLE_PRECISION) ? sizeof(double) : sizeof(float);

   for (int dir = 0; dir < 4; dir++) {
     fatlink[dir] = malloc(V*gaugeSiteSize*gSize);
     longlink[dir] = malloc(V*gaugeSiteSize*gSize);

     if (fatlink[dir] == NULL || longlink[dir] == NULL){
       errorQuda("ERROR: malloc failed for fatlink/longlink");
     }
   }

   construct_fat_long_gauge_field(fatlink, longlink, 1, gaugeParam.cpu_prec, &gaugeParam, dslash_type);

 #ifdef MULTI_GPU
   gaugeParam.type = QUDA_ASQTAD_FAT_LINKS;
   gaugeParam.reconstruct = QUDA_RECONSTRUCT_NO;
   GaugeFieldParam cpuFatParam(fatlink, gaugeParam);
   cpuFatParam.ghostExchange = QUDA_GHOST_EXCHANGE_PAD;
   cpuFat = new cpuGaugeField(cpuFatParam);
   ghost_fatlink = cpuFat->Ghost();

   gaugeParam.type = QUDA_ASQTAD_LONG_LINKS;
   GaugeFieldParam cpuLongParam(longlink, gaugeParam);
   cpuLongParam.ghostExchange = QUDA_GHOST_EXCHANGE_PAD;
   cpuLong = new cpuGaugeField(cpuLongParam);
   ghost_longlink = cpuLong->Ghost();

   int x_face_size = X[1]*X[2]*X[3]/2;
   int y_face_size = X[0]*X[2]*X[3]/2;
   int z_face_size = X[0]*X[1]*X[3]/2;
   int t_face_size = X[0]*X[1]*X[2]/2;
   int pad_size = MAX(x_face_size, y_face_size);
   pad_size = MAX(pad_size, z_face_size);
   pad_size = MAX(pad_size, t_face_size);
   gaugeParam.ga_pad = pad_size;
 #endif

   gaugeParam.type = (dslash_type == QUDA_ASQTAD_DSLASH) ? QUDA_ASQTAD_FAT_LINKS : QUDA_SU3_LINKS;
   if (dslash_type == QUDA_STAGGERED_DSLASH) {
     gaugeParam.reconstruct = gaugeParam.reconstruct_sloppy = link_recon;
   } else {
     gaugeParam.reconstruct = gaugeParam.reconstruct_sloppy = QUDA_RECONSTRUCT_NO;
   }

   printfQuda("Fat links sending...");
   loadGaugeQuda(fatlink, &gaugeParam);
   printfQuda("Fat links sent\n");

   gaugeParam.type = QUDA_ASQTAD_LONG_LINKS;

 #ifdef MULTI_GPU
   gaugeParam.ga_pad = 3*pad_size;
 #endif

   if (dslash_type == QUDA_ASQTAD_DSLASH) {
     gaugeParam.reconstruct = gaugeParam.reconstruct_sloppy = link_recon;
     printfQuda("Long links sending...");
     loadGaugeQuda(longlink, &gaugeParam);
     printfQuda("Long links sent...\n");
   }

   printfQuda("Sending fields to GPU...");

   if (!transfer) {

     csParam.fieldOrder = QUDA_FLOAT2_FIELD_ORDER;
     csParam.pad = inv_param.sp_pad;
     csParam.precision = inv_param.cuda_prec;
     if (test_type < 2){
       csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;
       csParam.x[0] /=2;
     }

     printfQuda("Creating cudaSpinor\n");
     cudaSpinor = new cudaColorSpinorField(csParam);

     printfQuda("Creating cudaSpinorOut\n");
     cudaSpinorOut = new cudaColorSpinorField(csParam);

     printfQuda("Sending spinor field to GPU\n");
     *cudaSpinor = *spinor;

     cudaDeviceSynchronize();
     checkCudaError();

     double spinor_norm2 = blas::norm2(*spinor);
     double cuda_spinor_norm2=  blas::norm2(*cudaSpinor);
     printfQuda("Source CPU = %f, CUDA=%f\n", spinor_norm2, cuda_spinor_norm2);

     if(test_type == 2) csParam.x[0] /=2;

     csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;
     tmp = new cudaColorSpinorField(csParam);

     bool pc = (test_type != 2);
     DiracParam diracParam;
     setDiracParam(diracParam, &inv_param, pc);

     diracParam.tmp1=tmp;

     dirac = Dirac::create(diracParam);

   } else {
     errorQuda("Error not suppported");
   }

   return;
 }

 void end(void)
 {
   for (int dir = 0; dir < 4; dir++) {
     free(fatlink[dir]);
     free(longlink[dir]);
   }

   if (!transfer){
     delete dirac;
     delete cudaSpinor;
     delete cudaSpinorOut;
     delete tmp;
   }

   delete spinor;
   delete spinorOut;
   delete spinorRef;
   delete tmpCpu;

   if (cpuFat) delete cpuFat;
   if (cpuLong) delete cpuLong;

   endQuda();
 }

 struct DslashTime {
   double event_time;
   double cpu_time;
   double cpu_min;
   double cpu_max;

   DslashTime() : event_time(0.0), cpu_time(0.0), cpu_min(DBL_MAX), cpu_max(0.0) {}
 };

 DslashTime dslashCUDA(int niter) {

   DslashTime dslash_time;
   timeval tstart, tstop;

   cudaEvent_t start, end;
   cudaEventCreate(&start);
   cudaEventRecord(start, 0);
   cudaEventSynchronize(start);

   comm_barrier();
   cudaEventRecord(start, 0);

   for (int i = 0; i < niter; i++) {

     gettimeofday(&tstart, NULL);

     switch (test_type) {
       case 0:
         if (transfer){
           //dslashQuda(spinorOdd, spinorEven, &inv_param, parity);
         } else {
           dirac->Dslash(*cudaSpinorOut, *cudaSpinor, parity);
         }
         break;
       case 1:
         if (transfer){
           //MatPCDagMatPcQuda(spinorOdd, spinorEven, &inv_param);
         } else {
           dirac->MdagM(*cudaSpinorOut, *cudaSpinor);
         }
         break;
       case 2:
         errorQuda("Staggered operator acting on full-site not supported");
         if (transfer){
           //MatQuda(spinorGPU, spinor, &inv_param);
         } else {
           dirac->M(*cudaSpinorOut, *cudaSpinor);
         }
     }

     gettimeofday(&tstop, NULL);
     long ds = tstop.tv_sec - tstart.tv_sec;
     long dus = tstop.tv_usec - tstart.tv_usec;
     double elapsed = ds + 0.000001*dus;

     dslash_time.cpu_time += elapsed;
     // skip first and last iterations since they may skew these metrics if comms are not synchronous
     if (i>0 && i<niter) {
       if (elapsed < dslash_time.cpu_min) dslash_time.cpu_min = elapsed;
       if (elapsed > dslash_time.cpu_max) dslash_time.cpu_max = elapsed;
     }
   }

   cudaEventCreate(&end);
   cudaEventRecord(end, 0);
   cudaEventSynchronize(end);
   float runTime;
   cudaEventElapsedTime(&runTime, start, end);
   cudaEventDestroy(start);
   cudaEventDestroy(end);

   dslash_time.event_time = runTime / 1000;

   // check for errors
   cudaError_t stat = cudaGetLastError();
   if (stat != cudaSuccess)
     errorQuda("with ERROR: %s\n", cudaGetErrorString(stat));

   return dslash_time;
 }

 void staggeredDslashRef()
 {

   // compare to dslash reference implementation
   printfQuda("Calculating reference implementation...");
   fflush(stdout);
   switch (test_type) {
     case 0:
 #ifdef MULTI_GPU
       staggered_dslash_mg4dir(spinorRef, fatlink, longlink, ghost_fatlink, ghost_longlink,
             spinor, parity, dagger, inv_param.cpu_prec, gaugeParam.cpu_prec);
 #else
       staggered_dslash(spinorRef->V(), fatlink, longlink, spinor->V(), parity, dagger, inv_param.cpu_prec, gaugeParam.cpu_prec);
 #endif
       break;
     case 1:
 #ifdef MULTI_GPU
       matdagmat_mg4dir(spinorRef, fatlink, longlink, ghost_fatlink, ghost_longlink,
            spinor, mass, 0, inv_param.cpu_prec, gaugeParam.cpu_prec, tmpCpu, parity);
 #else
       matdagmat(spinorRef->V(), fatlink, longlink, spinor->V(), mass, 0, inv_param.cpu_prec, gaugeParam.cpu_prec, tmpCpu->V(), parity);
 #endif
       break;
     case 2:
       //mat(spinorRef->V(), fatlink, longlink, spinor->V(), kappa, dagger,
       //inv_param.cpu_prec, gaugeParam.cpu_prec);
       break;
     default:
       errorQuda("Test type not defined");
   }

   printfQuda("done.\n");

 }

 TEST(dslash, verify) {
   double deviation = pow(10, -(double)(cpuColorSpinorField::Compare(*spinorRef, *spinorOut)));
   double tol = (inv_param.cuda_prec == QUDA_DOUBLE_PRECISION ? 1e-12 :
     (inv_param.cuda_prec == QUDA_SINGLE_PRECISION ? 1e-3 : 1e-1));
   ASSERT_LE(deviation, tol) << "CPU and CUDA implementations do not agree";
 }

 static int dslashTest()
 {
   // return code for google test
   int test_rc = 0;
   init();

   int attempts = 1;

   for (int i=0; i<attempts; i++) {

     { // warm-up run
       printfQuda("Tuning...\n");
       dslashCUDA(1);
     }
     printfQuda("Executing %d kernel loops...", niter);

     // reset flop counter
     dirac->Flops();

     DslashTime dslash_time = dslashCUDA(niter);

     if (!transfer) *spinorOut = *cudaSpinorOut;

     printfQuda("%fus per kernel call\n", 1e6*dslash_time.event_time / niter);
     staggeredDslashRef();

     unsigned long long flops = dirac->Flops();
     printfQuda("GFLOPS = %f\n", 1.0e-9*flops/dslash_time.event_time);

     printfQuda("Effective halo bi-directional bandwidth (GB/s) GPU = %f ( CPU = %f, min = %f , max = %f ) for aggregate message size %lu bytes\n",
          1.0e-9*2*cudaSpinor->GhostBytes()*niter/dslash_time.event_time, 1.0e-9*2*cudaSpinor->GhostBytes()*niter/dslash_time.cpu_time,
          1.0e-9*2*cudaSpinor->GhostBytes()/dslash_time.cpu_max, 1.0e-9*2*cudaSpinor->GhostBytes()/dslash_time.cpu_min,
          2*cudaSpinor->GhostBytes());

     double spinor_ref_norm2 = blas::norm2(*spinorRef);
     double spinor_out_norm2 =  blas::norm2(*spinorOut);

     if (!transfer) {
       double cuda_spinor_out_norm2 =  blas::norm2(*cudaSpinorOut);
       printfQuda("Results: CPU=%f, CUDA=%f, CPU-CUDA=%f\n",  spinor_ref_norm2, cuda_spinor_out_norm2,
      spinor_out_norm2);
     } else {
       printfQuda("Result: CPU=%f , CPU-CUDA=%f", spinor_ref_norm2, spinor_out_norm2);
     }

     if (verify_results) {
       test_rc = RUN_ALL_TESTS();
       if (test_rc != 0) warningQuda("Tests failed");
     }
   }
   end();

   return test_rc;
 }


 void display_test_info()
 {
   printfQuda("running the following test:\n");

   printfQuda("prec recon   test_type     dagger   S_dim         T_dimension\n");
   printfQuda("%s   %s       %d           %d       %d/%d/%d        %d \n",
       get_prec_str(prec), get_recon_str(link_recon),
       test_type, dagger, xdim, ydim, zdim, tdim);
   printfQuda("Grid partition info:     X  Y  Z  T\n");
   printfQuda("                         %d  %d  %d  %d\n",
       dimPartitioned(0),
       dimPartitioned(1),
       dimPartitioned(2),
       dimPartitioned(3));

   return ;

 }


   void
 usage_extra(char** argv )
 {
   printfQuda("Extra options:\n");
   printfQuda("    --test <0/1>                             # Test method\n");
   printfQuda("                                                0: Even destination spinor\n");
   printfQuda("                                                1: Odd destination spinor\n");
   return ;
 }

 int main(int argc, char **argv)
 {
   // initalize google test
   ::testing::InitGoogleTest(&argc, argv);
   for (int i=1 ;i < argc; i++){

     if(process_command_line_option(argc, argv, &i) == 0){
       continue;
     }

     fprintf(stderr, "ERROR: Invalid option:%s\n", argv[i]);
     usage(argv);
   }

   initComms(argc, argv, gridsize_from_cmdline);

   display_test_info();

   // return result of RUN_ALL_TESTS
   int test_rc = dslashTest();

   finalizeComms();

   return test_rc;
 }

invert_quda.h

dimPartitioned
int dimPartitioned(int dim)
Definition: test_util.cpp:1686

QudaInvertParam_s::dirac_order
QudaDiracFieldOrder dirac_order
Definition: quda.h:195

QUDA_VERBOSE
Definition: enum_quda.h:237

dslash_type
QudaDslashType dslash_type
Definition: test_util.cpp:1626

QudaGaugeParam_s::reconstruct_sloppy
QudaReconstructType reconstruct_sloppy
Definition: quda.h:46

QudaGaugeParam_s::anisotropy
double anisotropy
Definition: quda.h:31

spinorOut
cpuColorSpinorField * spinorOut
Definition: staggered_dslash_test.cpp:41

QUDA_RECONSTRUCT_NO
Definition: enum_quda.h:66

device
int device
Definition: CMakeCUDACompilerId.cpp1.ii:2238

hostGauge
void * hostGauge[4]
Definition: staggered_dslash_test.cpp:46

quda::LatticeFieldParam::ghostExchange
QudaGhostExchange ghostExchange
Definition: lattice_field.h:60

dslashTest
static int dslashTest()
Definition: staggered_dslash_test.cpp:436

QUDA_MAT_SOLUTION
Definition: enum_quda.h:130

Nsrc
int Nsrc
Definition: test_util.cpp:1628

endQuda
void endQuda(void)
Definition: interface_quda.cpp:1290

free
void free(void *)

QudaPrecision
enum QudaPrecision_s QudaPrecision

zdim
int zdim
Definition: test_util.cpp:1622

QudaGaugeParam_s::ga_pad
int ga_pad
Definition: quda.h:53

misc.h

dw_setDims
void dw_setDims(int *X, const int L5)
Definition: test_util.cpp:167

main
int main(int argc, char **argv)
Definition: staggered_dslash_test.cpp:522

dslashCUDA
DslashTime dslashCUDA(int niter)
Definition: staggered_dslash_test.cpp:322

QudaGaugeParam_s::gauge_fix
QudaGaugeFixed gauge_fix
Definition: quda.h:51

quda::ColorSpinorParam::nColor
int nColor
Definition: color_spinor_field.h:85

timeval::tv_sec
__darwin_time_t tv_sec
Definition: CMakeCUDACompilerId.cpp1.ii:4833

QUDA_ASQTAD_DSLASH
Definition: enum_quda.h:92

QudaGaugeParam_s::type
QudaLinkType type
Definition: quda.h:35

fflush
int fflush(FILE *)

spinorRef
cpuColorSpinorField * spinorRef
Definition: staggered_dslash_test.cpp:41

staggered_dslash_reference.h

dagger
QudaDagType dagger
Definition: deg_tm_dslash_cuda_gen.py:960

link_recon
QudaReconstructType link_recon
Definition: test_util.cpp:1612

errorQuda
#define errorQuda(...)
Definition: util_quda.h:90

quda::blas::norm2
double norm2(const ColorSpinorField &a)
Definition: reduce_quda.cu:241

QudaInvertParam_s::dslash_type
QudaDslashType dslash_type
Definition: quda.h:93

QUDA_GAUGE_FIXED_NO
Definition: enum_quda.h:76

start
cudaEvent_t start
Definition: CMakeCUDACompilerId.cpp1.ii:2453

test_util.h

gaugeParam
QudaGaugeParam gaugeParam
Definition: staggered_dslash_test.cpp:35

QudaInvertParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:191

QUDA_SPACE_SPIN_COLOR_FIELD_ORDER
Definition: enum_quda.h:321

QUDA_QDP_GAUGE_ORDER
Definition: enum_quda.h:41

loadGaugeQuda
void loadGaugeQuda(void *h_gauge, QudaGaugeParam *param)
Definition: interface_quda.cpp:602

DslashTime::cpu_min
double cpu_min
Definition: dslash_ctest.cpp:463

staggered_dslash
void staggered_dslash(void *res, void **fatlink, void **longlink, void *spinorField, int oddBit, int daggerBit, QudaPrecision sPrecision, QudaPrecision gPrecision)
Definition: staggered_dslash_reference.cpp:100

QudaInvertParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:190

process_command_line_option
int process_command_line_option(int argc, char **argv, int *idx)
Definition: test_util.cpp:1795

quda::cpuColorSpinorField::Source
void Source(const QudaSourceType sourceType, const int st=0, const int s=0, const int c=0)
Definition: cpu_color_spinor_field.cpp:245

QUDA_FULL_SITE_SUBSET
Definition: enum_quda.h:304

niter
int niter
Definition: test_util.cpp:1630

quda::LatticeFieldParam::precision
QudaPrecision precision
Definition: lattice_field.h:54

QudaInvertParam_s::dagger
QudaDagType dagger
Definition: quda.h:184

matdagmat_mg4dir
void matdagmat_mg4dir(cpuColorSpinorField *out, void **link, void **ghostLink, cpuColorSpinorField *in, int dagger_bit, int mu, QudaPrecision sPrecision, QudaPrecision gPrecision, cpuColorSpinorField *tmp, QudaParity parity)

finalizeComms
void finalizeComms()
Definition: test_util.cpp:107

quda::cudaColorSpinorField
Definition: color_spinor_field.h:504

usage
void usage(char **argv)
Definition: test_util.cpp:1693

spinor
cpuColorSpinorField * spinor
Definition: staggered_dslash_test.cpp:41

cudaSpinor
cudaColorSpinorField * cudaSpinor
Definition: staggered_dslash_test.cpp:42

QudaGaugeParam_s::gauge_order
QudaGaugeFieldOrder gauge_order
Definition: quda.h:36

util_quda.h

get_prec_str
const char * get_prec_str(QudaPrecision prec)
Definition: misc.cpp:704

quda::Dirac::Flops
unsigned long long Flops() const
Definition: dirac_quda.h:148

quda::Dirac::MdagM
virtual void MdagM(ColorSpinorField &out, const ColorSpinorField &in) const =0

quda
Definition: blas_cublas.h:6

quda::LatticeFieldParam::siteSubset
QudaSiteSubset siteSubset
Definition: lattice_field.h:55

setDims
void setDims(int *)
Definition: test_util.cpp:130

QudaInvertParam_s::input_location
QudaFieldLocation input_location
Definition: quda.h:90

longlink
void * longlink[4]
Definition: staggered_dslash_test.cpp:47

dirac_quda.h

timeval::tv_usec
__darwin_suseconds_t tv_usec
Definition: CMakeCUDACompilerId.cpp1.ii:4834

gSize
static size_t gSize
Definition: llfat_test.cpp:36

test_type
int test_type
Definition: test_util.cpp:1634

quda::setDiracParam
void setDiracParam(DiracParam &diracParam, QudaInvertParam *inv_param, bool pc)
Definition: interface_quda.cpp:1386

QudaInvertParam_s::solution_type
QudaSolutionType solution_type
Definition: quda.h:181

return
else return(__swbuf(_c, _p))

verify_results
bool verify_results
Definition: test_util.cpp:1641

QUDA_MATPC_SOLUTION
Definition: enum_quda.h:132

prec
QudaPrecision prec
Definition: test_util.cpp:1615

dirac
Dirac * dirac
Definition: staggered_dslash_test.cpp:75

quda::LatticeFieldParam::x
int x[QUDA_MAX_DIM]
Definition: lattice_field.h:50

quda::GaugeFieldParam
Definition: gauge_field.h:10

tmpCpu
cpuColorSpinorField * tmpCpu
Definition: staggered_dslash_test.cpp:41

quda::DiracParam
Definition: dirac_quda.h:19

usage_extra
void usage_extra(char **argv)
Definition: staggered_dslash_test.cpp:513

QudaGaugeParam_s::scale
double scale
Definition: quda.h:33

initQuda
void initQuda(int device)
Definition: interface_quda.cpp:546

tmp
cudaColorSpinorField * tmp
Definition: staggered_dslash_test.cpp:44

QUDA_EVEN_ODD_SITE_ORDER
Definition: enum_quda.h:311

tol
double tol
Definition: test_util.cpp:1647

QudaInvertParam_s::output_location
QudaFieldLocation output_location
Definition: quda.h:91

malloc
void * malloc(size_t __size) __attribute__((__warn_unused_result__)) __attribute__((alloc_size(1)))

xdim
int xdim
Definition: test_util.cpp:1620

QudaGaugeParam_s
Definition: quda.h:25

quda::ColorSpinorParam::fieldOrder
QudaFieldOrder fieldOrder
Definition: color_spinor_field.h:92

setSpinorSiteSize
void setSpinorSiteSize(int n)
Definition: test_util.cpp:192

csParam
ColorSpinorParam csParam
Definition: pack_test.cpp:24

newQudaInvertParam
QudaInvertParam newQudaInvertParam(void)

get_recon_str
const char * get_recon_str(QudaReconstructType recon)
Definition: misc.cpp:770

MAX
#define MAX(a, b)
Definition: staggered_dslash_test.cpp:25

quda::cpuGaugeField
Definition: gauge_field.h:464

DslashTime::event_time
double event_time
Definition: dslash_ctest.cpp:461

V
int V
Definition: test_util.cpp:28

quda::ColorSpinorParam::gammaBasis
QudaGammaBasis gammaBasis
Definition: color_spinor_field.h:93

gaugeSiteSize
#define gaugeSiteSize
Definition: test_util.h:6

fused_exterior_ndeg_tm_dslash_cuda_gen.i
int i
start here
Definition: fused_exterior_ndeg_tm_dslash_cuda_gen.py:816

DslashTime::cpu_time
double cpu_time
Definition: dslash_ctest.cpp:462

TEST
TEST(dslash, verify)
Definition: staggered_dslash_test.cpp:429

warningQuda
#define warningQuda(...)
Definition: util_quda.h:101

quda::pow
__host__ __device__ ValueType pow(ValueType x, ExponentType e)
Definition: complex_quda.h:100

matdagmat
void matdagmat(void *out, void **link, void *in, int dagger_bit, int mu, QudaPrecision sPrecision, QudaPrecision gPrecision, void *tmp, QudaParity parity)
Definition: covdev_reference.cpp:168

QUDA_PARITY_SITE_SUBSET
Definition: enum_quda.h:303

parity
QudaParity parity
Definition: staggered_dslash_test.cpp:53

QudaInvertParam_s::gamma_basis
QudaGammaBasis gamma_basis
Definition: quda.h:197

QUDA_FLOAT2_FIELD_ORDER
Definition: enum_quda.h:319

cudaSpinorOut
cudaColorSpinorField * cudaSpinorOut
Definition: staggered_dslash_test.cpp:42

QudaGaugeParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:45

quda::GaugeField::Ghost
const void ** Ghost() const
Definition: gauge_field.h:254

dslash_util.h

timeval
Definition: CMakeCUDACompilerId.cpp1.ii:4831

QudaDagType
enum QudaDagType_s QudaDagType

QudaParity
enum QudaParity_s QudaParity

QudaGaugeParam_s::reconstruct
QudaReconstructType reconstruct
Definition: quda.h:43

QudaGaugeParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:42

QUDA_ASQTAD_LONG_LINKS
Definition: enum_quda.h:31

QudaGaugeParam_s::X
int X[4]
Definition: quda.h:29

QudaInvertParam_s::mass
double mass
Definition: quda.h:96

fprintf
int fprintf(FILE *, const char *,...) __attribute__((__format__(__printf__

quda::LatticeFieldParam::nDim
int nDim
Definition: lattice_field.h:47

X
int X[4]
Definition: staggered_dslash_test.cpp:72

quda::cpuColorSpinorField::Compare
static int Compare(const cpuColorSpinorField &a, const cpuColorSpinorField &b, const int resolution=1)
Definition: cpu_color_spinor_field.cpp:249

QudaInvertParam_s::sp_pad
int sp_pad
Definition: quda.h:221

blas_quda.h

construct_fat_long_gauge_field
void construct_fat_long_gauge_field(void **fatlink, void **longlink, int type, QudaPrecision precision, QudaGaugeParam *param, QudaDslashType dslash_type)
Definition: test_util.cpp:1069

init
void init()
Definition: staggered_dslash_test.cpp:77

quda::Dirac::M
virtual void M(ColorSpinorField &out, const ColorSpinorField &in) const =0

quda::ColorSpinorParam
Definition: color_spinor_field.h:80

cpuLong
cpuGaugeField * cpuLong
Definition: staggered_dslash_test.cpp:39

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:61

transfer
int transfer
Definition: staggered_dslash_test.cpp:55

QudaGaugeParam_s::tadpole_coeff
double tadpole_coeff
Definition: quda.h:32

QudaGaugeParam_s::gaugeGiB
double gaugeGiB
Definition: quda.h:60

tdim
int tdim
Definition: test_util.cpp:1623

QUDA_STAGGERED_DSLASH
Definition: enum_quda.h:91

ydim
int ydim
Definition: test_util.cpp:1621

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:60

quda::ColorSpinorParam::nSpin
int nSpin
Definition: color_spinor_field.h:86

display_test_info
void display_test_info()
Definition: staggered_dslash_test.cpp:492

QudaReconstructType
enum QudaReconstructType_s QudaReconstructType

quda.h
Main header file for the QUDA library.

QUDA_DEGRAND_ROSSI_GAMMA_BASIS
Definition: enum_quda.h:338

dslash_quda.h

printfQuda
#define printfQuda(...)
Definition: util_quda.h:84

QudaGaugeParam_s::t_boundary
QudaTboundary t_boundary
Definition: quda.h:38

DslashTime
Definition: dslash_ctest.cpp:460

quda::blas::flops
unsigned long long flops
Definition: blas_quda.cu:42

DslashTime::cpu_max
double cpu_max
Definition: dslash_ctest.cpp:464

inv_param
QudaInvertParam inv_param
Definition: staggered_dslash_test.cpp:36

quda::ColorSpinorParam::siteOrder
QudaSiteOrder siteOrder
Definition: color_spinor_field.h:90

e
return e
Definition: CMakeCUDACompilerId.cpp1.ii:3026

QUDA_DIRAC_ORDER
Definition: enum_quda.h:215

staggered_dslash_mg4dir
void staggered_dslash_mg4dir(cpuColorSpinorField *out, void **fatlink, void **longlink, void **ghost_fatlink, void **ghost_longlink, cpuColorSpinorField *in, int oddBit, int daggerBit, QudaPrecision sPrecision, QudaPrecision gPrecision)

QudaDslashType
enum QudaDslashType_s QudaDslashType

QUDA_ANTI_PERIODIC_T
Definition: enum_quda.h:53

QUDA_RANDOM_SOURCE
Definition: enum_quda.h:346

quda::setKernelPackT
void setKernelPackT(bool pack)
Definition: dslash_quda.cu:59

staggeredDslashRef
void staggeredDslashRef()
Definition: staggered_dslash_test.cpp:394

QUDA_EVEN_PARITY
Definition: enum_quda.h:259

end
void end(void)
Definition: staggered_dslash_test.cpp:288

kernel_pack_t
bool kernel_pack_t
Definition: test_util.cpp:1650

checkCudaError
#define checkCudaError()
Definition: util_quda.h:129

QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:331

float
float
Definition: CMakeCUDACompilerId.cpp1.ii:12791

quda::Dirac::create
static Dirac * create(const DiracParam &param)
Definition: dirac.cpp:142

quda::ColorSpinorParam::create
QudaFieldCreate create
Definition: color_spinor_field.h:94

QUDA_GHOST_EXCHANGE_PAD
Definition: enum_quda.h:435

d
static __inline__ size_t size_t d
Definition: CMakeCUDACompilerId.cpp1.ii:3019

QUDA_MATPC_EVEN_EVEN
Definition: enum_quda.h:182

quda::Dirac::Dslash
virtual void Dslash(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const =0

quda::ColorSpinorField::GhostBytes
size_t GhostBytes() const
Definition: color_spinor_field.h:374

QUDA_SU3_LINKS
Definition: enum_quda.h:23

QudaInvertParam_s
Definition: quda.h:88

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:296

initComms
void initComms(int argc, char **argv, const int *commDims)
Definition: test_util.cpp:72

gridsize_from_cmdline
int gridsize_from_cmdline[]
Definition: test_util.cpp:50

QUDA_ASQTAD_FAT_LINKS
Definition: enum_quda.h:30

gauge_field.h

cpuFat
cpuGaugeField * cpuFat
Definition: staggered_dslash_test.cpp:38

DslashTime::DslashTime
DslashTime()
Definition: staggered_dslash_test.cpp:319

setVerbosity
void setVerbosity(const QudaVerbosity verbosity)
Definition: util_quda.cpp:24

QudaInvertParam_s::matpc_type
QudaMatPCType matpc_type
Definition: quda.h:183

quda::DiracParam::tmp1
ColorSpinorField * tmp1
Definition: dirac_quda.h:40

dslash
Definition: dslash_events.cuh:1

quda::cpuColorSpinorField
Definition: color_spinor_field.h:789

QudaGaugeParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:40

quda::ColorSpinorField::V
void * V()
Definition: color_spinor_field.h:380

quda::Dirac
Definition: dirac_quda.h:86

newQudaGaugeParam
QudaGaugeParam newQudaGaugeParam(void)

quda_internal.h

quda::LatticeFieldParam::pad
int pad
Definition: lattice_field.h:52

comm_barrier
void comm_barrier(void)
Definition: comm_mpi.cpp:328

fatlink
void * fatlink[4]
Definition: staggered_dslash_test.cpp:47

mass
double mass
Definition: test_util.cpp:1642