quda-ref/v1.0.0/staggered__dslash__test_8cpp_source.html

 #include <iostream>
 #include <stdio.h>
 #include <stdlib.h>
 #include <string.h>

 #include <quda.h>
 #include <quda_internal.h>
 #include <dirac_quda.h>
 #include <dslash_quda.h>
 #include <invert_quda.h>
 #include <util_quda.h>
 #include <blas_quda.h>

 #include <misc.h>
 #include <test_util.h>
 #include <dslash_util.h>
 #include <staggered_dslash_reference.h>
 #include <staggered_gauge_utils.h>
 #include <llfat_reference.h>
 #include <gauge_field.h>
 #include <unitarization_links.h>

 #include <qio_field.h>

 #include <assert.h>
 #include <gtest/gtest.h>

 using namespace quda;

 #define MAX(a,b) ((a)>(b)?(a):(b))

 #define staggeredSpinorSiteSize 6

 // What test are we doing (0 = dslash, 1 = MatPC, 2 = Mat)
 extern int test_type;

 extern void usage(char** argv );

 void *qdp_inlink[4] = { nullptr, nullptr, nullptr, nullptr };

 QudaGaugeParam gaugeParam;
 QudaInvertParam inv_param;

 cpuGaugeField *cpuFat = NULL;
 cpuGaugeField *cpuLong = NULL;

 cpuColorSpinorField *spinor, *spinorOut, *spinorRef, *tmpCpu;
 cudaColorSpinorField *cudaSpinor, *cudaSpinorOut;
 cudaColorSpinorField* tmp;

 // In the HISQ case, we include building fat/long links in this unit test
 void *qdp_fatlink_cpu[4], *qdp_longlink_cpu[4];
 void **ghost_fatlink_cpu, **ghost_longlink_cpu;

 QudaParity parity = QUDA_EVEN_PARITY;
 extern QudaDagType dagger;
 extern int xdim;
 extern int ydim;
 extern int zdim;
 extern int tdim;
 extern int gridsize_from_cmdline[];
 extern QudaReconstructType link_recon;
 extern QudaPrecision prec;
 extern QudaPrecision cpu_prec;
 extern QudaReconstructType link_recon_sloppy;
 extern QudaPrecision prec_sloppy;
 extern QudaDslashType dslash_type;
 extern int device;
 extern bool verify_results;
 extern int niter;
 extern double mass; // the mass of the Dirac operator
 extern double kappa; // will get overriden
 extern int laplace3D;

 extern bool compute_fatlong; // build the true fat/long links or use random numbers
 extern double eps_naik;      // relativistic correction for naik term
 static int n_naiks = 1;      // Number of naiks. If eps_naik is 0.0, we only need to construct one naik.

 extern char latfile[];

 int X[4];
 extern int Nsrc; // number of spinors to apply to simultaneously

 extern QudaVerbosity verbosity;

 Dirac* dirac;

 // For loading the gauge fields
 int argc_copy;
 char** argv_copy;

 double getTolerance(QudaPrecision prec)
 {
   switch (prec) {
   case QUDA_QUARTER_PRECISION: return 1e-1;
   case QUDA_HALF_PRECISION: return 1e-3;
   case QUDA_SINGLE_PRECISION: return 1e-4;
   case QUDA_DOUBLE_PRECISION: return 1e-11;
   case QUDA_INVALID_PRECISION: return 1.0;
   }
   return 1.0;
 }

 void setGaugeParam(QudaGaugeParam &gaugeParam)
 {
   gaugeParam.X[0] = X[0] = xdim;
   gaugeParam.X[1] = X[1] = ydim;
   gaugeParam.X[2] = X[2] = zdim;
   gaugeParam.X[3] = X[3] = tdim;

   gaugeParam.cpu_prec = QUDA_DOUBLE_PRECISION;
   gaugeParam.cuda_prec = prec;
   gaugeParam.reconstruct = link_recon;
   gaugeParam.reconstruct_sloppy = gaugeParam.reconstruct;
   gaugeParam.cuda_prec_sloppy = gaugeParam.cuda_prec;

   // ensure that the default is improved staggered
   if (dslash_type != QUDA_STAGGERED_DSLASH && dslash_type != QUDA_ASQTAD_DSLASH && dslash_type != QUDA_LAPLACE_DSLASH) {
     dslash_type = QUDA_ASQTAD_DSLASH;
   }

   gaugeParam.anisotropy = 1.0;

   // For HISQ, this must always be set to 1.0, since the tadpole
   // correction is baked into the coefficients for the first fattening.
   // The tadpole doesn't mean anything for the second fattening
   // since the input fields are unitarized.
   gaugeParam.tadpole_coeff = 1.0;
   if (dslash_type == QUDA_ASQTAD_DSLASH) {
     gaugeParam.scale = -1.0 / 24.0;
     if (eps_naik != 0) {
       gaugeParam.scale *= (1.0+eps_naik);
     }
   } else {
     gaugeParam.scale = 1.0;
   }
   gaugeParam.gauge_order = QUDA_MILC_GAUGE_ORDER;
   gaugeParam.t_boundary = QUDA_ANTI_PERIODIC_T;
   gaugeParam.staggered_phase_type = QUDA_STAGGERED_PHASE_MILC;
   gaugeParam.gauge_fix = QUDA_GAUGE_FIXED_NO;
   gaugeParam.type = QUDA_WILSON_LINKS;

   int tmpint = MAX(X[1] * X[2] * X[3], X[0] * X[2] * X[3]);
   tmpint = MAX(tmpint, X[0] * X[1] * X[3]);
   tmpint = MAX(tmpint, X[0] * X[1] * X[2]);

   gaugeParam.ga_pad = tmpint;
 }

 void setInvertParam(QudaInvertParam &inv_param)
 {
   inv_param.cpu_prec = QUDA_DOUBLE_PRECISION;
   inv_param.cuda_prec = prec;
   inv_param.dirac_order = QUDA_DIRAC_ORDER;
   inv_param.gamma_basis = QUDA_DEGRAND_ROSSI_GAMMA_BASIS;
   inv_param.dagger = dagger;
   inv_param.matpc_type = QUDA_MATPC_EVEN_EVEN;
   inv_param.dslash_type = dslash_type;
   inv_param.mass = mass;
   inv_param.kappa = kappa = 1.0/(8.0+mass); // for laplace
   inv_param.mass_normalization = QUDA_MASS_NORMALIZATION;
   inv_param.laplace3D = laplace3D; // for laplace
   inv_param.verbosity = verbosity;

   inv_param.input_location = QUDA_CPU_FIELD_LOCATION;
   inv_param.output_location = QUDA_CPU_FIELD_LOCATION;

   int tmpint = MAX(X[1]*X[2]*X[3], X[0]*X[2]*X[3]);
   tmpint = MAX(tmpint, X[0]*X[1]*X[3]);
   tmpint = MAX(tmpint, X[0]*X[1]*X[2]);

   inv_param.sp_pad = tmpint;
 }

 void init()
 {

   initQuda(device);

   gaugeParam = newQudaGaugeParam();
   inv_param = newQudaInvertParam();

   setGaugeParam(gaugeParam);
   setInvertParam(inv_param);

   setDims(gaugeParam.X);
   dw_setDims(gaugeParam.X, Nsrc); // so we can use 5-d indexing from dwf
   setSpinorSiteSize(staggeredSpinorSiteSize);

   size_t gSize = (gaugeParam.cpu_prec == QUDA_DOUBLE_PRECISION) ? sizeof(double) : sizeof(float);

   // Allocate a lot of memory because I'm very confused
   void* milc_fatlink_cpu = malloc(4*V*gaugeSiteSize*gSize);
   void* milc_longlink_cpu = malloc(4*V*gaugeSiteSize*gSize);

   void* milc_fatlink_gpu = malloc(4*V*gaugeSiteSize*gSize);
   void* milc_longlink_gpu = malloc(4*V*gaugeSiteSize*gSize);

   void* qdp_fatlink_gpu[4];
   void* qdp_longlink_gpu[4];

   for (int dir = 0; dir < 4; dir++) {
     qdp_fatlink_gpu[dir] = malloc(V*gaugeSiteSize*gSize);
     qdp_longlink_gpu[dir] = malloc(V*gaugeSiteSize*gSize);

     qdp_fatlink_cpu[dir] = malloc(V*gaugeSiteSize*gSize);
     qdp_longlink_cpu[dir] = malloc(V*gaugeSiteSize*gSize);

     if (qdp_fatlink_gpu[dir] == NULL || qdp_longlink_gpu[dir] == NULL ||
           qdp_fatlink_cpu[dir] == NULL || qdp_longlink_cpu[dir] == NULL) {
       errorQuda("ERROR: malloc failed for fatlink/longlink");
     }
   }

   // create a base field
   for (int dir = 0; dir < 4; dir++) {
     if (qdp_inlink[dir] == nullptr) {
       qdp_inlink[dir] = malloc(V*gaugeSiteSize*gSize);
     }
   }

   // load a field WITHOUT PHASES
   if (strcmp(latfile,"")) {
     read_gauge_field(latfile, qdp_inlink, gaugeParam.cpu_prec, gaugeParam.X, argc_copy, argv_copy);
     if (dslash_type != QUDA_LAPLACE_DSLASH) {
       applyGaugeFieldScaling_long(qdp_inlink, Vh, &gaugeParam, QUDA_STAGGERED_DSLASH, gaugeParam.cpu_prec);
     } // else it's already been loaded
   } else {
     if (dslash_type == QUDA_LAPLACE_DSLASH) {
       construct_gauge_field(qdp_inlink, 1, gaugeParam.cpu_prec, &gaugeParam);
     } else {
       construct_fat_long_gauge_field(qdp_inlink, qdp_longlink_cpu, 1, gaugeParam.cpu_prec,&gaugeParam,compute_fatlong ? QUDA_STAGGERED_DSLASH : dslash_type);
     }
   }

   // QUDA_STAGGERED_DSLASH follows the same codepath whether or not you
   // "compute" the fat/long links or not.
   if (dslash_type == QUDA_STAGGERED_DSLASH || dslash_type == QUDA_LAPLACE_DSLASH) {
     for (int dir = 0; dir < 4; dir++) {
       memcpy(qdp_fatlink_gpu[dir],qdp_inlink[dir], V*gaugeSiteSize*gSize);
       memcpy(qdp_fatlink_cpu[dir],qdp_inlink[dir], V*gaugeSiteSize*gSize);
       memset(qdp_longlink_gpu[dir],0,V*gaugeSiteSize*gSize);
       memset(qdp_longlink_cpu[dir],0,V*gaugeSiteSize*gSize);
     }
   } else { // QUDA_ASQTAD_DSLASH

     if (compute_fatlong) {
       computeFatLongGPUandCPU(qdp_fatlink_gpu, qdp_longlink_gpu, qdp_fatlink_cpu, qdp_longlink_cpu, qdp_inlink,
                               gaugeParam, gSize, n_naiks, eps_naik);
     } else {
       // Not computing FatLong
       for (int dir = 0; dir < 4; dir++) {
         memcpy(qdp_fatlink_gpu[dir],qdp_inlink[dir], V*gaugeSiteSize*gSize);
         memcpy(qdp_fatlink_cpu[dir],qdp_inlink[dir], V*gaugeSiteSize*gSize);
         memcpy(qdp_longlink_gpu[dir],qdp_longlink_cpu[dir],V*gaugeSiteSize*gSize);
       }
     }
   }

   // Alright, we've created all the void** links.
   // Create the void* pointers
   reorderQDPtoMILC(milc_fatlink_gpu,qdp_fatlink_gpu,V,gaugeSiteSize,gaugeParam.cpu_prec,gaugeParam.cpu_prec);
   reorderQDPtoMILC(milc_fatlink_cpu,qdp_fatlink_cpu,V,gaugeSiteSize,gaugeParam.cpu_prec,gaugeParam.cpu_prec);
   reorderQDPtoMILC(milc_longlink_gpu,qdp_longlink_gpu,V,gaugeSiteSize,gaugeParam.cpu_prec,gaugeParam.cpu_prec);
   reorderQDPtoMILC(milc_longlink_cpu,qdp_longlink_cpu,V,gaugeSiteSize,gaugeParam.cpu_prec,gaugeParam.cpu_prec);
   // Create ghost zones for CPU fields,
   // prepare and load the GPU fields

 #ifdef MULTI_GPU

   gaugeParam.type = (dslash_type == QUDA_ASQTAD_DSLASH) ? QUDA_ASQTAD_FAT_LINKS : QUDA_SU3_LINKS;
   gaugeParam.reconstruct = QUDA_RECONSTRUCT_NO;
   GaugeFieldParam cpuFatParam(milc_fatlink_cpu, gaugeParam);
   cpuFatParam.ghostExchange = QUDA_GHOST_EXCHANGE_PAD;
   cpuFat = new cpuGaugeField(cpuFatParam);
   ghost_fatlink_cpu = cpuFat->Ghost();

   gaugeParam.type = QUDA_ASQTAD_LONG_LINKS;
   GaugeFieldParam cpuLongParam(milc_longlink_cpu, gaugeParam);
   cpuLongParam.ghostExchange = QUDA_GHOST_EXCHANGE_PAD;
   cpuLong = new cpuGaugeField(cpuLongParam);
   ghost_longlink_cpu = cpuLong->Ghost();

   int x_face_size = X[1]*X[2]*X[3]/2;
   int y_face_size = X[0]*X[2]*X[3]/2;
   int z_face_size = X[0]*X[1]*X[3]/2;
   int t_face_size = X[0]*X[1]*X[2]/2;
   int pad_size = MAX(x_face_size, y_face_size);
   pad_size = MAX(pad_size, z_face_size);
   pad_size = MAX(pad_size, t_face_size);
   gaugeParam.ga_pad = pad_size;
 #endif

   gaugeParam.type = (dslash_type == QUDA_ASQTAD_DSLASH) ? QUDA_ASQTAD_FAT_LINKS : QUDA_SU3_LINKS;
   if (dslash_type == QUDA_STAGGERED_DSLASH) {
     gaugeParam.reconstruct = gaugeParam.reconstruct_sloppy = (link_recon == QUDA_RECONSTRUCT_12) ?
       QUDA_RECONSTRUCT_13 :
       (link_recon == QUDA_RECONSTRUCT_8) ? QUDA_RECONSTRUCT_9 : link_recon;
   } else {
     gaugeParam.reconstruct = gaugeParam.reconstruct_sloppy = QUDA_RECONSTRUCT_NO;
   }

   // set verbosity prior to loadGaugeQuda
   setVerbosity(verbosity);

   // printfQuda("Fat links sending...");
   loadGaugeQuda(milc_fatlink_gpu, &gaugeParam);
   // printfQuda("Fat links sent\n");

   gaugeParam.type = QUDA_ASQTAD_LONG_LINKS;

 #ifdef MULTI_GPU
   gaugeParam.ga_pad = 3*pad_size;
 #endif

   if (dslash_type == QUDA_ASQTAD_DSLASH) {
     gaugeParam.staggered_phase_type = QUDA_STAGGERED_PHASE_NO;
     gaugeParam.reconstruct = gaugeParam.reconstruct_sloppy = (link_recon == QUDA_RECONSTRUCT_12) ?
       QUDA_RECONSTRUCT_13 :
       (link_recon == QUDA_RECONSTRUCT_8) ? QUDA_RECONSTRUCT_9 : link_recon;

     // printfQuda("Long links sending...");
     loadGaugeQuda(milc_longlink_gpu, &gaugeParam);
     // printfQuda("Long links sent...\n");
   }

   ColorSpinorParam csParam;
   csParam.nColor = 3;
   csParam.nSpin = 1;
   csParam.nDim = 5;
   for (int d = 0; d < 4; d++) { csParam.x[d] = gaugeParam.X[d]; }
   csParam.x[4] = Nsrc; // number of sources becomes the fifth dimension

   csParam.setPrecision(inv_param.cpu_prec);
   inv_param.solution_type = QUDA_MAT_SOLUTION;
   csParam.pad = 0;
   if (test_type < 2 && dslash_type != QUDA_LAPLACE_DSLASH) {
     csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;
     csParam.x[0] /= 2;
   } else {
     csParam.siteSubset = QUDA_FULL_SITE_SUBSET;
   }

   csParam.siteOrder = QUDA_EVEN_ODD_SITE_ORDER;
   csParam.fieldOrder = QUDA_SPACE_SPIN_COLOR_FIELD_ORDER;
   csParam.gammaBasis = inv_param.gamma_basis; // this parameter is meaningless for staggered
   csParam.create = QUDA_ZERO_FIELD_CREATE;

   spinor = new cpuColorSpinorField(csParam);
   spinorOut = new cpuColorSpinorField(csParam);
   spinorRef = new cpuColorSpinorField(csParam);
   tmpCpu = new cpuColorSpinorField(csParam);

   spinor->Source(QUDA_RANDOM_SOURCE);

   csParam.fieldOrder = QUDA_FLOAT2_FIELD_ORDER;
   csParam.pad = inv_param.sp_pad;
   csParam.setPrecision(inv_param.cuda_prec);

   cudaSpinor = new cudaColorSpinorField(csParam);
   cudaSpinorOut = new cudaColorSpinorField(csParam);
   *cudaSpinor = *spinor;
   tmp = new cudaColorSpinorField(csParam);

   cudaDeviceSynchronize();
   checkCudaError();

   bool pc = (test_type == 1); // For test_type 0, can use either pc or not pc
                               // because both call the same "Dslash" directly.
   DiracParam diracParam;
   setDiracParam(diracParam, &inv_param, pc);
   diracParam.tmp1 = tmp;
   dirac = Dirac::create(diracParam);

   for (int dir = 0; dir < 4; dir++) {
     free(qdp_fatlink_gpu[dir]); qdp_fatlink_gpu[dir] = nullptr;
     free(qdp_longlink_gpu[dir]); qdp_longlink_gpu[dir] = nullptr;
   }
   free(milc_fatlink_gpu); milc_fatlink_gpu = nullptr;
   free(milc_longlink_gpu); milc_longlink_gpu = nullptr;
   free(milc_fatlink_cpu); milc_fatlink_cpu = nullptr;
   free(milc_longlink_cpu); milc_longlink_cpu = nullptr;

   gaugeParam.reconstruct = link_recon;

   return;
 }

 void end()
 {
   for (int dir = 0; dir < 4; dir++) {
     if (qdp_fatlink_cpu[dir] != nullptr) { free(qdp_fatlink_cpu[dir]); qdp_fatlink_cpu[dir] = nullptr; }
     if (qdp_longlink_cpu[dir] != nullptr) { free(qdp_longlink_cpu[dir]); qdp_longlink_cpu[dir] = nullptr; }
   }

   if (dirac != nullptr) {
     delete dirac;
     dirac = nullptr;
   }
   if (cudaSpinor != nullptr) {
     delete cudaSpinor;
     cudaSpinor = nullptr;
   }
   if (cudaSpinorOut != nullptr) {
     delete cudaSpinorOut;
     cudaSpinorOut = nullptr;
   }
   if (tmp != nullptr) {
     delete tmp;
     tmp = nullptr;
   }

   if (spinor != nullptr) { delete spinor; spinor = nullptr; }
   if (spinorOut != nullptr) { delete spinorOut; spinorOut = nullptr; }
   if (spinorRef != nullptr) { delete spinorRef; spinorRef = nullptr; }
   if (tmpCpu != nullptr) { delete tmpCpu; tmpCpu = nullptr; }

   freeGaugeQuda();

   if (cpuFat) { delete cpuFat; cpuFat = nullptr; }
   if (cpuLong) { delete cpuLong; cpuLong = nullptr; }
   commDimPartitionedReset();

   endQuda();
 }

 struct DslashTime {
   double event_time;
   double cpu_time;
   double cpu_min;
   double cpu_max;

   DslashTime() : event_time(0.0), cpu_time(0.0), cpu_min(DBL_MAX), cpu_max(0.0) {}
 };

 DslashTime dslashCUDA(int niter) {

   DslashTime dslash_time;
   timeval tstart, tstop;

   cudaEvent_t start, end;
   cudaEventCreate(&start);
   cudaEventRecord(start, 0);
   cudaEventSynchronize(start);

   comm_barrier();
   cudaEventRecord(start, 0);

   for (int i = 0; i < niter; i++) {

     gettimeofday(&tstart, NULL);

     switch (test_type) {
     case 0: dirac->Dslash(*cudaSpinorOut, *cudaSpinor, parity); break;
     case 1: dirac->M(*cudaSpinorOut, *cudaSpinor); break;
     case 2: dirac->M(*cudaSpinorOut, *cudaSpinor); break;
     }

     gettimeofday(&tstop, NULL);
     long ds = tstop.tv_sec - tstart.tv_sec;
     long dus = tstop.tv_usec - tstart.tv_usec;
     double elapsed = ds + 0.000001*dus;

     dslash_time.cpu_time += elapsed;
     // skip first and last iterations since they may skew these metrics if comms are not synchronous
     if (i>0 && i<niter) {
       if (elapsed < dslash_time.cpu_min) dslash_time.cpu_min = elapsed;
       if (elapsed > dslash_time.cpu_max) dslash_time.cpu_max = elapsed;
     }
   }

   cudaEventCreate(&end);
   cudaEventRecord(end, 0);
   cudaEventSynchronize(end);
   float runTime;
   cudaEventElapsedTime(&runTime, start, end);
   cudaEventDestroy(start);
   cudaEventDestroy(end);

   dslash_time.event_time = runTime / 1000;

   // check for errors
   cudaError_t stat = cudaGetLastError();
   if (stat != cudaSuccess)
     errorQuda("with ERROR: %s\n", cudaGetErrorString(stat));

   return dslash_time;
 }

 void staggeredDslashRef()
 {

   // compare to dslash reference implementation
   // printfQuda("Calculating reference implementation...");
   fflush(stdout);
   switch (test_type) {
     case 0:
       staggered_dslash(spinorRef, qdp_fatlink_cpu, qdp_longlink_cpu, ghost_fatlink_cpu, ghost_longlink_cpu, spinor,
           parity, dagger, inv_param.cpu_prec, gaugeParam.cpu_prec, dslash_type);
       break;
     case 1:
       matdagmat(spinorRef, qdp_fatlink_cpu, qdp_longlink_cpu, ghost_fatlink_cpu, ghost_longlink_cpu, spinor, mass, 0,
           inv_param.cpu_prec, gaugeParam.cpu_prec, tmpCpu, parity, dslash_type);
       break;
     case 2:
       // Not sure about the !dagger...
       staggered_dslash(reinterpret_cast<cpuColorSpinorField *>(&spinorRef->Even()), qdp_fatlink_cpu, qdp_longlink_cpu,
           ghost_fatlink_cpu, ghost_longlink_cpu, reinterpret_cast<cpuColorSpinorField *>(&spinor->Odd()),
           QUDA_EVEN_PARITY, !dagger, inv_param.cpu_prec, gaugeParam.cpu_prec, dslash_type);
       staggered_dslash(reinterpret_cast<cpuColorSpinorField *>(&spinorRef->Odd()), qdp_fatlink_cpu, qdp_longlink_cpu,
           ghost_fatlink_cpu, ghost_longlink_cpu, reinterpret_cast<cpuColorSpinorField *>(&spinor->Even()),
           QUDA_ODD_PARITY, !dagger, inv_param.cpu_prec, gaugeParam.cpu_prec, dslash_type);
       if (dslash_type == QUDA_LAPLACE_DSLASH) {
         xpay(spinor->V(), kappa, spinorRef->V(), spinor->Length(), gaugeParam.cpu_prec);
       } else {
         axpy(2*mass, spinor->V(), spinorRef->V(), spinor->Length(), gaugeParam.cpu_prec);
       }
       break;
     default:
       errorQuda("Test type not defined");
   }
 }

 TEST(dslash, verify) {
   double deviation = pow(10, -(double)(cpuColorSpinorField::Compare(*spinorRef, *spinorOut)));
   double tol = getTolerance(prec);
   ASSERT_LE(deviation, tol) << "CPU and CUDA implementations do not agree";
 }

 static int dslashTest()
 {

   for (int dir = 0; dir < 4; dir++) {
     qdp_fatlink_cpu[dir] = nullptr;
     qdp_longlink_cpu[dir] = nullptr;
   }

   dirac = nullptr;
   cudaSpinor = nullptr;
   cudaSpinorOut = nullptr;
   tmp = nullptr;

   spinor = nullptr;
   spinorOut = nullptr;
   spinorRef = nullptr;
   tmpCpu = nullptr;

   bool failed = false;

   // return code for google test
   int test_rc = 0;
   init();

   int attempts = 1;

   for (int i=0; i<attempts; i++) {

     { // warm-up run
       printfQuda("Tuning...\n");
       dslashCUDA(1);
     }
     printfQuda("Executing %d kernel loops...", niter);

     // reset flop counter
     dirac->Flops();

     DslashTime dslash_time = dslashCUDA(niter);

     *spinorOut = *cudaSpinorOut;

     printfQuda("%fus per kernel call\n", 1e6*dslash_time.event_time / niter);
     staggeredDslashRef();

     double spinor_ref_norm2 = blas::norm2(*spinorRef);
     double spinor_out_norm2 = blas::norm2(*spinorOut);

     // Catching nans is weird.
     if (std::isnan(spinor_ref_norm2)) { failed = true; }
     if (std::isnan(spinor_out_norm2)) { failed = true; }

     unsigned long long flops = dirac->Flops();
     printfQuda("GFLOPS = %f\n", 1.0e-9*flops/dslash_time.event_time);

     if (niter > 2) { // only print this if valid
       printfQuda("Effective halo bi-directional bandwidth (GB/s) GPU = %f ( CPU = %f, min = %f , max = %f ) for "
                  "aggregate message size %lu bytes\n",
                  1.0e-9 * 2 * cudaSpinor->GhostBytes() * niter / dslash_time.event_time,
                  1.0e-9 * 2 * cudaSpinor->GhostBytes() * niter / dslash_time.cpu_time,
                  1.0e-9 * 2 * cudaSpinor->GhostBytes() / dslash_time.cpu_max,
                  1.0e-9 * 2 * cudaSpinor->GhostBytes() / dslash_time.cpu_min, 2 * cudaSpinor->GhostBytes());
     }

     double cuda_spinor_out_norm2 = blas::norm2(*cudaSpinorOut);
     printfQuda("Results: CPU=%f, CUDA=%f, CPU-CUDA=%f\n", spinor_ref_norm2, cuda_spinor_out_norm2, spinor_out_norm2);

     if (verify_results) {
       test_rc = RUN_ALL_TESTS();
       if (test_rc != 0 || failed) warningQuda("Tests failed");
     }
   }
   end();

   return test_rc;
 }

 void display_test_info()
 {
   printfQuda("running the following test:\n");
   printfQuda("prec recon   test_type     dagger   S_dim         T_dimension\n");
   printfQuda("%s   %s       %d           %d       %d/%d/%d        %d \n", get_prec_str(prec), get_recon_str(link_recon),
       test_type, dagger, xdim, ydim, zdim, tdim);
   printfQuda("Grid partition info:     X  Y  Z  T\n");
   printfQuda("                         %d  %d  %d  %d\n", dimPartitioned(0), dimPartitioned(1), dimPartitioned(2),
       dimPartitioned(3));

   return ;
 }

 void usage_extra(char **argv)
 {
   printfQuda("Extra options:\n");
   printfQuda("    --test <0/1/2>                              # Test method\n");
   printfQuda("                                                0: Even destination spinor\n");
   printfQuda("                                                1: Odd destination spinor\n");
   printfQuda("                                                2: Full spinor\n");
   return ;
 }

 int main(int argc, char **argv)
 {
   // hack for loading gauge fields
   argc_copy = argc;
   argv_copy = argv;

   // initalize google test
   ::testing::InitGoogleTest(&argc, argv);
   for (int i=1 ;i < argc; i++){

     if (process_command_line_option(argc, argv, &i) == 0) { continue; }

     fprintf(stderr, "ERROR: Invalid option:%s\n", argv[i]);
     usage(argv);
   }

   initComms(argc, argv, gridsize_from_cmdline);

   // Ensure that the default is improved staggered
   if (dslash_type != QUDA_STAGGERED_DSLASH &&
       dslash_type != QUDA_ASQTAD_DSLASH &&
       dslash_type != QUDA_LAPLACE_DSLASH) {
     warningQuda("The dslash_type %d isn't staggered, asqtad, or laplace. Defaulting to asqtad.\n", dslash_type);
     dslash_type = QUDA_ASQTAD_DSLASH;
   }

   // Sanity check: if you pass in a gauge field, want to test the asqtad/hisq dslash,
   // and don't ask to build the fat/long links... it doesn't make sense.
   if (strcmp(latfile,"") && !compute_fatlong && dslash_type == QUDA_ASQTAD_DSLASH) {
     errorQuda("Cannot load a gauge field and test the ASQTAD/HISQ operator without setting \"--compute-fat-long true\".\n");
   }

   // Set n_naiks to 2 if eps_naik != 0.0
   if (dslash_type == QUDA_ASQTAD_DSLASH) {
     if (eps_naik != 0.0) {
       if (compute_fatlong) {
         n_naiks = 2;
         printfQuda("Note: epsilon-naik != 0, testing epsilon correction links.\n");
       } else {
         eps_naik = 0.0;
         printfQuda("Not computing fat-long, ignoring epsilon correction.\n");
       }
     } else {
       printfQuda("Note: epsilon-naik = 0, testing original HISQ links.\n");
     }
   }

   if (dslash_type == QUDA_LAPLACE_DSLASH) {
     if (test_type != 2) {
       errorQuda("Test type %d is not supported for the Laplace operator.\n", test_type);
     }
   }

   // If we're building fat/long links, there are some
   // tests we have to skip.
   if (dslash_type == QUDA_ASQTAD_DSLASH && compute_fatlong) {
     if (prec == QUDA_HALF_PRECISION /* half */) {
       errorQuda("Half precision unsupported in fat/long compute");
     }
   }
   if (dslash_type == QUDA_LAPLACE_DSLASH && prec == QUDA_HALF_PRECISION) {
     errorQuda("Half precision unsupported for Laplace operator.\n");
   }

   display_test_info();

   // return result of RUN_ALL_TESTS
   int test_rc = dslashTest();

   finalizeComms();

   return test_rc;
 }
computeFatLongGPUandCPU
void computeFatLongGPUandCPU(void **qdp_fatlink_gpu, void **qdp_longlink_gpu, void **qdp_fatlink_cpu, void **qdp_longlink_cpu, void **qdp_inlink, QudaGaugeParam &gauge_param, size_t gSize, int n_naiks, double eps_naik)
Definition: staggered_gauge_utils.cpp:210

QudaInvertParam_s::laplace3D
int laplace3D
Definition: quda.h:119

gSize
static size_t gSize
Definition: hisq_stencil_test.cpp:48

invert_quda.h

dimPartitioned
int dimPartitioned(int dim)
Definition: test_util.cpp:1776

QudaInvertParam_s::dirac_order
QudaDiracFieldOrder dirac_order
Definition: quda.h:219

applyGaugeFieldScaling_long
void applyGaugeFieldScaling_long(Float **gauge, int Vh, QudaGaugeParam *param, QudaDslashType dslash_type)
Definition: test_util.cpp:747

QudaInvertParam_s::mass_normalization
QudaMassNormalization mass_normalization
Definition: quda.h:208

dslash_type
QudaDslashType dslash_type
Definition: test_util.cpp:1621

QudaGaugeParam_s::reconstruct_sloppy
QudaReconstructType reconstruct_sloppy
Definition: quda.h:53

QudaGaugeParam_s::anisotropy
double anisotropy
Definition: quda.h:38

spinorOut
cpuColorSpinorField * spinorOut
Definition: staggered_dslash_test.cpp:47

QUDA_RECONSTRUCT_NO
Definition: enum_quda.h:67

device
int device
Definition: test_util.cpp:1602

setInvertParam
void setInvertParam(QudaInvertParam &inv_param)
Definition: staggered_dslash_test.cpp:150

quda::LatticeFieldParam::ghostExchange
QudaGhostExchange ghostExchange
Definition: lattice_field.h:76

quda::ColorSpinorParam::setPrecision
void setPrecision(QudaPrecision precision, QudaPrecision ghost_precision=QUDA_INVALID_PRECISION, bool force_native=false)
Definition: color_spinor_field.h:231

dslashTest
static int dslashTest()
Definition: staggered_dslash_test.cpp:530

QUDA_MAT_SOLUTION
Definition: enum_quda.h:151

Nsrc
int Nsrc
Definition: test_util.cpp:1627

endQuda
void endQuda(void)
Definition: interface_quda.cpp:1461

construct_gauge_field
void construct_gauge_field(void **gauge, int type, QudaPrecision precision, QudaGaugeParam *param)
Definition: test_util.cpp:1047

staggered_gauge_utils.h

llfat_reference.h

QudaPrecision
enum QudaPrecision_s QudaPrecision

argv_copy
char ** argv_copy
Definition: staggered_dslash_test.cpp:90

zdim
int zdim
Definition: test_util.cpp:1617

QudaGaugeParam_s::ga_pad
int ga_pad
Definition: quda.h:63

misc.h

dw_setDims
void dw_setDims(int *X, const int L5)
Definition: test_util.cpp:187

main
int main(int argc, char **argv)
Definition: staggered_dslash_test.cpp:629

dslashCUDA
DslashTime dslashCUDA(int niter)
Definition: staggered_dslash_test.cpp:436

QudaGaugeParam_s::gauge_fix
QudaGaugeFixed gauge_fix
Definition: quda.h:61

ghost_fatlink_cpu
void ** ghost_fatlink_cpu
Definition: staggered_dslash_test.cpp:53

QUDA_MASS_NORMALIZATION
Definition: enum_quda.h:225

quda::ColorSpinorParam::nColor
int nColor
Definition: color_spinor_field.h:85

QUDA_INVALID_PRECISION
Definition: enum_quda.h:63

QUDA_ASQTAD_DSLASH
Definition: enum_quda.h:93

QudaGaugeParam_s::type
QudaLinkType type
Definition: quda.h:42

spinorRef
cpuColorSpinorField * spinorRef
Definition: staggered_dslash_test.cpp:47

ghost_longlink_cpu
void ** ghost_longlink_cpu
Definition: staggered_dslash_test.cpp:53

QudaInvertParam_s::kappa
double kappa
Definition: quda.h:106

staggered_dslash_reference.h

dagger
QudaDagType dagger
Definition: test_util.cpp:1620

eps_naik
double eps_naik
Definition: test_util.cpp:1652

link_recon
QudaReconstructType link_recon
Definition: test_util.cpp:1605

errorQuda
#define errorQuda(...)
Definition: util_quda.h:121

quda::blas::norm2
double norm2(const ColorSpinorField &a)
Definition: reduce_quda.cu:721

QudaInvertParam_s::dslash_type
QudaDslashType dslash_type
Definition: quda.h:102

QUDA_GAUGE_FIXED_NO
Definition: enum_quda.h:77

test_util.h

gaugeParam
QudaGaugeParam gaugeParam
Definition: staggered_dslash_test.cpp:41

QudaInvertParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:214

QUDA_QUARTER_PRECISION
Definition: enum_quda.h:59

QUDA_ODD_PARITY
Definition: enum_quda.h:288

QUDA_SPACE_SPIN_COLOR_FIELD_ORDER
Definition: enum_quda.h:350

QUDA_HALF_PRECISION
Definition: enum_quda.h:60

loadGaugeQuda
void loadGaugeQuda(void *h_gauge, QudaGaugeParam *param)
Definition: interface_quda.cpp:729

DslashTime::cpu_min
double cpu_min
Definition: dslash_ctest.cpp:462

QUDA_WILSON_LINKS
Definition: enum_quda.h:29

verbosity
QudaVerbosity verbosity
Definition: test_util.cpp:1614

QudaInvertParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:213

process_command_line_option
int process_command_line_option(int argc, char **argv, int *idx)
Definition: test_util.cpp:2019

quda::cpuColorSpinorField::Source
void Source(const QudaSourceType sourceType, const int st=0, const int s=0, const int c=0)
Definition: cpu_color_spinor_field.cpp:247

QUDA_FULL_SITE_SUBSET
Definition: enum_quda.h:333

quda::ColorSpinorField::Even
const ColorSpinorField & Even() const
Definition: color_spinor_field.cpp:608

niter
int niter
Definition: test_util.cpp:1629

quda::ColorSpinorField::Odd
const ColorSpinorField & Odd() const
Definition: color_spinor_field.cpp:616

QudaGaugeParam_s::staggered_phase_type
QudaStaggeredPhase staggered_phase_type
Definition: quda.h:71

argc_copy
int argc_copy
Definition: staggered_dslash_test.cpp:89

QudaInvertParam_s::dagger
QudaDagType dagger
Definition: quda.h:207

qdp_fatlink_cpu
void * qdp_fatlink_cpu[4]
Definition: staggered_dslash_test.cpp:52

finalizeComms
void finalizeComms()
Definition: test_util.cpp:128

quda::cudaColorSpinorField
Definition: color_spinor_field.h:575

usage
void usage(char **argv)
Definition: test_util.cpp:1783

spinor
cpuColorSpinorField * spinor
Definition: staggered_dslash_test.cpp:47

cudaSpinor
cudaColorSpinorField * cudaSpinor
Definition: staggered_dslash_test.cpp:48

QudaGaugeParam_s::gauge_order
QudaGaugeFieldOrder gauge_order
Definition: quda.h:43

util_quda.h

get_prec_str
const char * get_prec_str(QudaPrecision prec)
Definition: misc.cpp:701

quda::Dirac::Flops
unsigned long long Flops() const
Definition: dirac_quda.h:177

compute_fatlong
bool compute_fatlong
Definition: test_util.cpp:1655

quda
Definition: blas_cublas.h:5

quda::LatticeFieldParam::siteSubset
QudaSiteSubset siteSubset
Definition: lattice_field.h:71

setDims
void setDims(int *)
Definition: test_util.cpp:151

QudaInvertParam_s::input_location
QudaFieldLocation input_location
Definition: quda.h:99

freeGaugeQuda
void freeGaugeQuda(void)
Definition: interface_quda.cpp:1259

quda::blas::xpay
void xpay(ColorSpinorField &x, double a, ColorSpinorField &y)
Definition: blas_quda.h:37

dirac_quda.h

test_type
int test_type
Definition: test_util.cpp:1636

quda::setDiracParam
void setDiracParam(DiracParam &diracParam, QudaInvertParam *inv_param, bool pc)
Definition: interface_quda.cpp:1562

QudaInvertParam_s::solution_type
QudaSolutionType solution_type
Definition: quda.h:204

verify_results
bool verify_results
Definition: test_util.cpp:1643

staggeredSpinorSiteSize
#define staggeredSpinorSiteSize
Definition: staggered_dslash_test.cpp:32

prec
QudaPrecision prec
Definition: test_util.cpp:1608

dirac
Dirac * dirac
Definition: staggered_dslash_test.cpp:86

quda::LatticeFieldParam::x
int x[QUDA_MAX_DIM]
Definition: lattice_field.h:67

QUDA_RECONSTRUCT_9
Definition: enum_quda.h:70

quda::GaugeFieldParam
Definition: gauge_field.h:10

tmpCpu
cpuColorSpinorField * tmpCpu
Definition: staggered_dslash_test.cpp:47

quda::DiracParam
Definition: dirac_quda.h:19

usage_extra
void usage_extra(char **argv)
Definition: staggered_dslash_test.cpp:619

QudaGaugeParam_s::scale
double scale
Definition: quda.h:40

initQuda
void initQuda(int device)
Definition: interface_quda.cpp:679

tmp
cudaColorSpinorField * tmp
Definition: staggered_dslash_test.cpp:49

QUDA_EVEN_ODD_SITE_ORDER
Definition: enum_quda.h:340

tol
double tol
Definition: test_util.cpp:1656

QudaInvertParam_s::output_location
QudaFieldLocation output_location
Definition: quda.h:100

QUDA_RECONSTRUCT_12
Definition: enum_quda.h:68

xdim
int xdim
Definition: test_util.cpp:1615

QudaGaugeParam_s
Definition: quda.h:32

quda::ColorSpinorParam::fieldOrder
QudaFieldOrder fieldOrder
Definition: color_spinor_field.h:93

qdp_longlink_cpu
void * qdp_longlink_cpu[4]
Definition: staggered_dslash_test.cpp:52

reorderQDPtoMILC
void reorderQDPtoMILC(Out *milc_out, In **qdp_in, int V, int siteSize)
Definition: llfat_reference.cpp:856

QudaInvertParam_s::verbosity
QudaVerbosity verbosity
Definition: quda.h:244

setSpinorSiteSize
void setSpinorSiteSize(int n)
Definition: test_util.cpp:211

latfile
char latfile[]
Definition: test_util.cpp:1623

csParam
ColorSpinorParam csParam
Definition: pack_test.cpp:24

QUDA_MILC_GAUGE_ORDER
Definition: enum_quda.h:44

newQudaInvertParam
QudaInvertParam newQudaInvertParam(void)

get_recon_str
const char * get_recon_str(QudaReconstructType recon)
Definition: misc.cpp:768

MAX
#define MAX(a, b)
Definition: staggered_dslash_test.cpp:30

quda::cpuGaugeField
Definition: gauge_field.h:580

DslashTime::event_time
double event_time
Definition: dslash_ctest.cpp:460

quda::ColorSpinorParam::gammaBasis
QudaGammaBasis gammaBasis
Definition: color_spinor_field.h:94

DslashTime::cpu_time
double cpu_time
Definition: dslash_ctest.cpp:461

TEST
TEST(dslash, verify)
Definition: staggered_dslash_test.cpp:524

warningQuda
#define warningQuda(...)
Definition: util_quda.h:133

quda::pow
__host__ __device__ ValueType pow(ValueType x, ExponentType e)
Definition: complex_quda.h:111

matdagmat
void matdagmat(void *out, void **link, void *in, int dagger_bit, int mu, QudaPrecision sPrecision, QudaPrecision gPrecision, void *tmp, QudaParity parity)
Definition: covdev_reference.cpp:163

QUDA_PARITY_SITE_SUBSET
Definition: enum_quda.h:332

parity
QudaParity parity
Definition: staggered_dslash_test.cpp:55

QudaInvertParam_s::gamma_basis
QudaGammaBasis gamma_basis
Definition: quda.h:221

staggered_dslash
void staggered_dslash(cpuColorSpinorField *out, void **fatlink, void **longlink, void **ghost_fatlink, void **ghost_longlink, cpuColorSpinorField *in, int oddBit, int daggerBit, QudaPrecision sPrecision, QudaPrecision gPrecision, QudaDslashType dslash_type)
Definition: staggered_dslash_reference.cpp:132

QUDA_FLOAT2_FIELD_ORDER
Definition: enum_quda.h:348

cudaSpinorOut
cudaColorSpinorField * cudaSpinorOut
Definition: staggered_dslash_test.cpp:48

QudaGaugeParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:52

quda::GaugeField::Ghost
const void ** Ghost() const
Definition: gauge_field.h:323

dslash_util.h

QudaDagType
enum QudaDagType_s QudaDagType

link_recon_sloppy
QudaReconstructType link_recon_sloppy
Definition: test_util.cpp:1606

QUDA_LAPLACE_DSLASH
Definition: enum_quda.h:96

QudaParity
enum QudaParity_s QudaParity

QudaGaugeParam_s::reconstruct
QudaReconstructType reconstruct
Definition: quda.h:50

QudaGaugeParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:49

QUDA_ASQTAD_LONG_LINKS
Definition: enum_quda.h:31

QudaGaugeParam_s::X
int X[4]
Definition: quda.h:36

QudaInvertParam_s::mass
double mass
Definition: quda.h:105

prec_sloppy
QudaPrecision prec_sloppy
Definition: test_util.cpp:1609

laplace3D
int laplace3D
Definition: test_util.cpp:1622

V
int V
Definition: test_util.cpp:27

quda::LatticeFieldParam::nDim
int nDim
Definition: lattice_field.h:64

X
int X[4]
Definition: staggered_dslash_test.cpp:81

setGaugeParam
void setGaugeParam(QudaGaugeParam &gaugeParam)
Definition: staggered_dslash_test.cpp:104

quda::cpuColorSpinorField::Compare
static int Compare(const cpuColorSpinorField &a, const cpuColorSpinorField &b, const int resolution=1)
Perform a component by component comparison of two color-spinor fields. In doing we normalize with re...
Definition: cpu_color_spinor_field.cpp:251

QudaInvertParam_s::sp_pad
int sp_pad
Definition: quda.h:246

memset
void * memset(void *s, int c, size_t n)

blas_quda.h

QUDA_RECONSTRUCT_8
Definition: enum_quda.h:69

construct_fat_long_gauge_field
void construct_fat_long_gauge_field(void **fatlink, void **longlink, int type, QudaPrecision precision, QudaGaugeParam *param, QudaDslashType dslash_type)
Definition: test_util.cpp:1062

init
void init()
Definition: staggered_dslash_test.cpp:175

quda::Dirac::M
virtual void M(ColorSpinorField &out, const ColorSpinorField &in) const =0

quda::ColorSpinorParam
Definition: color_spinor_field.h:80

cpuLong
cpuGaugeField * cpuLong
Definition: staggered_dslash_test.cpp:45

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:62

n_naiks
static int n_naiks
Definition: staggered_dslash_test.cpp:77

unitarization_links.h

QudaGaugeParam_s::tadpole_coeff
double tadpole_coeff
Definition: quda.h:39

getTolerance
double getTolerance(QudaPrecision prec)
Definition: staggered_dslash_test.cpp:92

tdim
int tdim
Definition: test_util.cpp:1618

QUDA_STAGGERED_DSLASH
Definition: enum_quda.h:92

ydim
int ydim
Definition: test_util.cpp:1616

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:61

end
void end()
Definition: staggered_dslash_test.cpp:389

quda::ColorSpinorParam::nSpin
int nSpin
Definition: color_spinor_field.h:86

display_test_info
void display_test_info()
Definition: staggered_dslash_test.cpp:606

QudaReconstructType
enum QudaReconstructType_s QudaReconstructType

commDimPartitionedReset
void commDimPartitionedReset()
Reset the comm dim partioned array to zero,.
Definition: comm_common.cpp:819

quda.h
Main header file for the QUDA library.

QUDA_DEGRAND_ROSSI_GAMMA_BASIS
Definition: enum_quda.h:367

dslash_quda.h

printfQuda
#define printfQuda(...)
Definition: util_quda.h:115

QudaGaugeParam_s::t_boundary
QudaTboundary t_boundary
Definition: quda.h:45

DslashTime
Definition: dslash_ctest.cpp:459

quda::blas::flops
unsigned long long flops
Definition: blas_quda.cu:22

DslashTime::cpu_max
double cpu_max
Definition: dslash_ctest.cpp:463

inv_param
QudaInvertParam inv_param
Definition: staggered_dslash_test.cpp:42

quda::ColorSpinorParam::siteOrder
QudaSiteOrder siteOrder
Definition: color_spinor_field.h:91

QUDA_STAGGERED_PHASE_MILC
Definition: enum_quda.h:490

qio_field.h

QUDA_DIRAC_ORDER
Definition: enum_quda.h:243

QUDA_RECONSTRUCT_13
Definition: enum_quda.h:71

QudaDslashType
enum QudaDslashType_s QudaDslashType

QUDA_ANTI_PERIODIC_T
Definition: enum_quda.h:53

QUDA_RANDOM_SOURCE
Definition: enum_quda.h:375

quda::ColorSpinorField::Length
size_t Length() const
Definition: color_spinor_field.h:413

staggeredDslashRef
void staggeredDslashRef()
Definition: staggered_dslash_test.cpp:490

QUDA_EVEN_PARITY
Definition: enum_quda.h:287

QudaVerbosity
enum QudaVerbosity_s QudaVerbosity

qdp_inlink
void * qdp_inlink[4]
Definition: staggered_dslash_test.cpp:39

quda::axpy
__device__ void axpy(real a, const real *x, Link &y)
Definition: clover_deriv.cuh:37

checkCudaError
#define checkCudaError()
Definition: util_quda.h:161

QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:360

quda::Dirac::create
static Dirac * create(const DiracParam &param)
Definition: dirac.cpp:159

quda::ColorSpinorParam::create
QudaFieldCreate create
Definition: color_spinor_field.h:95

initComms
void initComms(int argc, char **argv, int *const commDims)
Definition: test_util.cpp:88

QUDA_GHOST_EXCHANGE_PAD
Definition: enum_quda.h:483

read_gauge_field
void read_gauge_field(const char *filename, void *gauge[], QudaPrecision prec, const int *X, int argc, char *argv[])
Definition: qio_field.h:14

kappa
double kappa
Definition: test_util.cpp:1647

QUDA_MATPC_EVEN_EVEN
Definition: enum_quda.h:210

quda::Dirac::Dslash
virtual void Dslash(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const =0

quda::ColorSpinorField::GhostBytes
size_t GhostBytes() const
Definition: color_spinor_field.h:420

QUDA_SU3_LINKS
Definition: enum_quda.h:23

QudaInvertParam_s
Definition: quda.h:97

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:325

gridsize_from_cmdline
int gridsize_from_cmdline[]
Definition: test_util.cpp:49

QUDA_ASQTAD_FAT_LINKS
Definition: enum_quda.h:30

gauge_field.h

setVerbosity
void setVerbosity(QudaVerbosity verbosity)
Definition: util_quda.cpp:25

cpuFat
cpuGaugeField * cpuFat
Definition: staggered_dslash_test.cpp:44

DslashTime::DslashTime
DslashTime()
Definition: staggered_dslash_test.cpp:433

QudaInvertParam_s::matpc_type
QudaMatPCType matpc_type
Definition: quda.h:206

quda::DiracParam::tmp1
ColorSpinorField * tmp1
Definition: dirac_quda.h:41

QUDA_STAGGERED_PHASE_NO
Definition: enum_quda.h:489

quda::cpuColorSpinorField
Definition: color_spinor_field.h:865

QudaGaugeParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:47

quda::ColorSpinorField::V
void * V()
Definition: color_spinor_field.h:424

quda::Dirac
Definition: dirac_quda.h:106

gaugeSiteSize
#define gaugeSiteSize
Definition: face_gauge.cpp:34

newQudaGaugeParam
QudaGaugeParam newQudaGaugeParam(void)

quda_internal.h

quda::LatticeFieldParam::pad
int pad
Definition: lattice_field.h:69

comm_barrier
void comm_barrier(void)
Definition: comm_mpi.cpp:326

Vh
int Vh
Definition: test_util.cpp:28

cpu_prec
QudaPrecision cpu_prec
Definition: contract_test.cpp:66

mass
double mass
Definition: test_util.cpp:1646