quda-ref/v1.0.0/dslash__test_8cpp_source.html

 #include <iostream>
 #include <stdio.h>
 #include <stdlib.h>
 #include <string.h>

 #include <quda.h>
 #include <quda_internal.h>
 #include <dirac_quda.h>
 #include <dslash_quda.h>
 #include <invert_quda.h>
 #include <util_quda.h>
 #include <blas_quda.h>

 #include <test_util.h>
 #include <dslash_util.h>
 #include <wilson_dslash_reference.h>
 #include <domain_wall_dslash_reference.h>
 #include "misc.h"

 #include <qio_field.h>
 // google test frame work
 #include <gtest/gtest.h>

 #define MAX(a,b) ((a)>(b)?(a):(b))

 using namespace quda;

 const QudaParity parity = QUDA_EVEN_PARITY; // even or odd?
 const int transfer = 0; // include transfer time in the benchmark?

 double kappa5;

 QudaPrecision cpu_prec = QUDA_DOUBLE_PRECISION;
 QudaPrecision cuda_prec;

 QudaGaugeParam gauge_param;
 QudaInvertParam inv_param;

 cpuColorSpinorField *spinor, *spinorOut, *spinorRef, *spinorTmp;
 cudaColorSpinorField *cudaSpinor, *cudaSpinorOut, *tmp1=0, *tmp2=0;

 void *hostGauge[4], *hostClover, *hostCloverInv;

 Dirac *dirac = NULL;

 // What test are we doing (0 = dslash, 1 = MatPC, 2 = Mat, 3 = MatPCDagMatPC, 4 = MatDagMat)
 extern int test_type;

 // Dirac operator type
 extern QudaDslashType dslash_type;

 // Twisted mass flavor type
 extern QudaTwistFlavorType twist_flavor;
 extern QudaMatPCType matpc_type;

 extern int device;
 extern int xdim;
 extern int ydim;
 extern int zdim;
 extern int tdim;
 extern int Lsdim;
 extern int gridsize_from_cmdline[];
 extern QudaReconstructType link_recon;
 extern QudaPrecision prec;
 extern QudaDagType dagger;
 QudaDagType not_dagger;

 extern bool compute_clover;
 extern double clover_coeff;

 extern bool verify_results;
 extern int niter;
 extern char latfile[];
 extern bool unit_gauge;

 extern double mass; // mass of Dirac operator
 extern double mu;
 extern double epsilon;

 extern QudaVerbosity verbosity;

 double getTolerance(QudaPrecision prec)
 {
   switch (prec) {
   case QUDA_QUARTER_PRECISION: return 1e-1;
   case QUDA_HALF_PRECISION: return 1e-3;
   case QUDA_SINGLE_PRECISION: return 1e-4;
   case QUDA_DOUBLE_PRECISION: return 1e-11;
   case QUDA_INVALID_PRECISION: return 1.0;
   }
   return 1.0;
 }

 void init(int argc, char **argv) {

   cuda_prec = prec;

   gauge_param = newQudaGaugeParam();
   inv_param = newQudaInvertParam();

   gauge_param.X[0] = xdim;
   gauge_param.X[1] = ydim;
   gauge_param.X[2] = zdim;
   gauge_param.X[3] = tdim;

   if (dslash_type == QUDA_ASQTAD_DSLASH || dslash_type == QUDA_STAGGERED_DSLASH) {
     errorQuda("Asqtad not supported.  Please try staggered_dslash_test instead");
   } else if (dslash_type == QUDA_DOMAIN_WALL_DSLASH ||
              dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH ||
              dslash_type == QUDA_MOBIUS_DWF_DSLASH ) {
     dw_setDims(gauge_param.X, Lsdim);
   } else {
     setDims(gauge_param.X);
     Ls = 1;
   }

   setSpinorSiteSize(24);

   gauge_param.anisotropy = 1.0;

   gauge_param.type = QUDA_WILSON_LINKS;
   gauge_param.gauge_order = QUDA_QDP_GAUGE_ORDER;
   gauge_param.t_boundary = QUDA_ANTI_PERIODIC_T;

   gauge_param.cpu_prec = cpu_prec;
   gauge_param.cuda_prec = cuda_prec;
   gauge_param.reconstruct = link_recon;
   gauge_param.gauge_fix = QUDA_GAUGE_FIXED_NO;

   inv_param.kappa = 0.1;

   if (dslash_type == QUDA_TWISTED_MASS_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     inv_param.epsilon = epsilon;
     inv_param.twist_flavor = twist_flavor;
   } else if (dslash_type == QUDA_DOMAIN_WALL_DSLASH ||
              dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH ) {
     inv_param.m5 = -1.5;
     kappa5 = 0.5/(5 + inv_param.m5);
   } else if (dslash_type == QUDA_MOBIUS_DWF_DSLASH ) {
     inv_param.m5 = -1.5;
     kappa5 = 0.5/(5 + inv_param.m5);
     for(int k = 0; k < Lsdim; k++)
     {
       // b5[k], c[k] values are chosen for arbitrary values,
       // but the difference of them are same as 1.0
       inv_param.b_5[k] = 1.50; // + 0.5*k;
       inv_param.c_5[k] = 0.50; // - 0.5*k;
     }
   }

   inv_param.mu = mu;
   inv_param.mass = mass;
   inv_param.Ls = (inv_param.twist_flavor != QUDA_TWIST_NONDEG_DOUBLET) ? Ls : 2;

   inv_param.solve_type = (test_type == 2 || test_type == 4) ? QUDA_DIRECT_SOLVE : QUDA_DIRECT_PC_SOLVE;
   inv_param.matpc_type = matpc_type;
   inv_param.dagger = dagger;
   not_dagger = (QudaDagType)((dagger + 1)%2);

   inv_param.cpu_prec = cpu_prec;
   if (inv_param.cpu_prec != gauge_param.cpu_prec) {
     errorQuda("Gauge and spinor CPU precisions must match");
   }
   inv_param.cuda_prec = cuda_prec;

   inv_param.input_location = QUDA_CPU_FIELD_LOCATION;
   inv_param.output_location = QUDA_CPU_FIELD_LOCATION;

 #ifndef MULTI_GPU // free parameter for single GPU
   gauge_param.ga_pad = 0;
 #else // must be this one c/b face for multi gpu
   int x_face_size = gauge_param.X[1]*gauge_param.X[2]*gauge_param.X[3]/2;
   int y_face_size = gauge_param.X[0]*gauge_param.X[2]*gauge_param.X[3]/2;
   int z_face_size = gauge_param.X[0]*gauge_param.X[1]*gauge_param.X[3]/2;
   int t_face_size = gauge_param.X[0]*gauge_param.X[1]*gauge_param.X[2]/2;
   int pad_size =MAX(x_face_size, y_face_size);
   pad_size = MAX(pad_size, z_face_size);
   pad_size = MAX(pad_size, t_face_size);
   gauge_param.ga_pad = pad_size;
 #endif
   inv_param.sp_pad = 0;
   inv_param.cl_pad = 0;

   //inv_param.sp_pad = xdim*ydim*zdim/2;
   //inv_param.cl_pad = 24*24*24;

   inv_param.gamma_basis = QUDA_DEGRAND_ROSSI_GAMMA_BASIS; // test code only supports DeGrand-Rossi Basis
   inv_param.dirac_order = QUDA_DIRAC_ORDER;

   if(dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH){
     switch(test_type) {
       case 0:
       case 1:
       case 2:
       case 3:
         inv_param.solution_type = QUDA_MATPC_SOLUTION;
         break;
       case 4: inv_param.solution_type = QUDA_MAT_SOLUTION; break;
       case 5: inv_param.solution_type = QUDA_MATPCDAG_MATPC_SOLUTION; break;
       case 6: inv_param.solution_type = QUDA_MATDAG_MAT_SOLUTION; break;
       default:
         errorQuda("Test type %d not defined QUDA_DOMAIN_WALL_4D_DSLASH\n", test_type);
     }
   } else if(dslash_type == QUDA_MOBIUS_DWF_DSLASH) {
     switch(test_type) {
       case 0:
       case 1:
       case 2:
       case 3:
       case 4:
         inv_param.solution_type = QUDA_MATPC_SOLUTION;
         break;
       case 5: inv_param.solution_type = QUDA_MAT_SOLUTION; break;
       case 6: inv_param.solution_type = QUDA_MATPCDAG_MATPC_SOLUTION; break;
       case 7: inv_param.solution_type = QUDA_MATDAG_MAT_SOLUTION; break;
       default:
         errorQuda("Test type %d not defined on QUDA_MOBIUS_DWF_DSLASH\n", test_type);
     }
   }
   else
   {
     switch(test_type) {
       case 0:
       case 1:
         inv_param.solution_type = QUDA_MATPC_SOLUTION;
         break;
       case 2:
         inv_param.solution_type = QUDA_MAT_SOLUTION;
         break;
       case 3:
         inv_param.solution_type = QUDA_MATPCDAG_MATPC_SOLUTION;
         break;
       case 4:
         inv_param.solution_type = QUDA_MATDAG_MAT_SOLUTION;
         break;
       default:
         errorQuda("Test type %d not defined\n", test_type);
     }
   }

   inv_param.dslash_type = dslash_type;

   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     inv_param.clover_cpu_prec = cpu_prec;
     inv_param.clover_cuda_prec = cuda_prec;
     inv_param.clover_order = QUDA_PACKED_CLOVER_ORDER;
     inv_param.clover_coeff = clover_coeff;
     hostClover = malloc((size_t)V*cloverSiteSize*inv_param.clover_cpu_prec);
     hostCloverInv = malloc((size_t)V*cloverSiteSize*inv_param.clover_cpu_prec);
   }

   // construct input fields
   for (int dir = 0; dir < 4; dir++) hostGauge[dir] = malloc((size_t)V*gaugeSiteSize*gauge_param.cpu_prec);

   ColorSpinorParam csParam;

   csParam.nColor = 3;
   csParam.nSpin = 4;
   csParam.nDim = 4;
   for (int d=0; d<4; d++) csParam.x[d] = gauge_param.X[d];
   if (dslash_type == QUDA_DOMAIN_WALL_DSLASH ||
       dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH ||
       dslash_type == QUDA_MOBIUS_DWF_DSLASH ) {
     csParam.nDim = 5;
     csParam.x[4] = Ls;
   }
   if (dslash_type == QUDA_DOMAIN_WALL_DSLASH) {
     csParam.pc_type = QUDA_5D_PC;
   } else {
     csParam.pc_type = QUDA_4D_PC;
   }

 //ndeg_tm
   if (dslash_type == QUDA_TWISTED_MASS_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     csParam.twistFlavor = inv_param.twist_flavor;
     csParam.nDim = (inv_param.twist_flavor == QUDA_TWIST_SINGLET) ? 4 : 5;
     csParam.x[4] = inv_param.Ls;
   }

   csParam.setPrecision(inv_param.cpu_prec);
   csParam.pad = 0;

   if (inv_param.solution_type == QUDA_MAT_SOLUTION || inv_param.solution_type == QUDA_MATDAG_MAT_SOLUTION) {
     csParam.siteSubset = QUDA_FULL_SITE_SUBSET;
   } else {
     csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;
     csParam.x[0] /= 2;
   }

   csParam.siteOrder = QUDA_EVEN_ODD_SITE_ORDER;
   csParam.fieldOrder = QUDA_SPACE_SPIN_COLOR_FIELD_ORDER;
   csParam.gammaBasis = inv_param.gamma_basis;
   csParam.create = QUDA_ZERO_FIELD_CREATE;

   spinor = new cpuColorSpinorField(csParam);
   spinorOut = new cpuColorSpinorField(csParam);
   spinorRef = new cpuColorSpinorField(csParam);
   spinorTmp = new cpuColorSpinorField(csParam);

   csParam.x[0] = gauge_param.X[0];

   printfQuda("Randomizing fields... ");

   if (strcmp(latfile,"")) {  // load in the command line supplied gauge field
     read_gauge_field(latfile, hostGauge, gauge_param.cpu_prec, gauge_param.X, argc, argv);
     construct_gauge_field(hostGauge, 2, gauge_param.cpu_prec, &gauge_param);
   } else { // else generate an SU(3) field
     if (unit_gauge) {
       // unit SU(3) field
       construct_gauge_field(hostGauge, 0, gauge_param.cpu_prec, &gauge_param);
     } else {
       // random SU(3) field
       construct_gauge_field(hostGauge, 1, gauge_param.cpu_prec, &gauge_param);
     }
   }

   spinor->Source(QUDA_RANDOM_SOURCE, 0);

   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     double norm = 0.1; // clover components are random numbers in the range (-norm, norm)
     double diag = 1.0; // constant added to the diagonal
     construct_clover_field(hostClover, norm, diag, inv_param.clover_cpu_prec);
     memcpy(hostCloverInv, hostClover, (size_t)V*cloverSiteSize*inv_param.clover_cpu_prec);
   }

   printfQuda("done.\n"); fflush(stdout);

   initQuda(device);

   // set verbosity prior to loadGaugeQuda
   setVerbosity(verbosity);
   inv_param.verbosity = verbosity;

   printfQuda("Sending gauge field to GPU\n");
   loadGaugeQuda(hostGauge, &gauge_param);

   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     if (compute_clover) printfQuda("Computing clover field on GPU\n");
     else printfQuda("Sending clover field to GPU\n");
     inv_param.compute_clover = compute_clover;
     inv_param.return_clover = compute_clover;
     inv_param.compute_clover_inverse = compute_clover;
     inv_param.return_clover_inverse = compute_clover;
     inv_param.return_clover_inverse = true;

     loadCloverQuda(hostClover, hostCloverInv, &inv_param);
   }

   if (!transfer) {
     csParam.gammaBasis = QUDA_UKQCD_GAMMA_BASIS;
     csParam.pad = inv_param.sp_pad;
     csParam.setPrecision(inv_param.cuda_prec);
     if (csParam.Precision() == QUDA_DOUBLE_PRECISION ) {
       csParam.fieldOrder = QUDA_FLOAT2_FIELD_ORDER;
     } else {
       /* Single and half */
       csParam.fieldOrder = QUDA_FLOAT4_FIELD_ORDER;
     }

     if (inv_param.solution_type == QUDA_MAT_SOLUTION || inv_param.solution_type == QUDA_MATDAG_MAT_SOLUTION) {
       csParam.siteSubset = QUDA_FULL_SITE_SUBSET;
     } else {
       csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;
       csParam.x[0] /= 2;
     }

     printfQuda("Creating cudaSpinor with nParity = %d\n", csParam.siteSubset);
     cudaSpinor = new cudaColorSpinorField(csParam);
     printfQuda("Creating cudaSpinorOut with nParity = %d\n", csParam.siteSubset);
     cudaSpinorOut = new cudaColorSpinorField(csParam);

     tmp1 = new cudaColorSpinorField(csParam);

     if (inv_param.solution_type == QUDA_MAT_SOLUTION || inv_param.solution_type == QUDA_MATDAG_MAT_SOLUTION) {
       csParam.x[0] /= 2;
     }

     csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;
     tmp2 = new cudaColorSpinorField(csParam);

     printfQuda("Sending spinor field to GPU\n");
     *cudaSpinor = *spinor;

     double cpu_norm = blas::norm2(*spinor);
     double cuda_norm = blas::norm2(*cudaSpinor);
     printfQuda("Source: CPU = %e, CUDA = %e\n", cpu_norm, cuda_norm);

     bool pc;
     if (dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH)
       pc = (test_type != 4 && test_type != 6);
     else if (dslash_type == QUDA_MOBIUS_DWF_DSLASH)
       pc = (test_type != 5 && test_type != 7);
     else
       pc = (test_type != 2 && test_type != 4);

     DiracParam diracParam;
     setDiracParam(diracParam, &inv_param, pc);
     diracParam.tmp1 = tmp1;
     diracParam.tmp2 = tmp2;
     dirac = Dirac::create(diracParam);

   } else {
     double cpu_norm = blas::norm2(*spinor);
     printfQuda("Source: CPU = %e\n", cpu_norm);
   }

 }

 void end() {
   if (!transfer) {
     if(dirac != NULL)
     {
       delete dirac;
       dirac = NULL;
     }
     delete cudaSpinor;
     delete cudaSpinorOut;
     delete tmp1;
     delete tmp2;
   }

   // release memory
   delete spinor;
   delete spinorOut;
   delete spinorRef;
   delete spinorTmp;

   for (int dir = 0; dir < 4; dir++) free(hostGauge[dir]);
   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     free(hostClover);
     free(hostCloverInv);
   }
   endQuda();

 }

 struct DslashTime {
   double event_time;
   double cpu_time;
   double cpu_min;
   double cpu_max;

   DslashTime() : event_time(0.0), cpu_time(0.0), cpu_min(DBL_MAX), cpu_max(0.0) {}
 };

 // execute kernel
 DslashTime dslashCUDA(int niter) {

   DslashTime dslash_time;
   timeval tstart, tstop;

   cudaEvent_t start, end;
   cudaEventCreate(&start);
   cudaEventCreate(&end);

   comm_barrier();
   cudaEventRecord(start, 0);

   for (int i = 0; i < niter; i++) {

     gettimeofday(&tstart, NULL);

     if (dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH){
       switch (test_type) {
         case 0:
           if (transfer) {
             dslashQuda_4dpc(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);
           } else {
             static_cast<DiracDomainWall4DPC *>(dirac)->Dslash4(*cudaSpinorOut, *cudaSpinor, parity);
           }
           break;
         case 1:
           if (transfer) {
             dslashQuda_4dpc(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);
           } else {
             static_cast<DiracDomainWall4DPC *>(dirac)->Dslash5(*cudaSpinorOut, *cudaSpinor, parity);
           }
           break;
         case 2:
           if (transfer) {
             dslashQuda_4dpc(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);
           } else {
             static_cast<DiracDomainWall4DPC *>(dirac)->Dslash5inv(*cudaSpinorOut, *cudaSpinor, parity, kappa5);
           }
           break;
         case 3:
         case 4:
           if (transfer) {
             MatQuda(spinorOut->V(), spinor->V(), &inv_param);
           } else {
             dirac->M(*cudaSpinorOut, *cudaSpinor);
           }
           break;
         case 5:
         case 6:
           if (transfer) {
             MatDagMatQuda(spinorOut->V(), spinor->V(), &inv_param);
           } else {
             dirac->MdagM(*cudaSpinorOut, *cudaSpinor);
           }
           break;
       }
     } else if (dslash_type == QUDA_MOBIUS_DWF_DSLASH) {
       switch (test_type) {
         case 0:
           if (transfer) {
             dslashQuda_mdwf(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);
           } else {
             static_cast<DiracMobiusPC *>(dirac)->Dslash4(*cudaSpinorOut, *cudaSpinor, parity);
           }
           break;
         case 1:
           if (transfer) {
             dslashQuda_mdwf(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);
           } else {
             static_cast<DiracMobiusPC *>(dirac)->Dslash5(*cudaSpinorOut, *cudaSpinor, parity);
           }
           break;
         case 2:
           if (transfer) {
             dslashQuda_mdwf(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);
           } else {
             static_cast<DiracMobiusPC *>(dirac)->Dslash4pre(*cudaSpinorOut, *cudaSpinor, parity);
           }
           break;
         case 3:
           if (transfer) {
             dslashQuda_mdwf(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);
           } else {
             static_cast<DiracMobiusPC *>(dirac)->Dslash5inv(*cudaSpinorOut, *cudaSpinor, parity);
           }
           break;
         case 4:
         case 5:
           if (transfer) {
             MatQuda(spinorOut->V(), spinor->V(), &inv_param);
           } else {
             dirac->M(*cudaSpinorOut, *cudaSpinor);
           }
           break;
         case 6:
         case 7:
           if (transfer) {
             MatDagMatQuda(spinorOut->V(), spinor->V(), &inv_param);
           } else {
             dirac->MdagM(*cudaSpinorOut, *cudaSpinor);
           }
           break;
       }
     } else {
       switch (test_type) {
         case 0:
           if (dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
             if (transfer) {
               dslashQuda(spinorOut->V(), spinor->V(), &inv_param, parity);
             } else {
               dirac->Dslash(*cudaSpinorOut, *cudaSpinor, parity);
             }
           } else {
             if (transfer) {
               dslashQuda(spinorOut->V(), spinor->V(), &inv_param, parity);
             } else {
               dirac->Dslash(*cudaSpinorOut, *cudaSpinor, parity);
             }
           }
           break;
         case 1:
         case 2:
           if (transfer) {
             MatQuda(spinorOut->V(), spinor->V(), &inv_param);
           } else {
             dirac->M(*cudaSpinorOut, *cudaSpinor);
           }
           break;
         case 3:
         case 4:
           if (transfer) {
             MatDagMatQuda(spinorOut->V(), spinor->V(), &inv_param);
           } else {
             dirac->MdagM(*cudaSpinorOut, *cudaSpinor);
           }
           break;
       }
     }

     gettimeofday(&tstop, NULL);
     long ds = tstop.tv_sec - tstart.tv_sec;
     long dus = tstop.tv_usec - tstart.tv_usec;
     double elapsed = ds + 0.000001*dus;

     dslash_time.cpu_time += elapsed;
     // skip first and last iterations since they may skew these metrics if comms are not synchronous
     if (i>0 && i<niter) {
       if (elapsed < dslash_time.cpu_min) dslash_time.cpu_min = elapsed;
       if (elapsed > dslash_time.cpu_max) dslash_time.cpu_max = elapsed;
     }
   }

   cudaEventRecord(end, 0);
   cudaEventSynchronize(end);
   float runTime;
   cudaEventElapsedTime(&runTime, start, end);
   cudaEventDestroy(start);
   cudaEventDestroy(end);

   dslash_time.event_time = runTime / 1000;

   // check for errors
   cudaError_t stat = cudaGetLastError();
   if (stat != cudaSuccess)
     printfQuda("with ERROR: %s\n", cudaGetErrorString(stat));

   return dslash_time;
 }

 void dslashRef() {

   // compare to dslash reference implementation
   printfQuda("Calculating reference implementation...");
   fflush(stdout);

   if (dslash_type == QUDA_WILSON_DSLASH) {
     switch (test_type) {
     case 0:
       wil_dslash(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, inv_param.cpu_prec, gauge_param);
       break;
     case 1:
       wil_matpc(spinorRef->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.matpc_type, dagger,
     inv_param.cpu_prec, gauge_param);
       break;
     case 2:
       wil_mat(spinorRef->V(), hostGauge, spinor->V(), inv_param.kappa, dagger, inv_param.cpu_prec, gauge_param);
       break;
     case 3:
       wil_matpc(spinorTmp->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.matpc_type, dagger,
     inv_param.cpu_prec, gauge_param);
       wil_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), inv_param.kappa, inv_param.matpc_type, not_dagger,
     inv_param.cpu_prec, gauge_param);
       break;
     case 4:
       wil_mat(spinorTmp->V(), hostGauge, spinor->V(), inv_param.kappa, dagger, inv_param.cpu_prec, gauge_param);
       wil_mat(spinorRef->V(), hostGauge, spinorTmp->V(), inv_param.kappa, not_dagger, inv_param.cpu_prec, gauge_param);
       break;
     default:
       printfQuda("Test type not defined\n");
       exit(-1);
     }
   } else if (dslash_type == QUDA_CLOVER_WILSON_DSLASH) {
     switch (test_type) {
     case 0:
       clover_dslash(spinorRef->V(), hostGauge, hostCloverInv, spinor->V(), parity, dagger, inv_param.cpu_prec, gauge_param);
       break;
     case 1:
       clover_matpc(spinorRef->V(), hostGauge, hostClover, hostCloverInv, spinor->V(), inv_param.kappa, inv_param.matpc_type,
        dagger, inv_param.cpu_prec, gauge_param);
       break;
     case 2:
       clover_mat(spinorRef->V(), hostGauge, hostClover, spinor->V(), inv_param.kappa, dagger, inv_param.cpu_prec, gauge_param);
       break;
     case 3:
       clover_matpc(spinorTmp->V(), hostGauge, hostClover, hostCloverInv, spinor->V(), inv_param.kappa, inv_param.matpc_type,
        dagger, inv_param.cpu_prec, gauge_param);
       clover_matpc(spinorRef->V(), hostGauge, hostClover, hostCloverInv, spinorTmp->V(), inv_param.kappa, inv_param.matpc_type,
        not_dagger, inv_param.cpu_prec, gauge_param);
       break;
     case 4:
       clover_mat(spinorTmp->V(), hostGauge, hostClover, spinor->V(), inv_param.kappa, dagger, inv_param.cpu_prec, gauge_param);
       clover_mat(spinorRef->V(), hostGauge, hostClover, spinorTmp->V(), inv_param.kappa, not_dagger,
      inv_param.cpu_prec, gauge_param);
       break;
     default:
       printfQuda("Test type not defined\n");
       exit(-1);
     }
   } else if (dslash_type == QUDA_TWISTED_MASS_DSLASH) {
     switch (test_type) {
     case 0:
       if(inv_param.twist_flavor == QUDA_TWIST_SINGLET)
         tm_dslash(spinorRef->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor, parity,
             inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
       else
       {
         int tm_offset = 12*spinorRef->Volume();

   void *ref1 = spinorRef->V();
   void *ref2 = (char*)ref1 + tm_offset*cpu_prec;

   void *flv1 = spinor->V();
   void *flv2 = (char*)flv1 + tm_offset*cpu_prec;

   tm_ndeg_dslash(ref1, ref2, hostGauge, flv1, flv2, inv_param.kappa, inv_param.mu, inv_param.epsilon,
                  parity, dagger, inv_param.matpc_type, inv_param.cpu_prec, gauge_param);
       }
       break;
     case 1:
       if(inv_param.twist_flavor == QUDA_TWIST_SINGLET)
   tm_matpc(spinorRef->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor, inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
       else
       {
         int tm_offset = 12*spinorRef->Volume();

   void *ref1 = spinorRef->V();
   void *ref2 = (char*)ref1 + tm_offset*cpu_prec;

   void *flv1 = spinor->V();
   void *flv2 = (char*)flv1 + tm_offset*cpu_prec;

   tm_ndeg_matpc(ref1, ref2, hostGauge, flv1, flv2, inv_param.kappa, inv_param.mu, inv_param.epsilon, inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
       }
       break;
     case 2:
       if(inv_param.twist_flavor == QUDA_TWIST_SINGLET)
   tm_mat(spinorRef->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor, dagger, inv_param.cpu_prec, gauge_param);
       else
       {
         int tm_offset = 12*spinorRef->Volume();

   void *evenOut = spinorRef->V();
   void *oddOut  = (char*)evenOut + tm_offset*cpu_prec;

   void *evenIn = spinor->V();
   void *oddIn  = (char*)evenIn + tm_offset*cpu_prec;

   tm_ndeg_mat(evenOut, oddOut, hostGauge, evenIn, oddIn, inv_param.kappa, inv_param.mu, inv_param.epsilon, dagger, inv_param.cpu_prec, gauge_param);
       }
       break;
     case 3:
       if(inv_param.twist_flavor == QUDA_TWIST_SINGLET) {
   tm_matpc(spinorTmp->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
          inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
   tm_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
          inv_param.matpc_type, not_dagger, inv_param.cpu_prec, gauge_param);
       }
       else
       {
   int tm_offset = 12*spinorRef->Volume();

   void *ref1 = spinorRef->V();
   void *ref2 = (char*)ref1 + tm_offset*cpu_prec;

   void *flv1 = spinor->V();
   void *flv2 = (char*)flv1 + tm_offset*cpu_prec;

   void *tmp1 = spinorTmp->V();
   void *tmp2 = (char*)tmp1 + tm_offset*cpu_prec;

   tm_ndeg_matpc(tmp1, tmp2, hostGauge, flv1, flv2, inv_param.kappa, inv_param.mu, inv_param.epsilon, inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
   tm_ndeg_matpc(ref1, ref2, hostGauge, tmp1, tmp2, inv_param.kappa, inv_param.mu, inv_param.epsilon, inv_param.matpc_type, not_dagger, inv_param.cpu_prec, gauge_param);
       }
       break;
     case 4:
       if(inv_param.twist_flavor == QUDA_TWIST_SINGLET) {
   tm_mat(spinorTmp->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
        dagger, inv_param.cpu_prec, gauge_param);
   tm_mat(spinorRef->V(), hostGauge, spinorTmp->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
        not_dagger, inv_param.cpu_prec, gauge_param);
       }
       else
       {
   int tm_offset = 12*spinorRef->Volume();

   void *evenOut = spinorRef->V();
   void *oddOut  = (char*)evenOut + tm_offset*cpu_prec;

   void *evenIn = spinor->V();
   void *oddIn  = (char*)evenIn + tm_offset*cpu_prec;

   void *evenTmp = spinorTmp->V();
   void *oddTmp = (char*)evenTmp + tm_offset*cpu_prec;

   tm_ndeg_mat(evenTmp, oddTmp, hostGauge, evenIn, oddIn, inv_param.kappa, inv_param.mu, inv_param.epsilon, dagger, inv_param.cpu_prec, gauge_param);
   tm_ndeg_mat(evenOut, oddOut, hostGauge, evenTmp, oddTmp, inv_param.kappa, inv_param.mu, inv_param.epsilon, not_dagger, inv_param.cpu_prec, gauge_param);
       }
       break;
     default:
       printfQuda("Test type not defined\n");
       exit(-1);
     }
   } else if (dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     switch (test_type) {
     case 0:
       if(inv_param.twist_flavor == QUDA_TWIST_SINGLET)
   tmc_dslash(spinorRef->V(), hostGauge, spinor->V(), hostClover, hostCloverInv, inv_param.kappa, inv_param.mu, inv_param.twist_flavor, parity, inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
       else
         errorQuda("Not supported\n");
       break;
     case 1:
       if(inv_param.twist_flavor == QUDA_TWIST_SINGLET)
   tmc_matpc(spinorRef->V(), hostGauge, spinor->V(), hostClover, hostCloverInv, inv_param.kappa, inv_param.mu, inv_param.twist_flavor, inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
       else
         errorQuda("Not supported\n");
       break;
     case 2:
       if(inv_param.twist_flavor == QUDA_TWIST_SINGLET)
   tmc_mat(spinorRef->V(), hostGauge, hostClover, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor, dagger, inv_param.cpu_prec, gauge_param);
       else
         errorQuda("Not supported\n");
       break;
     case 3:
       if(inv_param.twist_flavor == QUDA_TWIST_SINGLET) {
   tmc_matpc(spinorTmp->V(), hostGauge, spinor->V(), hostClover, hostCloverInv, inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
          inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
   tmc_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), hostClover, hostCloverInv, inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
          inv_param.matpc_type, not_dagger, inv_param.cpu_prec, gauge_param);
       } else
         errorQuda("Not supported\n");
       break;
     case 4:
       if(inv_param.twist_flavor == QUDA_TWIST_SINGLET) {
   tmc_mat(spinorTmp->V(), hostGauge, hostClover, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor, dagger, inv_param.cpu_prec, gauge_param);
   tmc_mat(spinorRef->V(), hostGauge, hostClover, spinorTmp->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor, not_dagger, inv_param.cpu_prec, gauge_param);
       } else
         errorQuda("Not supported\n");
       break;
     default:
       printfQuda("Test type not defined\n");
       exit(-1);
     }
   } else if (dslash_type == QUDA_DOMAIN_WALL_DSLASH ){
     switch (test_type) {
     case 0:
       dw_dslash(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
       break;
     case 1:
       dw_matpc(spinorRef->V(), hostGauge, spinor->V(), kappa5, inv_param.matpc_type, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
       break;
     case 2:
       dw_mat(spinorRef->V(), hostGauge, spinor->V(), kappa5, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
       break;
     case 3:
       dw_matpc(spinorTmp->V(), hostGauge, spinor->V(), kappa5, inv_param.matpc_type, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
       dw_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), kappa5, inv_param.matpc_type, not_dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
       break;
     case 4:
       dw_matdagmat(spinorRef->V(), hostGauge, spinor->V(), kappa5, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
     break;
     default:
       printf("Test type not supported for domain wall\n");
       exit(-1);
     }
   } else if (dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH){
     double *kappa_5 = (double*)malloc(Ls*sizeof(double));
     for(int xs = 0; xs < Ls ; xs++)
       kappa_5[xs] = kappa5;
     switch (test_type) {
     case 0:
       dslash_4_4d(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
       break;
     case 1:
       dw_dslash_5_4d(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, true);
       break;
     case 2:
       dslash_5_inv(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, kappa_5);
       break;
     case 3:
       dw_4d_matpc(spinorRef->V(), hostGauge, spinor->V(), kappa5, inv_param.matpc_type, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
       break;
     case 4:
       dw_4d_mat(
           spinorRef->V(), hostGauge, spinor->V(), kappa5, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
       break;
     case 5:
       dw_4d_matpc(spinorTmp->V(), hostGauge, spinor->V(), kappa5, inv_param.matpc_type, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
       dw_4d_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), kappa5, inv_param.matpc_type, not_dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
       break;
     case 6:
       dw_4d_mat(
           spinorTmp->V(), hostGauge, spinor->V(), kappa5, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
       dw_4d_mat(spinorRef->V(), hostGauge, spinorTmp->V(), kappa5, not_dagger, gauge_param.cpu_prec, gauge_param,
           inv_param.mass);
       break;
     default:
       printf("Test type not supported for domain wall\n");
       exit(-1);
     }
     free(kappa_5);
   } else if (dslash_type == QUDA_MOBIUS_DWF_DSLASH){
     double _Complex *kappa_b = (double _Complex *)malloc(Lsdim * sizeof(double _Complex));
     double _Complex *kappa_c = (double _Complex *)malloc(Lsdim * sizeof(double _Complex));
     double _Complex *kappa_5 = (double _Complex *)malloc(Lsdim * sizeof(double _Complex));
     double _Complex *kappa_mdwf = (double _Complex *)malloc(Lsdim * sizeof(double _Complex));
     for(int xs = 0 ; xs < Lsdim ; xs++)
     {
       kappa_b[xs] = 1.0/(2*(inv_param.b_5[xs]*(4.0 + inv_param.m5) + 1.0));
       kappa_c[xs] = 1.0/(2*(inv_param.c_5[xs]*(4.0 + inv_param.m5) - 1.0));
       kappa_5[xs] = 0.5*kappa_b[xs]/kappa_c[xs];
       kappa_mdwf[xs] = -kappa_5[xs];
     }
     switch (test_type) {
     case 0:
       dslash_4_4d(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
       break;
     case 1:
       mdw_dslash_5(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, kappa_5, true);
       break;
     case 2:
       mdw_dslash_4_pre(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, inv_param.b_5, inv_param.c_5, true);
       break;
     case 3:
       mdw_dslash_5_inv(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param,
           inv_param.mass, kappa_mdwf);
       break;
     case 4:
       mdw_matpc(spinorRef->V(), hostGauge, spinor->V(), kappa_b, kappa_c, inv_param.matpc_type, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, inv_param.b_5, inv_param.c_5);
       break;
     case 5:
       mdw_mat(spinorRef->V(), hostGauge, spinor->V(), kappa_b, kappa_c, dagger, gauge_param.cpu_prec, gauge_param,
           inv_param.mass, inv_param.b_5, inv_param.c_5);
       break;
     case 6:
       mdw_matpc(spinorTmp->V(), hostGauge, spinor->V(), kappa_b, kappa_c, inv_param.matpc_type, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, inv_param.b_5, inv_param.c_5);
       mdw_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), kappa_b, kappa_c, inv_param.matpc_type, not_dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, inv_param.b_5, inv_param.c_5);
       break;
     case 7:
       mdw_mat(spinorTmp->V(), hostGauge, spinor->V(), kappa_b, kappa_c, dagger, gauge_param.cpu_prec, gauge_param,
           inv_param.mass, inv_param.b_5, inv_param.c_5);
       mdw_mat(spinorRef->V(), hostGauge, spinorTmp->V(), kappa_b, kappa_c, not_dagger, gauge_param.cpu_prec,
           gauge_param, inv_param.mass, inv_param.b_5, inv_param.c_5);
       break;
     default:
       printf("Test type not supported for domain wall\n");
       exit(-1);
     }
     free(kappa_b);
     free(kappa_c);
     free(kappa_5);
     free(kappa_mdwf);
   } else {
     printfQuda("Unsupported dslash_type\n");
     exit(-1);
   }

   printfQuda("done.\n");
 }


 void display_test_info()
 {
   printfQuda("running the following test:\n");

   printfQuda("prec    recon   test_type     matpc_type   dagger   S_dim         T_dimension   Ls_dimension dslash_type    niter\n");
   printfQuda("%6s   %2s       %d           %12s    %d    %3d/%3d/%3d        %3d             %2d   %14s   %d\n",
        get_prec_str(prec), get_recon_str(link_recon),
        test_type, get_matpc_str(matpc_type), dagger, xdim, ydim, zdim, tdim, Lsdim,
        get_dslash_str(dslash_type), niter);
   printfQuda("Grid partition info:     X  Y  Z  T\n");
   printfQuda("                         %d  %d  %d  %d\n",
        dimPartitioned(0),
        dimPartitioned(1),
        dimPartitioned(2),
        dimPartitioned(3));

   return ;

 }

 extern void usage(char**);

 TEST(dslash, verify) {
   double deviation = pow(10, -(double)(cpuColorSpinorField::Compare(*spinorRef, *spinorOut)));
   double tol = getTolerance(inv_param.cuda_prec);
   if (gauge_param.reconstruct == QUDA_RECONSTRUCT_8) tol *= 10; // if recon 8, we tolerate a greater deviation

   ASSERT_LE(deviation, tol) << "CPU and CUDA implementations do not agree";
 }

 int main(int argc, char **argv)
 {
   // initalize google test, includes command line options
   ::testing::InitGoogleTest(&argc, argv);

   // return code for google test
   int test_rc = 0;
   for (int i =1;i < argc; i++) {
     if(process_command_line_option(argc, argv, &i) == 0){
       continue;
     }

     fprintf(stderr, "ERROR: Invalid option:%s\n", argv[i]);
     usage(argv);
   }

   initComms(argc, argv, gridsize_from_cmdline);

   display_test_info();

   init(argc, argv);

   int attempts = 1;
   dslashRef();
   for (int i=0; i<attempts; i++) {

     {
       printfQuda("Tuning...\n");
       dslashCUDA(1); // warm-up run
     }
     printfQuda("Executing %d kernel loops...\n", niter);
     if (!transfer) dirac->Flops();
     DslashTime dslash_time = dslashCUDA(niter);
     printfQuda("done.\n\n");

     if (!transfer) *spinorOut = *cudaSpinorOut;

     // print timing information
     printfQuda("%fus per kernel call\n", 1e6*dslash_time.event_time / niter);
     //FIXME No flops count for twisted-clover yet
     unsigned long long flops = 0;
     if (!transfer) flops = dirac->Flops();
     printfQuda(
         "%llu flops per kernel call, %llu flops per site\n", flops / niter, (flops / niter) / cudaSpinor->Volume());
     printfQuda("GFLOPS = %f\n", 1.0e-9*flops/dslash_time.event_time);

     printfQuda("Effective halo bi-directional bandwidth (GB/s) GPU = %f ( CPU = %f, min = %f , max = %f ) for aggregate message size %lu bytes\n",
          1.0e-9*2*cudaSpinor->GhostBytes()*niter/dslash_time.event_time, 1.0e-9*2*cudaSpinor->GhostBytes()*niter/dslash_time.cpu_time,
          1.0e-9*2*cudaSpinor->GhostBytes()/dslash_time.cpu_max, 1.0e-9*2*cudaSpinor->GhostBytes()/dslash_time.cpu_min,
          2*cudaSpinor->GhostBytes());

     double norm2_cpu = blas::norm2(*spinorRef);
     double norm2_cpu_cuda = blas::norm2(*spinorOut);
     if (!transfer) {
       double norm2_cuda= blas::norm2(*cudaSpinorOut);
       printfQuda("Results: CPU = %f, CUDA=%f, CPU-CUDA = %f\n", norm2_cpu, norm2_cuda, norm2_cpu_cuda);
     } else {
       printfQuda("Result: CPU = %f, CPU-QUDA = %f\n",  norm2_cpu, norm2_cpu_cuda);
     }

     if (verify_results) {
       ::testing::TestEventListeners &listeners = ::testing::UnitTest::GetInstance()->listeners();
       if (comm_rank() != 0) { delete listeners.Release(listeners.default_result_printer()); }

       test_rc = RUN_ALL_TESTS();
       if (test_rc != 0) warningQuda("Tests failed");
     }
   }
   end();

   finalizeComms();
   return test_rc;
 }
gauge_param
QudaGaugeParam gauge_param
Definition: dslash_test.cpp:36

cudaSpinorOut
cudaColorSpinorField * cudaSpinorOut
Definition: dslash_test.cpp:40

invert_quda.h

dimPartitioned
int dimPartitioned(int dim)
Definition: test_util.cpp:1776

QudaInvertParam_s::dirac_order
QudaDiracFieldOrder dirac_order
Definition: quda.h:219

comm_rank
int comm_rank(void)
Definition: comm_mpi.cpp:82

QudaGaugeParam_s::anisotropy
double anisotropy
Definition: quda.h:38

getTolerance
double getTolerance(QudaPrecision prec)
Definition: dslash_test.cpp:82

tdim
int tdim
Definition: test_util.cpp:1618

mdw_matpc
void mdw_matpc(void *out, void **gauge, void *in, double _Complex *kappa_b, double _Complex *kappa_c, QudaMatPCType matpc_type, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, double _Complex *b5, double _Complex *c5)
Definition: domain_wall_dslash_reference.cpp:906

quda::ColorSpinorParam::setPrecision
void setPrecision(QudaPrecision precision, QudaPrecision ghost_precision=QUDA_INVALID_PRECISION, bool force_native=false)
Definition: color_spinor_field.h:231

QUDA_MAT_SOLUTION
Definition: enum_quda.h:151

dw_4d_matpc
void dw_4d_matpc(void *out, void **gauge, void *in, double kappa, QudaMatPCType matpc_type, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:865

QUDA_PACKED_CLOVER_ORDER
Definition: enum_quda.h:256

dw_dslash_5_4d
void dw_dslash_5_4d(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, bool zero_initialize)
Definition: domain_wall_dslash_reference.cpp:695

endQuda
void endQuda(void)
Definition: interface_quda.cpp:1461

construct_gauge_field
void construct_gauge_field(void **gauge, int type, QudaPrecision precision, QudaGaugeParam *param)
Definition: test_util.cpp:1047

spinorRef
cpuColorSpinorField * spinorRef
Definition: dslash_test.cpp:39

QudaInvertParam_s::solve_type
QudaSolveType solve_type
Definition: quda.h:205

QudaPrecision
enum QudaPrecision_s QudaPrecision

QudaGaugeParam_s::ga_pad
int ga_pad
Definition: quda.h:63

QudaInvertParam_s::c_5
double_complex c_5[QUDA_MAX_DWF_LS]
Definition: quda.h:112

misc.h

mdw_mat
void mdw_mat(void *out, void **gauge, void *in, double _Complex *kappa_b, double _Complex *kappa_c, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, double _Complex *b5, double _Complex *c5)
Definition: domain_wall_dslash_reference.cpp:797

dw_setDims
void dw_setDims(int *X, const int L5)
Definition: test_util.cpp:187

spinorTmp
cpuColorSpinorField * spinorTmp
Definition: dslash_test.cpp:39

QudaInvertParam_s::mu
double mu
Definition: quda.h:114

QudaGaugeParam_s::gauge_fix
QudaGaugeFixed gauge_fix
Definition: quda.h:61

quda::norm
__host__ __device__ ValueType norm(const complex< ValueType > &z)
Returns the magnitude of z squared.
Definition: complex_quda.h:1092

tm_mat
void tm_mat(void *out, void **gauge, void *in, double kappa, double mu, QudaTwistFlavorType flavor, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:309

tm_dslash
void tm_dslash(void *res, void **gaugeFull, void *spinorField, double kappa, double mu, QudaTwistFlavorType flavor, int oddBit, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:277

quda::ColorSpinorParam::nColor
int nColor
Definition: color_spinor_field.h:85

QUDA_INVALID_PRECISION
Definition: enum_quda.h:63

QUDA_ASQTAD_DSLASH
Definition: enum_quda.h:93

QudaGaugeParam_s::type
QudaLinkType type
Definition: quda.h:42

QudaInvertParam_s::kappa
double kappa
Definition: quda.h:106

MatDagMatQuda
void MatDagMatQuda(void *h_out, void *h_in, QudaInvertParam *inv_param)
Definition: interface_quda.cpp:2158

xdim
int xdim
Definition: test_util.cpp:1615

errorQuda
#define errorQuda(...)
Definition: util_quda.h:121

quda::blas::norm2
double norm2(const ColorSpinorField &a)
Definition: reduce_quda.cu:721

QudaInvertParam_s::dslash_type
QudaDslashType dslash_type
Definition: quda.h:102

QUDA_GAUGE_FIXED_NO
Definition: enum_quda.h:77

test_util.h

QudaInvertParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:214

cloverSiteSize
#define cloverSiteSize
Definition: test_util.h:9

QudaInvertParam_s::return_clover_inverse
int return_clover_inverse
Definition: quda.h:242

QUDA_QUARTER_PRECISION
Definition: enum_quda.h:59

QUDA_SPACE_SPIN_COLOR_FIELD_ORDER
Definition: enum_quda.h:350

QUDA_HALF_PRECISION
Definition: enum_quda.h:60

QUDA_QDP_GAUGE_ORDER
Definition: enum_quda.h:41

loadGaugeQuda
void loadGaugeQuda(void *h_gauge, QudaGaugeParam *param)
Definition: interface_quda.cpp:729

DslashTime::cpu_min
double cpu_min
Definition: dslash_ctest.cpp:462

tmc_dslash
void tmc_dslash(void *out, void **gauge, void *in, void *clover, void *cInv, double kappa, double mu, QudaTwistFlavorType flavor, int parity, QudaMatPCType matpc_type, int dagger, QudaPrecision precision, QudaGaugeParam &param)
Definition: clover_reference.cpp:234

QUDA_WILSON_LINKS
Definition: enum_quda.h:29

quda::DiracMobiusPC
Definition: dirac_quda.h:491

QudaInvertParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:213

ydim
int ydim
Definition: test_util.cpp:1616

process_command_line_option
int process_command_line_option(int argc, char **argv, int *idx)
Definition: test_util.cpp:2019

quda::cpuColorSpinorField::Source
void Source(const QudaSourceType sourceType, const int st=0, const int s=0, const int c=0)
Definition: cpu_color_spinor_field.cpp:247

tmp1
cudaColorSpinorField * tmp1
Definition: dslash_test.cpp:40

QUDA_FULL_SITE_SUBSET
Definition: enum_quda.h:333

tm_ndeg_mat
void tm_ndeg_mat(void *evenOut, void *oddOut, void **gauge, void *evenIn, void *oddIn, double kappa, double mu, double epsilon, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:554

QUDA_DIRECT_SOLVE
Definition: enum_quda.h:161

end
void end()
Definition: dslash_test.cpp:409

verbosity
QudaVerbosity verbosity
Definition: test_util.cpp:1614

clover_matpc
void clover_matpc(void *out, void **gauge, void *clover, void *clover_inv, void *in, double kappa, QudaMatPCType matpc_type, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: clover_reference.cpp:92

unit_gauge
bool unit_gauge
Definition: test_util.cpp:1624

QudaInvertParam_s::dagger
QudaDagType dagger
Definition: quda.h:207

get_matpc_str
const char * get_matpc_str(QudaMatPCType type)
Definition: misc.cpp:1121

finalizeComms
void finalizeComms()
Definition: test_util.cpp:128

quda::cudaColorSpinorField
Definition: color_spinor_field.h:575

test_type
int test_type
Definition: test_util.cpp:1636

QUDA_TWIST_SINGLET
Definition: enum_quda.h:399

dw_dslash
void dw_dslash(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:572

QudaGaugeParam_s::gauge_order
QudaGaugeFieldOrder gauge_order
Definition: quda.h:43

dw_mat
void dw_mat(void *out, void **gauge, void *in, double kappa, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:766

tmc_mat
void tmc_mat(void *out, void **gauge, void *clover, void *in, double kappa, double mu, QudaTwistFlavorType flavor, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: clover_reference.cpp:257

util_quda.h

spinor
cpuColorSpinorField * spinor
Definition: dslash_test.cpp:39

tm_matpc
void tm_matpc(void *outEven, void **gauge, void *inEven, double kappa, double mu, QudaTwistFlavorType flavor, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:356

QUDA_TWIST_NONDEG_DOUBLET
Definition: enum_quda.h:400

get_prec_str
const char * get_prec_str(QudaPrecision prec)
Definition: misc.cpp:701

TEST
TEST(dslash, verify)
Definition: dslash_test.cpp:959

quda::Dslash5
Definition: dslash5_domain_wall.cu:20

loadCloverQuda
void loadCloverQuda(void *h_clover, void *h_clovinv, QudaInvertParam *inv_param)
Definition: interface_quda.cpp:985

QudaInvertParam_s::return_clover
int return_clover
Definition: quda.h:241

cpu_prec
QudaPrecision cpu_prec
Definition: dslash_test.cpp:33

quda::ColorSpinorField::Volume
int Volume() const
Definition: color_spinor_field.h:415

quda::Dirac::Flops
unsigned long long Flops() const
Definition: dirac_quda.h:177

QUDA_UKQCD_GAMMA_BASIS
Definition: enum_quda.h:368

quda::Dirac::MdagM
virtual void MdagM(ColorSpinorField &out, const ColorSpinorField &in) const =0

quda
Definition: blas_cublas.h:5

quda::LatticeFieldParam::siteSubset
QudaSiteSubset siteSubset
Definition: lattice_field.h:71

setDims
void setDims(int *)
Definition: test_util.cpp:151

dslashQuda
void dslashQuda(void *h_out, void *h_in, QudaInvertParam *inv_param, QudaParity parity)
Definition: interface_quda.cpp:1853

QudaInvertParam_s::input_location
QudaFieldLocation input_location
Definition: quda.h:99

dagger
QudaDagType dagger
Definition: test_util.cpp:1620

dirac_quda.h

gridsize_from_cmdline
int gridsize_from_cmdline[]
Definition: test_util.cpp:49

Ls
int Ls
Definition: test_util.cpp:38

compute_clover
bool compute_clover
Definition: test_util.cpp:1654

QudaInvertParam_s::b_5
double_complex b_5[QUDA_MAX_DWF_LS]
Definition: quda.h:111

quda::setDiracParam
void setDiracParam(DiracParam &diracParam, QudaInvertParam *inv_param, bool pc)
Definition: interface_quda.cpp:1562

QudaInvertParam_s::solution_type
QudaSolutionType solution_type
Definition: quda.h:204

main
int main(int argc, char **argv)
Definition: dslash_test.cpp:967

QUDA_MATPC_SOLUTION
Definition: enum_quda.h:153

dslashQuda_4dpc
void dslashQuda_4dpc(void *h_out, void *h_in, QudaInvertParam *inv_param, QudaParity parity, int test_type)
Definition: interface_quda.cpp:1945

quda::LatticeFieldParam::x
int x[QUDA_MAX_DIM]
Definition: lattice_field.h:67

QudaInvertParam_s::clover_cuda_prec
QudaPrecision clover_cuda_prec
Definition: quda.h:225

mdw_dslash_4_pre
void mdw_dslash_4_pre(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, double _Complex *b5, double _Complex *c5, bool zero_initialize)
Definition: domain_wall_dslash_reference.cpp:741

quda::DiracParam
Definition: dirac_quda.h:19

dw_matdagmat
void dw_matdagmat(void *out, void **gauge, void *in, double kappa, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:834

dslashCUDA
DslashTime dslashCUDA(int niter)
Definition: dslash_test.cpp:447

initQuda
void initQuda(int device)
Definition: interface_quda.cpp:679

dw_matpc
void dw_matpc(void *out, void **gauge, void *in, double kappa, QudaMatPCType matpc_type, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:845

tmp2
cudaColorSpinorField * tmp2
Definition: dslash_test.cpp:40

quda::ColorSpinorParam::pc_type
QudaPCType pc_type
Definition: color_spinor_field.h:97

QUDA_EVEN_ODD_SITE_ORDER
Definition: enum_quda.h:340

tol
double tol
Definition: test_util.cpp:1656

QudaInvertParam_s::output_location
QudaFieldLocation output_location
Definition: quda.h:100

QudaInvertParam_s::m5
double m5
Definition: quda.h:108

QudaGaugeParam_s
Definition: quda.h:32

quda::ColorSpinorParam::fieldOrder
QudaFieldOrder fieldOrder
Definition: color_spinor_field.h:93

latfile
char latfile[]
Definition: test_util.cpp:1623

mdw_dslash_5_inv
void mdw_dslash_5_inv(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, double _Complex *kappa)
Definition: domain_wall_dslash_reference.cpp:715

QudaInvertParam_s::verbosity
QudaVerbosity verbosity
Definition: quda.h:244

setSpinorSiteSize
void setSpinorSiteSize(int n)
Definition: test_util.cpp:211

transfer
const int transfer
Definition: dslash_test.cpp:29

csParam
ColorSpinorParam csParam
Definition: pack_test.cpp:24

newQudaInvertParam
QudaInvertParam newQudaInvertParam(void)

get_recon_str
const char * get_recon_str(QudaReconstructType recon)
Definition: misc.cpp:768

DslashTime::event_time
double event_time
Definition: dslash_ctest.cpp:460

QudaInvertParam_s::clover_order
QudaCloverFieldOrder clover_order
Definition: quda.h:230

dw_4d_mat
void dw_4d_mat(void *out, void **gauge, void *in, double kappa, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:780

QudaMatPCType
enum QudaMatPCType_s QudaMatPCType

quda::ColorSpinorParam::gammaBasis
QudaGammaBasis gammaBasis
Definition: color_spinor_field.h:94

MAX
#define MAX(a, b)
Definition: dslash_test.cpp:24

QUDA_CLOVER_WILSON_DSLASH
Definition: enum_quda.h:88

hostGauge
void * hostGauge[4]
Definition: dslash_test.cpp:42

DslashTime::cpu_time
double cpu_time
Definition: dslash_ctest.cpp:461

warningQuda
#define warningQuda(...)
Definition: util_quda.h:133

niter
int niter
Definition: test_util.cpp:1629

quda::pow
__host__ __device__ ValueType pow(ValueType x, ExponentType e)
Definition: complex_quda.h:111

QUDA_PARITY_SITE_SUBSET
Definition: enum_quda.h:332

QudaInvertParam_s::gamma_basis
QudaGammaBasis gamma_basis
Definition: quda.h:221

QUDA_FLOAT2_FIELD_ORDER
Definition: enum_quda.h:348

dslash_type
QudaDslashType dslash_type
Definition: test_util.cpp:1621

dirac
Dirac * dirac
Definition: dslash_test.cpp:44

get_dslash_str
const char * get_dslash_str(QudaDslashType type)
Definition: misc.cpp:910

verify_results
bool verify_results
Definition: test_util.cpp:1643

dslash_util.h

clover_mat
void clover_mat(void *out, void **gauge, void *clover, void *in, double kappa, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: clover_reference.cpp:149

hostClover
void * hostClover
Definition: dslash_test.cpp:42

QUDA_5D_PC
Definition: enum_quda.h:396

tm_ndeg_matpc
void tm_ndeg_matpc(void *outEven1, void *outEven2, void **gauge, void *inEven1, void *inEven2, double kappa, double mu, double epsilon, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:484

QudaDagType
enum QudaDagType_s QudaDagType

QudaParity
enum QudaParity_s QudaParity

device
int device
Definition: test_util.cpp:1602

QudaGaugeParam_s::reconstruct
QudaReconstructType reconstruct
Definition: quda.h:50

QudaGaugeParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:49

QudaGaugeParam_s::X
int X[4]
Definition: quda.h:36

quda::DiracDomainWall4DPC
Definition: dirac_quda.h:423

QudaInvertParam_s::mass
double mass
Definition: quda.h:105

twist_flavor
QudaTwistFlavorType twist_flavor
Definition: test_util.cpp:1660

display_test_info
void display_test_info()
Definition: dslash_test.cpp:937

mass
double mass
Definition: test_util.cpp:1646

V
int V
Definition: test_util.cpp:27

QUDA_TWISTED_CLOVER_DSLASH
Definition: enum_quda.h:95

quda::LatticeFieldParam::nDim
int nDim
Definition: lattice_field.h:64

mu
double mu
Definition: test_util.cpp:1648

quda::cpuColorSpinorField::Compare
static int Compare(const cpuColorSpinorField &a, const cpuColorSpinorField &b, const int resolution=1)
Perform a component by component comparison of two color-spinor fields. In doing we normalize with re...
Definition: cpu_color_spinor_field.cpp:251

QudaInvertParam_s::sp_pad
int sp_pad
Definition: quda.h:246

clover_dslash
void clover_dslash(void *out, void **gauge, void *clover, void *in, int parity, int dagger, QudaPrecision precision, QudaGaugeParam &param)
Definition: clover_reference.cpp:81

QudaInvertParam_s::compute_clover_inverse
int compute_clover_inverse
Definition: quda.h:240

QUDA_WILSON_DSLASH
Definition: enum_quda.h:87

tm_ndeg_dslash
void tm_ndeg_dslash(void *res1, void *res2, void **gauge, void *spinorField1, void *spinorField2, double kappa, double mu, double epsilon, int oddBit, int daggerBit, QudaMatPCType matpc_type, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:468

blas_quda.h

QUDA_RECONSTRUCT_8
Definition: enum_quda.h:69

cuda_prec
QudaPrecision cuda_prec
Definition: dslash_test.cpp:34

construct_clover_field
void construct_clover_field(void *clover, double norm, double diag, QudaPrecision precision)
Definition: test_util.cpp:1167

quda::Dirac::M
virtual void M(ColorSpinorField &out, const ColorSpinorField &in) const =0

epsilon
double epsilon
Definition: test_util.cpp:1649

quda::ColorSpinorParam
Definition: color_spinor_field.h:80

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:62

clover_coeff
double clover_coeff
Definition: test_util.cpp:1653

inv_param
QudaInvertParam inv_param
Definition: dslash_test.cpp:37

wil_mat
void wil_mat(void *out, void **gauge, void *in, double kappa, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:294

QUDA_TWISTED_MASS_DSLASH
Definition: enum_quda.h:94

QUDA_STAGGERED_DSLASH
Definition: enum_quda.h:92

mdw_dslash_5
void mdw_dslash_5(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, double _Complex *kappa, bool zero_initialize)
Definition: domain_wall_dslash_reference.cpp:725

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:61

prec
QudaPrecision prec
Definition: test_util.cpp:1608

quda::ColorSpinorParam::nSpin
int nSpin
Definition: color_spinor_field.h:86

QudaReconstructType
enum QudaReconstructType_s QudaReconstructType

quda.h
Main header file for the QUDA library.

spinorOut
cpuColorSpinorField * spinorOut
Definition: dslash_test.cpp:39

quda::LatticeFieldParam::Precision
QudaPrecision Precision() const
Definition: lattice_field.h:58

QUDA_DEGRAND_ROSSI_GAMMA_BASIS
Definition: enum_quda.h:367

tmc_matpc
void tmc_matpc(void *out, void **gauge, void *in, void *clover, void *cInv, double kappa, double mu, QudaTwistFlavorType flavor, QudaMatPCType matpc_type, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: clover_reference.cpp:284

dslash_quda.h

MatQuda
void MatQuda(void *h_out, void *h_in, QudaInvertParam *inv_param)
Definition: interface_quda.cpp:2088

QudaInvertParam_s::Ls
int Ls
Definition: quda.h:109

printfQuda
#define printfQuda(...)
Definition: util_quda.h:115

QudaGaugeParam_s::t_boundary
QudaTboundary t_boundary
Definition: quda.h:45

QudaInvertParam_s::twist_flavor
QudaTwistFlavorType twist_flavor
Definition: quda.h:117

dslash_4_4d
void dslash_4_4d(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:637

DslashTime
Definition: dslash_ctest.cpp:459

quda::ColorSpinorParam::twistFlavor
QudaTwistFlavorType twistFlavor
Definition: color_spinor_field.h:89

quda::blas::flops
unsigned long long flops
Definition: blas_quda.cu:22

DslashTime::cpu_max
double cpu_max
Definition: dslash_ctest.cpp:463

quda::ColorSpinorParam::siteOrder
QudaSiteOrder siteOrder
Definition: color_spinor_field.h:91

qio_field.h

QUDA_DIRAC_ORDER
Definition: enum_quda.h:243

Lsdim
int Lsdim
Definition: test_util.cpp:1619

not_dagger
QudaDagType not_dagger
Definition: dslash_test.cpp:66

matpc_type
QudaMatPCType matpc_type
Definition: test_util.cpp:1662

QudaDslashType
enum QudaDslashType_s QudaDslashType

QUDA_ANTI_PERIODIC_T
Definition: enum_quda.h:53

QUDA_RANDOM_SOURCE
Definition: enum_quda.h:375

domain_wall_dslash_reference.h

usage
void usage(char **)
Definition: test_util.cpp:1783

QudaInvertParam_s::cl_pad
int cl_pad
Definition: quda.h:247

QUDA_DIRECT_PC_SOLVE
Definition: enum_quda.h:163

quda::DiracParam::tmp2
ColorSpinorField * tmp2
Definition: dirac_quda.h:42

link_recon
QudaReconstructType link_recon
Definition: test_util.cpp:1605

wil_matpc
void wil_matpc(void *outEven, void **gauge, void *inEven, double kappa, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:332

QUDA_EVEN_PARITY
Definition: enum_quda.h:287

init
void init(int argc, char **argv)
Definition: dslash_test.cpp:94

QUDA_MATDAG_MAT_SOLUTION
Definition: enum_quda.h:152

QudaVerbosity
enum QudaVerbosity_s QudaVerbosity

dslashRef
void dslashRef()
Definition: dslash_test.cpp:616

QudaInvertParam_s::compute_clover
int compute_clover
Definition: quda.h:239

wilson_dslash_reference.h

QudaInvertParam_s::epsilon
double epsilon
Definition: quda.h:115

wil_dslash
void wil_dslash(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:175

QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:360

quda::Dirac::create
static Dirac * create(const DiracParam &param)
Definition: dirac.cpp:159

QUDA_DOMAIN_WALL_DSLASH
Definition: enum_quda.h:89

QUDA_FLOAT4_FIELD_ORDER
Definition: enum_quda.h:349

quda::ColorSpinorParam::create
QudaFieldCreate create
Definition: color_spinor_field.h:95

initComms
void initComms(int argc, char **argv, int *const commDims)
Definition: test_util.cpp:88

zdim
int zdim
Definition: test_util.cpp:1617

read_gauge_field
void read_gauge_field(const char *filename, void *gauge[], QudaPrecision prec, const int *X, int argc, char *argv[])
Definition: qio_field.h:14

QUDA_MATPCDAG_MATPC_SOLUTION
Definition: enum_quda.h:155

quda::Dirac::Dslash
virtual void Dslash(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const =0

quda::ColorSpinorField::GhostBytes
size_t GhostBytes() const
Definition: color_spinor_field.h:420

QudaInvertParam_s::clover_cpu_prec
QudaPrecision clover_cpu_prec
Definition: quda.h:224

cudaSpinor
cudaColorSpinorField * cudaSpinor
Definition: dslash_test.cpp:40

QudaInvertParam_s
Definition: quda.h:97

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:325

hostCloverInv
void * hostCloverInv
Definition: dslash_test.cpp:42

parity
const QudaParity parity
Definition: dslash_test.cpp:28

setVerbosity
void setVerbosity(QudaVerbosity verbosity)
Definition: util_quda.cpp:25

DslashTime::DslashTime
DslashTime()
Definition: dslash_test.cpp:443

QudaInvertParam_s::matpc_type
QudaMatPCType matpc_type
Definition: quda.h:206

dslashQuda_mdwf
void dslashQuda_mdwf(void *h_out, void *h_in, QudaInvertParam *inv_param, QudaParity parity, int test_type)
Definition: interface_quda.cpp:2015

QUDA_DOMAIN_WALL_4D_DSLASH
Definition: enum_quda.h:90

dslash_5_inv
void dslash_5_inv(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, double *kappa)
Definition: domain_wall_dslash_reference.cpp:706

quda::DiracParam::tmp1
ColorSpinorField * tmp1
Definition: dirac_quda.h:41

kappa5
double kappa5
Definition: dslash_test.cpp:31

quda::cpuColorSpinorField
Definition: color_spinor_field.h:865

QudaGaugeParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:47

quda::ColorSpinorField::V
void * V()
Definition: color_spinor_field.h:424

quda::Dirac
Definition: dirac_quda.h:106

QUDA_4D_PC
Definition: enum_quda.h:396

gaugeSiteSize
#define gaugeSiteSize
Definition: face_gauge.cpp:34

newQudaGaugeParam
QudaGaugeParam newQudaGaugeParam(void)

quda_internal.h

quda::LatticeFieldParam::pad
int pad
Definition: lattice_field.h:69

QudaInvertParam_s::clover_coeff
double clover_coeff
Definition: quda.h:233

comm_barrier
void comm_barrier(void)
Definition: comm_mpi.cpp:326

QUDA_MOBIUS_DWF_DSLASH
Definition: enum_quda.h:91

QudaTwistFlavorType
enum QudaTwistFlavorType_s QudaTwistFlavorType