quda-ref/v1.0.0/dslash__ctest_8cpp_source.html

 #include <iostream>
 #include <stdio.h>
 #include <stdlib.h>
 #include <string.h>

 #include <quda.h>
 #include <quda_internal.h>
 #include <dirac_quda.h>
 #include <dslash_quda.h>
 #include <invert_quda.h>
 #include <util_quda.h>
 #include <blas_quda.h>

 #include <test_util.h>
 #include <dslash_util.h>
 #include <wilson_dslash_reference.h>
 #include <domain_wall_dslash_reference.h>
 #include "misc.h"

 #include <qio_field.h>
 // google test frame work
 #include <gtest/gtest.h>

 #define MAX(a,b) ((a)>(b)?(a):(b))

 using namespace quda;

 const QudaParity parity = QUDA_EVEN_PARITY; // even or odd?
 const int transfer = 0; // include transfer time in the benchmark?

 double kappa5;

 QudaPrecision cpu_prec = QUDA_DOUBLE_PRECISION;
 QudaPrecision cuda_prec;

 QudaGaugeParam gauge_param;
 QudaInvertParam inv_param;

 cpuColorSpinorField *spinor, *spinorOut, *spinorRef, *spinorTmp;
 cudaColorSpinorField *cudaSpinor, *cudaSpinorOut, *tmp1=0, *tmp2=0;

 void *hostGauge[4], *hostClover, *hostCloverInv;

 Dirac *dirac = NULL;
 DiracMobiusPC *dirac_mdwf = NULL; // create the MDWF Dirac operator
 DiracDomainWall4DPC *dirac_4dpc = NULL; // create the 4d preconditioned DWF Dirac operator

 // What test are we doing (0 = dslash, 1 = MatPC, 2 = Mat, 3 = MatPCDagMatPC, 4 = MatDagMat)
 extern int test_type;

 // Dirac operator type
 extern QudaDslashType dslash_type;

 // Twisted mass flavor type
 extern QudaTwistFlavorType twist_flavor;
 extern QudaMatPCType matpc_type;

 extern int device;
 extern int xdim;
 extern int ydim;
 extern int zdim;
 extern int tdim;
 extern int Lsdim;
 extern int gridsize_from_cmdline[];
 extern QudaDagType dagger;
 QudaDagType not_dagger;

 extern bool compute_clover;
 extern double clover_coeff;

 extern bool verify_results;
 extern int niter;
 extern char latfile[];

 extern double mass; // mass of Dirac operator
 extern double mu;
 extern double epsilon;
 extern void usage(char**);

 extern QudaVerbosity verbosity;

 const char *prec_str[] = {"quarter", "half", "single", "double"};
 const char *recon_str[] = {"r18", "r12", "r8"};

 // For googletest names must be non-empty, unique, and may only contain ASCII
 // alphanumeric characters or underscore

 double getTolerance(QudaPrecision prec)
 {
   switch (prec) {
   case QUDA_QUARTER_PRECISION: return 1e-1;
   case QUDA_HALF_PRECISION: return 1e-3;
   case QUDA_SINGLE_PRECISION: return 1e-4;
   case QUDA_DOUBLE_PRECISION: return 1e-11;
   case QUDA_INVALID_PRECISION: return 1.0;
   }
   return 1.0;
 }

 void init(int precision, QudaReconstructType link_recon) {

   printfQuda("%s\n", __func__);
   cuda_prec = getPrecision(precision);

   gauge_param = newQudaGaugeParam();
   inv_param = newQudaInvertParam();

   gauge_param.X[0] = xdim;
   gauge_param.X[1] = ydim;
   gauge_param.X[2] = zdim;
   gauge_param.X[3] = tdim;

   if (dslash_type == QUDA_ASQTAD_DSLASH || dslash_type == QUDA_STAGGERED_DSLASH) {
     errorQuda("Asqtad not supported.  Please try staggered_dslash_test instead");
   } else if (dslash_type == QUDA_DOMAIN_WALL_DSLASH || dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH
       || dslash_type == QUDA_MOBIUS_DWF_DSLASH) {
     dw_setDims(gauge_param.X, Lsdim);
   } else {
     setDims(gauge_param.X);
     Ls = 1;
   }

   setSpinorSiteSize(24);

   gauge_param.anisotropy = 1.0;

   gauge_param.type = QUDA_WILSON_LINKS;
   gauge_param.gauge_order = QUDA_QDP_GAUGE_ORDER;
   gauge_param.t_boundary = QUDA_ANTI_PERIODIC_T;

   gauge_param.cpu_prec = cpu_prec;
   gauge_param.cuda_prec = cuda_prec;
   gauge_param.reconstruct = link_recon;
   gauge_param.reconstruct_sloppy = link_recon;
   gauge_param.cuda_prec_sloppy = cuda_prec;
   gauge_param.gauge_fix = QUDA_GAUGE_FIXED_NO;

   inv_param.kappa = 0.1;

   if (dslash_type == QUDA_TWISTED_MASS_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     inv_param.epsilon = epsilon;
     inv_param.twist_flavor = twist_flavor;
   } else if (dslash_type == QUDA_DOMAIN_WALL_DSLASH || dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH) {
     inv_param.m5 = -1.5;
     kappa5 = 0.5/(5 + inv_param.m5);
   } else if (dslash_type == QUDA_MOBIUS_DWF_DSLASH) {
     inv_param.m5 = -1.5;
     kappa5 = 0.5/(5 + inv_param.m5);
     for(int k = 0; k < Lsdim; k++)
     {
       // b5[k], c[k] values are chosen for arbitrary values,
       // but the difference of them are same as 1.0
       inv_param.b_5[k] = 1.50;
       inv_param.c_5[k] = 0.50;
     }
   }

   inv_param.mu = mu;
   inv_param.mass = mass;
   inv_param.Ls = (inv_param.twist_flavor != QUDA_TWIST_NONDEG_DOUBLET) ? Ls : 2;

   inv_param.solve_type = (test_type == 2 || test_type == 4) ? QUDA_DIRECT_SOLVE : QUDA_DIRECT_PC_SOLVE;
   inv_param.matpc_type = matpc_type;
   inv_param.dagger = dagger;
   not_dagger = (QudaDagType)((dagger + 1)%2);

   inv_param.cpu_prec = cpu_prec;
   if (inv_param.cpu_prec != gauge_param.cpu_prec) {
     errorQuda("Gauge and spinor CPU precisions must match");
   }
   inv_param.cuda_prec = cuda_prec;

   inv_param.input_location = QUDA_CPU_FIELD_LOCATION;
   inv_param.output_location = QUDA_CPU_FIELD_LOCATION;

 #ifndef MULTI_GPU // free parameter for single GPU
   gauge_param.ga_pad = 0;
 #else // must be this one c/b face for multi gpu
   int x_face_size = gauge_param.X[1]*gauge_param.X[2]*gauge_param.X[3]/2;
   int y_face_size = gauge_param.X[0]*gauge_param.X[2]*gauge_param.X[3]/2;
   int z_face_size = gauge_param.X[0]*gauge_param.X[1]*gauge_param.X[3]/2;
   int t_face_size = gauge_param.X[0]*gauge_param.X[1]*gauge_param.X[2]/2;
   int pad_size =MAX(x_face_size, y_face_size);
   pad_size = MAX(pad_size, z_face_size);
   pad_size = MAX(pad_size, t_face_size);
   gauge_param.ga_pad = pad_size;
 #endif
   inv_param.sp_pad = 0;
   inv_param.cl_pad = 0;

   //inv_param.sp_pad = xdim*ydim*zdim/2;
   //inv_param.cl_pad = 24*24*24;

   inv_param.gamma_basis = QUDA_DEGRAND_ROSSI_GAMMA_BASIS; // test code only supports DeGrand-Rossi Basis
   inv_param.dirac_order = QUDA_DIRAC_ORDER;

   if(dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH){
     switch(test_type) {
       case 0:
       case 1:
       case 2:
       case 3:
       inv_param.solution_type = QUDA_MATPC_SOLUTION;
       break;
       case 4:
       inv_param.solution_type = QUDA_MATPCDAG_MATPC_SOLUTION;
       break;
       default:
       errorQuda("Test type %d not defined QUDA_DOMAIN_WALL_4D_DSLASH\n", test_type);
     }
   } else if(dslash_type == QUDA_MOBIUS_DWF_DSLASH) {
     switch(test_type) {
       case 0:
       case 1:
       case 2:
       case 3:
       case 4:
       inv_param.solution_type = QUDA_MATPC_SOLUTION;
       break;
       case 5:
       inv_param.solution_type = QUDA_MATPCDAG_MATPC_SOLUTION;
       break;
       default:
       errorQuda("Test type %d not defined on QUDA_MOBIUS_DWF_DSLASH\n", test_type);
     }
   }
   else
   {
     switch(test_type) {
       case 0:
       case 1:
       inv_param.solution_type = QUDA_MATPC_SOLUTION;
       break;
       case 2:
       inv_param.solution_type = QUDA_MAT_SOLUTION;
       break;
       case 3:
       inv_param.solution_type = QUDA_MATPCDAG_MATPC_SOLUTION;
       break;
       case 4:
       inv_param.solution_type = QUDA_MATDAG_MAT_SOLUTION;
       break;
       default:
       errorQuda("Test type %d not defined\n", test_type);
     }
   }

   inv_param.dslash_type = dslash_type;

   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     inv_param.clover_cpu_prec = cpu_prec;
     inv_param.clover_cuda_prec = cuda_prec;
     inv_param.clover_cuda_prec_sloppy = inv_param.clover_cuda_prec;
     inv_param.clover_cuda_prec_precondition = inv_param.clover_cuda_prec_sloppy;
     inv_param.clover_cuda_prec_refinement_sloppy = inv_param.clover_cuda_prec_precondition;
     inv_param.clover_order = QUDA_PACKED_CLOVER_ORDER;
     inv_param.clover_coeff = clover_coeff;
     hostClover = malloc((size_t)V*cloverSiteSize*inv_param.clover_cpu_prec);
     hostCloverInv = malloc((size_t)V*cloverSiteSize*inv_param.clover_cpu_prec);
   }

   // construct input fields
   for (int dir = 0; dir < 4; dir++) hostGauge[dir] = malloc((size_t)V*gaugeSiteSize*gauge_param.cpu_prec);

     ColorSpinorParam csParam;

   csParam.nColor = 3;
   csParam.nSpin = 4;
   csParam.nDim = 4;
   for (int d=0; d<4; d++) csParam.x[d] = gauge_param.X[d];
     if (dslash_type == QUDA_DOMAIN_WALL_DSLASH ||
       dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH ||
       dslash_type == QUDA_MOBIUS_DWF_DSLASH ) {
       csParam.nDim = 5;
     csParam.x[4] = Ls;
   }
   if (dslash_type == QUDA_DOMAIN_WALL_DSLASH) {
     csParam.pc_type = QUDA_5D_PC;
   } else {
     csParam.pc_type = QUDA_4D_PC;
   }

   //ndeg_tm
   if (dslash_type == QUDA_TWISTED_MASS_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     csParam.twistFlavor = inv_param.twist_flavor;
     csParam.nDim = (inv_param.twist_flavor == QUDA_TWIST_SINGLET) ? 4 : 5;
     csParam.x[4] = inv_param.Ls;
   }


  csParam.setPrecision(inv_param.cpu_prec);
  csParam.pad = 0;

  if(dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH || dslash_type == QUDA_MOBIUS_DWF_DSLASH) {
    csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;
    csParam.x[0] /= 2;
  } else {
    if (test_type < 2 || test_type == 3) {
      csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;
      csParam.x[0] /= 2;
    } else {
      csParam.siteSubset = QUDA_FULL_SITE_SUBSET;
    }
  }

  csParam.siteOrder = QUDA_EVEN_ODD_SITE_ORDER;
  csParam.fieldOrder = QUDA_SPACE_SPIN_COLOR_FIELD_ORDER;
  csParam.gammaBasis = inv_param.gamma_basis;
  csParam.create = QUDA_ZERO_FIELD_CREATE;

  spinor = new cpuColorSpinorField(csParam);
  spinorOut = new cpuColorSpinorField(csParam);
  spinorRef = new cpuColorSpinorField(csParam);
  spinorTmp = new cpuColorSpinorField(csParam);

  csParam.x[0] = gauge_param.X[0];

  // printfQuda("Randomizing fields... ");


  //FIXME
  // if (strcmp(latfile,"")) {  // load in the command line supplied gauge field
  //   read_gauge_field(latfile, hostGauge, gauge_param.cpu_prec, gauge_param.X, argc, argv);
  //   construct_gauge_field(hostGauge, 2, gauge_param.cpu_prec, &gauge_param);
  // } else { // else generate a random SU(3) field
  construct_gauge_field(hostGauge, 1, gauge_param.cpu_prec, &gauge_param);
  // }

  spinor->Source(QUDA_RANDOM_SOURCE, 0);

  if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     double norm = 0.1; // clover components are random numbers in the range (-norm, norm)
     double diag = 1.0; // constant added to the diagonal
     construct_clover_field(hostClover, norm, diag, inv_param.clover_cpu_prec);
     memcpy(hostCloverInv, hostClover, (size_t)V*cloverSiteSize*inv_param.clover_cpu_prec);
   }

   // printfQuda("done.\n"); fflush(stdout);

   // set verbosity prior to loadGaugeQuda
   setVerbosity(verbosity);
   inv_param.verbosity = verbosity;

   // printfQuda("Sending gauge field to GPU\n");
   loadGaugeQuda(hostGauge, &gauge_param);

   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     if (compute_clover) printfQuda("Computing clover field on GPU\n");
     else printfQuda("Sending clover field to GPU\n");
     inv_param.compute_clover = compute_clover;
     inv_param.return_clover = compute_clover;
     inv_param.compute_clover_inverse = compute_clover;
     inv_param.return_clover_inverse = compute_clover;
     inv_param.return_clover_inverse = true;

     loadCloverQuda(hostClover, hostCloverInv, &inv_param);
   }

   if (!transfer) {
     csParam.gammaBasis = QUDA_UKQCD_GAMMA_BASIS;
     csParam.pad = inv_param.sp_pad;
     csParam.setPrecision(inv_param.cuda_prec);
     if (csParam.Precision() == QUDA_DOUBLE_PRECISION ) {
       csParam.fieldOrder = QUDA_FLOAT2_FIELD_ORDER;
     } else {
       /* Single and half */
       csParam.fieldOrder = QUDA_FLOAT4_FIELD_ORDER;
     }

     if (dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH || dslash_type == QUDA_MOBIUS_DWF_DSLASH) {
       csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;
       csParam.x[0] /= 2;
     } else {
       if (test_type < 2 || test_type == 3) {
         csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;
         csParam.x[0] /= 2;
       }
     }

     // printfQuda("Creating cudaSpinor\n");
     cudaSpinor = new cudaColorSpinorField(csParam);
     // printfQuda("Creating cudaSpinorOut\n");
     cudaSpinorOut = new cudaColorSpinorField(csParam);

     tmp1 = new cudaColorSpinorField(csParam);

     if (dslash_type != QUDA_DOMAIN_WALL_4D_DSLASH && dslash_type != QUDA_MOBIUS_DWF_DSLASH)
       if (test_type == 2 || test_type == 4) csParam.x[0] /= 2;

     csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;
     tmp2 = new cudaColorSpinorField(csParam);

     // printfQuda("Sending spinor field to GPU\n");
     *cudaSpinor = *spinor;

     // double cpu_norm = blas::norm2(*spinor);
     // double cuda_norm = blas::norm2(*cudaSpinor);
     // printfQuda("Source: CPU = %e, CUDA = %e\n", cpu_norm, cuda_norm);

     bool pc;
     if (dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH || dslash_type == QUDA_MOBIUS_DWF_DSLASH)
       pc = true;
     else
       pc = (test_type != 2 && test_type != 4);
     DiracParam diracParam;
     setDiracParam(diracParam, &inv_param, pc);
     diracParam.tmp1 = tmp1;
     diracParam.tmp2 = tmp2;

     if (dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH){
       dirac_4dpc = new DiracDomainWall4DPC(diracParam);
       dirac = (Dirac*)dirac_4dpc;
     }
     else if (dslash_type == QUDA_MOBIUS_DWF_DSLASH){
       dirac_mdwf = new DiracMobiusPC(diracParam);
       dirac = (Dirac*)dirac_mdwf;
     }
     else {
       dirac = Dirac::create(diracParam);
     }
   } else {
     // double cpu_norm = blas::norm2(*spinor);
     // printfQuda("Source: CPU = %e\n", cpu_norm);
   }

 }

 void end() {
   printfQuda("%s\n", __func__);
   if (!transfer) {
     if(dirac != NULL)
     {
       delete dirac;
       dirac = NULL;
     }
     delete cudaSpinor;
     delete cudaSpinorOut;
     delete tmp1;
     delete tmp2;
   }

   // release memory
   delete spinor;
   delete spinorOut;
   delete spinorRef;
   delete spinorTmp;

   freeGaugeQuda();

   for (int dir = 0; dir < 4; dir++) free(hostGauge[dir]);
     if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
       free(hostClover);
       free(hostCloverInv);
     }
     commDimPartitionedReset();

   }

   struct DslashTime {
     double event_time;
     double cpu_time;
     double cpu_min;
     double cpu_max;

     DslashTime() : event_time(0.0), cpu_time(0.0), cpu_min(DBL_MAX), cpu_max(0.0) {}
   };

 // execute kernel
   DslashTime dslashCUDA(int niter) {

     DslashTime dslash_time;
     timeval tstart, tstop;

     cudaEvent_t start, end;
     cudaEventCreate(&start);
     cudaEventCreate(&end);

     comm_barrier();
     cudaEventRecord(start, 0);

     for (int i = 0; i < niter; i++) {

       gettimeofday(&tstart, NULL);

       if (dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH){
         switch (test_type) {
           case 0:
           if (transfer) {
             dslashQuda_4dpc(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);
           } else {
             dirac_4dpc->Dslash4(*cudaSpinorOut, *cudaSpinor, parity);
           }
           break;
           case 1:
           if (transfer) {
             dslashQuda_4dpc(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);
           } else {
             dirac_4dpc->Dslash5(*cudaSpinorOut, *cudaSpinor, parity);
           }
           break;
           case 2:
           if (transfer) {
             dslashQuda_4dpc(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);
           } else {
             dirac_4dpc->Dslash5inv(*cudaSpinorOut, *cudaSpinor, parity, kappa5);
           }
           break;
           case 3:
           if (transfer) {
             MatQuda(spinorOut->V(), spinor->V(), &inv_param);
           } else {
             dirac_4dpc->M(*cudaSpinorOut, *cudaSpinor);
           }
           break;
           case 4:
           if (transfer) {
             MatDagMatQuda(spinorOut->V(), spinor->V(), &inv_param);
           } else {
             dirac_4dpc->MdagM(*cudaSpinorOut, *cudaSpinor);
           }
           break;
         }
       }
       else if (dslash_type == QUDA_MOBIUS_DWF_DSLASH){
         switch (test_type) {
           case 0:
           if (transfer) {
             dslashQuda_mdwf(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);
           } else {
             dirac_mdwf->Dslash4(*cudaSpinorOut, *cudaSpinor, parity);
           }
           break;
           case 1:
           if (transfer) {
             dslashQuda_mdwf(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);
           } else {
             dirac_mdwf->Dslash5(*cudaSpinorOut, *cudaSpinor, parity);
           }
           break;
           case 2:
           if (transfer) {
             dslashQuda_mdwf(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);
           } else {
             dirac_mdwf->Dslash4pre(*cudaSpinorOut, *cudaSpinor, parity);
           }
           break;
           case 3:
           if (transfer) {
             dslashQuda_mdwf(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);
           } else {
             dirac_mdwf->Dslash5inv(*cudaSpinorOut, *cudaSpinor, parity);
           }
           break;
           case 4:
           if (transfer) {
             MatQuda(spinorOut->V(), spinor->V(), &inv_param);
           } else {
             dirac_mdwf->M(*cudaSpinorOut, *cudaSpinor);
           }
           break;
           case 5:
           if (transfer) {
             MatDagMatQuda(spinorOut->V(), spinor->V(), &inv_param);
           } else {
             dirac_mdwf->MdagM(*cudaSpinorOut, *cudaSpinor);
           }
           break;
         }
       } else {
         switch (test_type) {
           case 0:
           if (dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
             if (transfer) {
               dslashQuda(spinorOut->V(), spinor->V(), &inv_param, parity);
             } else {
               dirac->Dslash(*cudaSpinorOut, *cudaSpinor, parity);
             }
         } else {
           if (transfer) {
             dslashQuda(spinorOut->V(), spinor->V(), &inv_param, parity);
           } else {
             dirac->Dslash(*cudaSpinorOut, *cudaSpinor, parity);
           }
         }
         break;
         case 1:
         if (transfer) {
           MatQuda(spinorOut->V(), spinor->V(), &inv_param);
         } else {
           dirac->M(*cudaSpinorOut, *cudaSpinor);
         }
         break;
         case 2:
         if (transfer) {
           MatQuda(spinorOut->V(), spinor->V(), &inv_param);
         } else {
           dirac->M(*cudaSpinorOut, *cudaSpinor);
         }
         break;
         case 3:
         if (transfer) {
           MatDagMatQuda(spinorOut->V(), spinor->V(), &inv_param);
         } else {
           dirac->MdagM(*cudaSpinorOut, *cudaSpinor);
         }
         break;
         case 4:
         if (transfer) {
           MatDagMatQuda(spinorOut->V(), spinor->V(), &inv_param);
         } else {
           dirac->MdagM(*cudaSpinorOut, *cudaSpinor);
         }
         break;
       }
     }

     gettimeofday(&tstop, NULL);
     long ds = tstop.tv_sec - tstart.tv_sec;
     long dus = tstop.tv_usec - tstart.tv_usec;
     double elapsed = ds + 0.000001*dus;

     dslash_time.cpu_time += elapsed;
     // skip first and last iterations since they may skew these metrics if comms are not synchronous
     if (i>0 && i<niter) {
       if (elapsed < dslash_time.cpu_min) dslash_time.cpu_min = elapsed;
       if (elapsed > dslash_time.cpu_max) dslash_time.cpu_max = elapsed;
     }
   }

   cudaEventRecord(end, 0);
   cudaEventSynchronize(end);
   float runTime;
   cudaEventElapsedTime(&runTime, start, end);
   cudaEventDestroy(start);
   cudaEventDestroy(end);

   dslash_time.event_time = runTime / 1000;

   // check for errors
   cudaError_t stat = cudaGetLastError();
   if (stat != cudaSuccess)
     printfQuda("with ERROR: %s\n", cudaGetErrorString(stat));

   return dslash_time;
 }

 void dslashRef() {

   // compare to dslash reference implementation
   // printfQuda("Calculating reference implementation...");
   fflush(stdout);

   if (dslash_type == QUDA_WILSON_DSLASH) {
     switch (test_type) {
       case 0:
       wil_dslash(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, inv_param.cpu_prec, gauge_param);
       break;
       case 1:
         wil_matpc(spinorRef->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.matpc_type, dagger,
             inv_param.cpu_prec, gauge_param);
         break;
       case 2:
       wil_mat(spinorRef->V(), hostGauge, spinor->V(), inv_param.kappa, dagger, inv_param.cpu_prec, gauge_param);
       break;
       case 3:
         wil_matpc(spinorTmp->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.matpc_type, dagger,
             inv_param.cpu_prec, gauge_param);
         wil_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), inv_param.kappa, inv_param.matpc_type, not_dagger,
             inv_param.cpu_prec, gauge_param);
         break;
       case 4:
       wil_mat(spinorTmp->V(), hostGauge, spinor->V(), inv_param.kappa, dagger, inv_param.cpu_prec, gauge_param);
       wil_mat(spinorRef->V(), hostGauge, spinorTmp->V(), inv_param.kappa, not_dagger, inv_param.cpu_prec, gauge_param);
       break;
       default:
       printfQuda("Test type not defined\n");
       exit(-1);
     }
   } else if (dslash_type == QUDA_CLOVER_WILSON_DSLASH) {
     switch (test_type) {
       case 0:
       clover_dslash(spinorRef->V(), hostGauge, hostCloverInv, spinor->V(), parity, dagger, inv_param.cpu_prec, gauge_param);
       break;
       case 1:
       clover_matpc(spinorRef->V(), hostGauge, hostClover, hostCloverInv, spinor->V(), inv_param.kappa, inv_param.matpc_type,
        dagger, inv_param.cpu_prec, gauge_param);
       break;
       case 2:
       clover_mat(spinorRef->V(), hostGauge, hostClover, spinor->V(), inv_param.kappa, dagger, inv_param.cpu_prec, gauge_param);
       break;
       case 3:
       clover_matpc(spinorTmp->V(), hostGauge, hostClover, hostCloverInv, spinor->V(), inv_param.kappa, inv_param.matpc_type,
        dagger, inv_param.cpu_prec, gauge_param);
       clover_matpc(spinorRef->V(), hostGauge, hostClover, hostCloverInv, spinorTmp->V(), inv_param.kappa, inv_param.matpc_type,
        not_dagger, inv_param.cpu_prec, gauge_param);
       break;
       case 4:
       clover_mat(spinorTmp->V(), hostGauge, hostClover, spinor->V(), inv_param.kappa, dagger, inv_param.cpu_prec, gauge_param);
       clover_mat(spinorRef->V(), hostGauge, hostClover, spinorTmp->V(), inv_param.kappa, not_dagger,
        inv_param.cpu_prec, gauge_param);
       break;
       default:
       printfQuda("Test type not defined\n");
       exit(-1);
     }
   } else if (dslash_type == QUDA_TWISTED_MASS_DSLASH) {
     switch (test_type) {
       case 0:
       if(inv_param.twist_flavor == QUDA_TWIST_SINGLET)
        tm_dslash(spinorRef->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor, parity, inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
      else
      {
       int tm_offset = 12*spinorRef->Volume();

       void *ref1 = spinorRef->V();
       void *ref2 = (char*)ref1 + tm_offset*cpu_prec;

       void *flv1 = spinor->V();
       void *flv2 = (char*)flv1 + tm_offset*cpu_prec;

       tm_ndeg_dslash(ref1, ref2, hostGauge, flv1, flv2, inv_param.kappa, inv_param.mu, inv_param.epsilon, parity,
           dagger, inv_param.matpc_type, inv_param.cpu_prec, gauge_param);
     }
     break;
     case 1:
       if (inv_param.twist_flavor == QUDA_TWIST_SINGLET)
         tm_matpc(spinorRef->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
             inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
       else {
         int tm_offset = 12 * spinorRef->Volume();

         void *ref1 = spinorRef->V();
         void *ref2 = (char *)ref1 + tm_offset * cpu_prec;

         void *flv1 = spinor->V();
         void *flv2 = (char *)flv1 + tm_offset * cpu_prec;

         tm_ndeg_matpc(ref1, ref2, hostGauge, flv1, flv2, inv_param.kappa, inv_param.mu, inv_param.epsilon,
             inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
       }
   break;
   case 2:
     if (inv_param.twist_flavor == QUDA_TWIST_SINGLET)
       tm_mat(spinorRef->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor, dagger,
           inv_param.cpu_prec, gauge_param);
     else {
       int tm_offset = 12 * spinorRef->Volume();

       void *evenOut = spinorRef->V();
       void *oddOut = (char *)evenOut + tm_offset * cpu_prec;

       void *evenIn = spinor->V();
       void *oddIn = (char *)evenIn + tm_offset * cpu_prec;

       tm_ndeg_mat(evenOut, oddOut, hostGauge, evenIn, oddIn, inv_param.kappa, inv_param.mu, inv_param.epsilon, dagger,
           inv_param.cpu_prec, gauge_param);
 }
 break;
   case 3:
     if (inv_param.twist_flavor == QUDA_TWIST_SINGLET) {
       tm_matpc(spinorTmp->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
           inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
       tm_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
           inv_param.matpc_type, not_dagger, inv_param.cpu_prec, gauge_param);
     } else {
       int tm_offset = 12 * spinorRef->Volume();

       void *ref1 = spinorRef->V();
       void *ref2 = (char *)ref1 + tm_offset * cpu_prec;

       void *flv1 = spinor->V();
       void *flv2 = (char *)flv1 + tm_offset * cpu_prec;

       void *tmp1 = spinorTmp->V();
       void *tmp2 = (char *)tmp1 + tm_offset * cpu_prec;

       tm_ndeg_matpc(tmp1, tmp2, hostGauge, flv1, flv2, inv_param.kappa, inv_param.mu, inv_param.epsilon,
           inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
       tm_ndeg_matpc(ref1, ref2, hostGauge, tmp1, tmp2, inv_param.kappa, inv_param.mu, inv_param.epsilon,
           inv_param.matpc_type, not_dagger, inv_param.cpu_prec, gauge_param);
     }
     break;
   case 4:
     if (inv_param.twist_flavor == QUDA_TWIST_SINGLET) {
       tm_mat(spinorTmp->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor, dagger,
           inv_param.cpu_prec, gauge_param);
       tm_mat(spinorRef->V(), hostGauge, spinorTmp->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
           not_dagger, inv_param.cpu_prec, gauge_param);
     } else {
       int tm_offset = 12 * spinorRef->Volume();

       void *evenOut = spinorRef->V();
       void *oddOut = (char *)evenOut + tm_offset * cpu_prec;

       void *evenIn = spinor->V();
       void *oddIn = (char *)evenIn + tm_offset * cpu_prec;

       void *evenTmp = spinorTmp->V();
       void *oddTmp = (char *)evenTmp + tm_offset * cpu_prec;

       tm_ndeg_mat(evenTmp, oddTmp, hostGauge, evenIn, oddIn, inv_param.kappa, inv_param.mu, inv_param.epsilon, dagger,
           inv_param.cpu_prec, gauge_param);
       tm_ndeg_mat(evenOut, oddOut, hostGauge, evenTmp, oddTmp, inv_param.kappa, inv_param.mu, inv_param.epsilon,
           not_dagger, inv_param.cpu_prec, gauge_param);
     }
     break;
   default: printfQuda("Test type not defined\n"); exit(-1);
 }
 } else if (dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
   switch (test_type) {
     case 0:
     if(inv_param.twist_flavor == QUDA_TWIST_SINGLET)
      tmc_dslash(spinorRef->V(), hostGauge, spinor->V(), hostClover, hostCloverInv, inv_param.kappa, inv_param.mu, inv_param.twist_flavor, parity, inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
    else
     errorQuda("Not supported\n");
   break;
   case 1:
     if (inv_param.twist_flavor == QUDA_TWIST_SINGLET)
       tmc_matpc(spinorRef->V(), hostGauge, spinor->V(), hostClover, hostCloverInv, inv_param.kappa, inv_param.mu,
           inv_param.twist_flavor, inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
     else
       errorQuda("Not supported\n");
     break;
 case 2:
   if (inv_param.twist_flavor == QUDA_TWIST_SINGLET)
     tmc_mat(spinorRef->V(), hostGauge, hostClover, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
         dagger, inv_param.cpu_prec, gauge_param);
   else
     errorQuda("Not supported\n");
   break;
 case 3:
   if (inv_param.twist_flavor == QUDA_TWIST_SINGLET) {
     tmc_matpc(spinorTmp->V(), hostGauge, spinor->V(), hostClover, hostCloverInv, inv_param.kappa, inv_param.mu,
         inv_param.twist_flavor, inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
     tmc_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), hostClover, hostCloverInv, inv_param.kappa, inv_param.mu,
         inv_param.twist_flavor, inv_param.matpc_type, not_dagger, inv_param.cpu_prec, gauge_param);
   } else
     errorQuda("Not supported\n");
   break;
 case 4:
 if(inv_param.twist_flavor == QUDA_TWIST_SINGLET) {
   tmc_mat(spinorTmp->V(), hostGauge, hostClover, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor, dagger, inv_param.cpu_prec, gauge_param);
   tmc_mat(spinorRef->V(), hostGauge, hostClover, spinorTmp->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor, not_dagger, inv_param.cpu_prec, gauge_param);
 } else
 errorQuda("Not supported\n");
 break;
 default:
 printfQuda("Test type not defined\n");
 exit(-1);
 }
 } else if (dslash_type == QUDA_DOMAIN_WALL_DSLASH ){
   switch (test_type) {
     case 0:
     dw_dslash(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
     break;
     case 1:
       dw_matpc(spinorRef->V(), hostGauge, spinor->V(), kappa5, inv_param.matpc_type, dagger, gauge_param.cpu_prec,
           gauge_param, inv_param.mass);
       break;
     case 2:
     dw_mat(spinorRef->V(), hostGauge, spinor->V(), kappa5, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
     break;
     case 3:
       dw_matpc(spinorTmp->V(), hostGauge, spinor->V(), kappa5, inv_param.matpc_type, dagger, gauge_param.cpu_prec,
           gauge_param, inv_param.mass);
       dw_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), kappa5, inv_param.matpc_type, not_dagger,
           gauge_param.cpu_prec, gauge_param, inv_param.mass);
       break;
     case 4:
     dw_matdagmat(spinorRef->V(), hostGauge, spinor->V(), kappa5, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
     break;
     default:
     printf("Test type not supported for domain wall\n");
     exit(-1);
   }
 } else if (dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH){
   double *kappa_5 = (double*)malloc(Ls*sizeof(double));
   for(int xs = 0; xs < Ls ; xs++)
     kappa_5[xs] = kappa5;
   switch (test_type) {
     case 0:
     dslash_4_4d(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
     break;
     case 1:
       dw_dslash_5_4d(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param,
           inv_param.mass, true);
       break;
     case 2:
       dslash_5_inv(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param,
           inv_param.mass, kappa_5);
       break;
     case 3:
     dw_4d_matpc(spinorRef->V(), hostGauge, spinor->V(), kappa5, inv_param.matpc_type, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
     break;
     case 4:
       dw_4d_matpc(spinorTmp->V(), hostGauge, spinor->V(), kappa5, inv_param.matpc_type, dagger, gauge_param.cpu_prec,
           gauge_param, inv_param.mass);
       dw_4d_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), kappa5, inv_param.matpc_type, not_dagger,
           gauge_param.cpu_prec, gauge_param, inv_param.mass);
       break;
       break;
     default:
     printf("Test type not supported for domain wall\n");
     exit(-1);
   }
   free(kappa_5);
 } else if (dslash_type == QUDA_MOBIUS_DWF_DSLASH){
   double _Complex *kappa_b = (double _Complex *)malloc(Lsdim * sizeof(double _Complex));
   double _Complex *kappa_c = (double _Complex *)malloc(Lsdim * sizeof(double _Complex));
   double _Complex *kappa_5 = (double _Complex *)malloc(Lsdim * sizeof(double _Complex));
   double _Complex *kappa_mdwf = (double _Complex *)malloc(Lsdim * sizeof(double _Complex));
   for(int xs = 0 ; xs < Lsdim ; xs++)
   {
     kappa_b[xs] = 1.0/(2*(inv_param.b_5[xs]*(4.0 + inv_param.m5) + 1.0));
     kappa_c[xs] = 1.0/(2*(inv_param.c_5[xs]*(4.0 + inv_param.m5) - 1.0));
     kappa_5[xs] = 0.5*kappa_b[xs]/kappa_c[xs];
     kappa_mdwf[xs] = -kappa_5[xs];
   }
   switch (test_type) {
     case 0:
     dslash_4_4d(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
     break;
     case 1:
     mdw_dslash_5(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, kappa_5, true);
     break;
     case 2:
     mdw_dslash_4_pre(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, inv_param.b_5, inv_param.c_5, true);
     break;
     case 3:
       mdw_dslash_5_inv(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param,
           inv_param.mass, kappa_mdwf);
       break;
     case 4:
       mdw_matpc(spinorRef->V(), hostGauge, spinor->V(), kappa_b, kappa_c, inv_param.matpc_type, dagger,
           gauge_param.cpu_prec, gauge_param, inv_param.mass, inv_param.b_5, inv_param.c_5);
       break;
     case 5:
       mdw_matpc(spinorTmp->V(), hostGauge, spinor->V(), kappa_b, kappa_c, inv_param.matpc_type, dagger,
           gauge_param.cpu_prec, gauge_param, inv_param.mass, inv_param.b_5, inv_param.c_5);
       mdw_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), kappa_b, kappa_c, inv_param.matpc_type, not_dagger,
           gauge_param.cpu_prec, gauge_param, inv_param.mass, inv_param.b_5, inv_param.c_5);
       break;
       break;
     default:
     printf("Test type not supported for domain wall\n");
     exit(-1);
   }
   free(kappa_b);
   free(kappa_c);
   free(kappa_5);
   free(kappa_mdwf);
 } else {
   printfQuda("Unsupported dslash_type\n");
   exit(-1);
 }

 // printfQuda("done.\n");
 }


 void display_test_info(int precision, QudaReconstructType link_recon)
 {
   auto prec = getPrecision(precision);
   // printfQuda("running the following test:\n");

   printfQuda("prec    recon   test_type     matpc_type   dagger   S_dim         T_dimension   Ls_dimension dslash_type    niter\n");
   printfQuda("%6s   %2s       %d           %12s    %d    %3d/%3d/%3d        %3d             %2d   %14s   %d\n",
       get_prec_str(prec), get_recon_str(link_recon), test_type, get_matpc_str(matpc_type), dagger, xdim, ydim, zdim,
       tdim, Lsdim, get_dslash_str(dslash_type), niter);
   // printfQuda("Grid partition info:     X  Y  Z  T\n");
   // printfQuda("                         %d  %d  %d  %d\n",
   //   dimPartitioned(0),
   //   dimPartitioned(1),
   //   dimPartitioned(2),
   //   dimPartitioned(3));

   return ;

 }


 using ::testing::TestWithParam;
 using ::testing::Bool;
 using ::testing::Values;
 using ::testing::Range;
 using ::testing::Combine;

 class DslashTest : public ::testing::TestWithParam<::testing::tuple<int, int, int>> {
 protected:
   ::testing::tuple<int, int, int> param;

   bool skip()
   {
     QudaReconstructType recon = static_cast<QudaReconstructType>(::testing::get<1>(GetParam()));
     if ((QUDA_PRECISION & getPrecision(::testing::get<0>(GetParam()))) == 0
         || (QUDA_RECONSTRUCT & getReconstructNibble(recon)) == 0) {
       return true;
     }
     return false;
   }

   public:
   virtual ~DslashTest() { }
   virtual void SetUp() {
     int prec = ::testing::get<0>(GetParam());
     QudaReconstructType recon = static_cast<QudaReconstructType>(::testing::get<1>(GetParam()));

     if (skip()) GTEST_SKIP();

     int value = ::testing::get<2>(GetParam());
     for(int j=0; j < 4;j++){
       if (value &  (1 << j)){
         commDimPartitionedSet(j);
       }

     }
     updateR();

     init(prec, recon);
     display_test_info(prec, recon);
   }

   virtual void TearDown()
   {
     if (skip()) GTEST_SKIP();
     end();
   }

   static void SetUpTestCase() {
     initQuda(device);
   }

   // Per-test-case tear-down.
   // Called after the last test in this test case.
   // Can be omitted if not needed.
   static void TearDownTestCase() {
     endQuda();
   }

 };

 TEST_P(DslashTest, verify)
 {
   dslashRef();

   dslashCUDA(1); // warm-up run
   dslashCUDA(2);

   if (!transfer) *spinorOut = *cudaSpinorOut;

   double norm2_cpu = blas::norm2(*spinorRef);
   double norm2_cpu_cuda= blas::norm2(*spinorOut);
   if (!transfer) {
     double norm2_cuda= blas::norm2(*cudaSpinorOut);
     printfQuda("Results: CPU = %f, CUDA=%f, CPU-CUDA = %f\n", norm2_cpu, norm2_cuda, norm2_cpu_cuda);
   } else {
     printfQuda("Result: CPU = %f, CPU-QUDA = %f\n", norm2_cpu, norm2_cpu_cuda);
   }
   double deviation = pow(10, -(double)(cpuColorSpinorField::Compare(*spinorRef, *spinorOut)));
   double tol = getTolerance(inv_param.cuda_prec);
   if (gauge_param.reconstruct == QUDA_RECONSTRUCT_8 && inv_param.cuda_prec >= QUDA_HALF_PRECISION)
     tol *= 10; // if recon 8, we tolerate a greater deviation

   ASSERT_LE(deviation, tol) << "CPU and CUDA implementations do not agree";
 }

 TEST_P(DslashTest, benchmark)
 {
   dslashCUDA(1); // warm-up run

   if (!transfer) dirac->Flops();
   auto dslash_time = dslashCUDA(niter);
   printfQuda("%fus per kernel call\n", 1e6 * dslash_time.event_time / niter);
   // FIXME No flops count for twisted-clover yet
   unsigned long long flops = 0;
   if (!transfer) flops = dirac->Flops();
   double gflops = 1.0e-9 * flops / dslash_time.event_time;
   printfQuda("GFLOPS = %f\n", gflops);
   RecordProperty("Gflops", std::to_string(gflops));
   RecordProperty("Halo_bidirectitonal_BW_GPU", 1.0e-9 * 2 * cudaSpinor->GhostBytes() * niter / dslash_time.event_time);
   RecordProperty("Halo_bidirectitonal_BW_CPU", 1.0e-9 * 2 * cudaSpinor->GhostBytes() * niter / dslash_time.cpu_time);
   RecordProperty("Halo_bidirectitonal_BW_CPU_min", 1.0e-9 * 2 * cudaSpinor->GhostBytes() / dslash_time.cpu_max);
   RecordProperty("Halo_bidirectitonal_BW_CPU_max", 1.0e-9 * 2 * cudaSpinor->GhostBytes() / dslash_time.cpu_min);
   RecordProperty("Halo_message_size_bytes", 2 * cudaSpinor->GhostBytes());

   printfQuda("Effective halo bi-directional bandwidth (GB/s) GPU = %f ( CPU = %f, min = %f , max = %f ) for aggregate "
              "message size %lu bytes\n",
       1.0e-9 * 2 * cudaSpinor->GhostBytes() * niter / dslash_time.event_time,
       1.0e-9 * 2 * cudaSpinor->GhostBytes() * niter / dslash_time.cpu_time,
       1.0e-9 * 2 * cudaSpinor->GhostBytes() / dslash_time.cpu_max,
       1.0e-9 * 2 * cudaSpinor->GhostBytes() / dslash_time.cpu_min, 2 * cudaSpinor->GhostBytes());
 }

 int main(int argc, char **argv)
 {
   // initalize google test, includes command line options
   ::testing::InitGoogleTest(&argc, argv);
   // return code for google test
   int test_rc = 0;
   for (int i = 1; i < argc; i++) {
     if (process_command_line_option(argc, argv, &i) == 0) { continue; }

     fprintf(stderr, "ERROR: Invalid option:%s\n", argv[i]);
     usage(argv);
   }

   initComms(argc, argv, gridsize_from_cmdline);

   ::testing::TestEventListeners &listeners = ::testing::UnitTest::GetInstance()->listeners();
   if (comm_rank() != 0) { delete listeners.Release(listeners.default_result_printer()); }
   test_rc = RUN_ALL_TESTS();

   finalizeComms();
   return test_rc;
 }

 std::string getdslashtestname(testing::TestParamInfo<::testing::tuple<int, int, int>> param)
 {
   const int prec = ::testing::get<0>(param.param);
   const int recon = ::testing::get<1>(param.param);
   const int part = ::testing::get<2>(param.param);
   std::stringstream ss;
   // std::cout << "getdslashtestname" << get_dslash_str(dslash_type) << "_" << prec_str[prec] << "_r" << recon <<
   // "_partition" << part << std::endl; ss << get_dslash_str(dslash_type) << "_";
   ss << prec_str[prec];
   ss << "_r" << recon;
   ss << "_partition" << part;
   return ss.str();
 }

 #ifdef MULTI_GPU
 INSTANTIATE_TEST_SUITE_P(QUDA, DslashTest,
     Combine(Range(0, 4), ::testing::Values(QUDA_RECONSTRUCT_NO, QUDA_RECONSTRUCT_12, QUDA_RECONSTRUCT_8), Range(0, 16)),
     getdslashtestname);
 #else
 INSTANTIATE_TEST_SUITE_P(QUDA, DslashTest,
     Combine(Range(0, 4), ::testing::Values(QUDA_RECONSTRUCT_NO, QUDA_RECONSTRUCT_12, QUDA_RECONSTRUCT_8),
         ::testing::Values(0)),
     getdslashtestname);
 #endif
tmp2
cudaColorSpinorField * tmp2
Definition: dslash_ctest.cpp:40

invert_quda.h

QudaInvertParam_s::dirac_order
QudaDiracFieldOrder dirac_order
Definition: quda.h:219

comm_rank
int comm_rank(void)
Definition: comm_mpi.cpp:82

QudaGaugeParam_s::reconstruct_sloppy
QudaReconstructType reconstruct_sloppy
Definition: quda.h:53

QudaGaugeParam_s::anisotropy
double anisotropy
Definition: quda.h:38

QUDA_RECONSTRUCT_NO
Definition: enum_quda.h:67

mdw_matpc
void mdw_matpc(void *out, void **gauge, void *in, double _Complex *kappa_b, double _Complex *kappa_c, QudaMatPCType matpc_type, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, double _Complex *b5, double _Complex *c5)
Definition: domain_wall_dslash_reference.cpp:906

transfer
const int transfer
Definition: dslash_ctest.cpp:29

quda::ColorSpinorParam::setPrecision
void setPrecision(QudaPrecision precision, QudaPrecision ghost_precision=QUDA_INVALID_PRECISION, bool force_native=false)
Definition: color_spinor_field.h:231

main
int main(int argc, char **argv)
Definition: dslash_ctest.cpp:1095

tmp1
cudaColorSpinorField * tmp1
Definition: dslash_ctest.cpp:40

mu
double mu
Definition: test_util.cpp:1648

QUDA_MAT_SOLUTION
Definition: enum_quda.h:151

dw_4d_matpc
void dw_4d_matpc(void *out, void **gauge, void *in, double kappa, QudaMatPCType matpc_type, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:865

QUDA_PACKED_CLOVER_ORDER
Definition: enum_quda.h:256

endQuda
void endQuda(void)
Definition: interface_quda.cpp:1461

dw_dslash_5_4d
void dw_dslash_5_4d(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, bool zero_initialize)
Definition: domain_wall_dslash_reference.cpp:695

construct_gauge_field
void construct_gauge_field(void **gauge, int type, QudaPrecision precision, QudaGaugeParam *param)
Definition: test_util.cpp:1047

getReconstructNibble
int getReconstructNibble(QudaReconstructType recon)
Definition: test_util.h:140

QudaInvertParam_s::solve_type
QudaSolveType solve_type
Definition: quda.h:205

gridsize_from_cmdline
int gridsize_from_cmdline[]
Definition: test_util.cpp:49

verbosity
QudaVerbosity verbosity
Definition: test_util.cpp:1614

QudaPrecision
enum QudaPrecision_s QudaPrecision

dirac_mdwf
DiracMobiusPC * dirac_mdwf
Definition: dslash_ctest.cpp:45

quda::DiracMobius::Dslash5
void Dslash5(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Definition: dirac_mobius.cpp:75

QudaGaugeParam_s::ga_pad
int ga_pad
Definition: quda.h:63

QudaInvertParam_s::c_5
double_complex c_5[QUDA_MAX_DWF_LS]
Definition: quda.h:112

misc.h

dw_setDims
void dw_setDims(int *X, const int L5)
Definition: test_util.cpp:187

QudaInvertParam_s::mu
double mu
Definition: quda.h:114

QudaGaugeParam_s::gauge_fix
QudaGaugeFixed gauge_fix
Definition: quda.h:61

parity
const QudaParity parity
Definition: dslash_ctest.cpp:28

spinorRef
cpuColorSpinorField * spinorRef
Definition: dslash_ctest.cpp:39

quda::norm
__host__ __device__ ValueType norm(const complex< ValueType > &z)
Returns the magnitude of z squared.
Definition: complex_quda.h:1092

tm_mat
void tm_mat(void *out, void **gauge, void *in, double kappa, double mu, QudaTwistFlavorType flavor, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:309

tm_dslash
void tm_dslash(void *res, void **gaugeFull, void *spinorField, double kappa, double mu, QudaTwistFlavorType flavor, int oddBit, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:277

quda::ColorSpinorParam::nColor
int nColor
Definition: color_spinor_field.h:85

QUDA_INVALID_PRECISION
Definition: enum_quda.h:63

QUDA_ASQTAD_DSLASH
Definition: enum_quda.h:93

niter
int niter
Definition: test_util.cpp:1629

QudaGaugeParam_s::type
QudaLinkType type
Definition: quda.h:42

QudaInvertParam_s::kappa
double kappa
Definition: quda.h:106

MatDagMatQuda
void MatDagMatQuda(void *h_out, void *h_in, QudaInvertParam *inv_param)
Definition: interface_quda.cpp:2158

xdim
int xdim
Definition: test_util.cpp:1615

errorQuda
#define errorQuda(...)
Definition: util_quda.h:121

quda::blas::norm2
double norm2(const ColorSpinorField &a)
Definition: reduce_quda.cu:721

QudaInvertParam_s::dslash_type
QudaDslashType dslash_type
Definition: quda.h:102

QUDA_GAUGE_FIXED_NO
Definition: enum_quda.h:77

test_util.h

QudaInvertParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:214

DslashTest::TearDown
virtual void TearDown()
Definition: dslash_ctest.cpp:1024

cloverSiteSize
#define cloverSiteSize
Definition: test_util.h:9

QudaInvertParam_s::return_clover_inverse
int return_clover_inverse
Definition: quda.h:242

QUDA_QUARTER_PRECISION
Definition: enum_quda.h:59

QUDA_SPACE_SPIN_COLOR_FIELD_ORDER
Definition: enum_quda.h:350

QUDA_HALF_PRECISION
Definition: enum_quda.h:60

QUDA_QDP_GAUGE_ORDER
Definition: enum_quda.h:41

loadGaugeQuda
void loadGaugeQuda(void *h_gauge, QudaGaugeParam *param)
Definition: interface_quda.cpp:729

DslashTime::cpu_min
double cpu_min
Definition: dslash_ctest.cpp:462

tmc_dslash
void tmc_dslash(void *out, void **gauge, void *in, void *clover, void *cInv, double kappa, double mu, QudaTwistFlavorType flavor, int parity, QudaMatPCType matpc_type, int dagger, QudaPrecision precision, QudaGaugeParam &param)
Definition: clover_reference.cpp:234

commDimPartitionedSet
void commDimPartitionedSet(int dir)
Definition: comm_common.cpp:817

QUDA_WILSON_LINKS
Definition: enum_quda.h:29

quda::DiracMobiusPC
Definition: dirac_quda.h:491

QudaInvertParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:213

dagger
QudaDagType dagger
Definition: test_util.cpp:1620

process_command_line_option
int process_command_line_option(int argc, char **argv, int *idx)
Definition: test_util.cpp:2019

quda::cpuColorSpinorField::Source
void Source(const QudaSourceType sourceType, const int st=0, const int s=0, const int c=0)
Definition: cpu_color_spinor_field.cpp:247

QUDA_FULL_SITE_SUBSET
Definition: enum_quda.h:333

tm_ndeg_mat
void tm_ndeg_mat(void *evenOut, void *oddOut, void **gauge, void *evenIn, void *oddIn, double kappa, double mu, double epsilon, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:554

matpc_type
QudaMatPCType matpc_type
Definition: test_util.cpp:1662

QUDA_DIRECT_SOLVE
Definition: enum_quda.h:161

not_dagger
QudaDagType not_dagger
Definition: dslash_ctest.cpp:66

clover_matpc
void clover_matpc(void *out, void **gauge, void *clover, void *clover_inv, void *in, double kappa, QudaMatPCType matpc_type, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: clover_reference.cpp:92

QudaInvertParam_s::dagger
QudaDagType dagger
Definition: quda.h:207

get_matpc_str
const char * get_matpc_str(QudaMatPCType type)
Definition: misc.cpp:1121

finalizeComms
void finalizeComms()
Definition: test_util.cpp:128

quda::cudaColorSpinorField
Definition: color_spinor_field.h:575

DslashTest::skip
bool skip()
Definition: dslash_ctest.cpp:993

QUDA_TWIST_SINGLET
Definition: enum_quda.h:399

dw_dslash
void dw_dslash(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:572

gauge_param
QudaGaugeParam gauge_param
Definition: dslash_ctest.cpp:36

QudaInvertParam_s::clover_cuda_prec_refinement_sloppy
QudaPrecision clover_cuda_prec_refinement_sloppy
Definition: quda.h:227

QudaGaugeParam_s::gauge_order
QudaGaugeFieldOrder gauge_order
Definition: quda.h:43

dw_mat
void dw_mat(void *out, void **gauge, void *in, double kappa, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:766

tmc_mat
void tmc_mat(void *out, void **gauge, void *clover, void *in, double kappa, double mu, QudaTwistFlavorType flavor, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: clover_reference.cpp:257

util_quda.h

compute_clover
bool compute_clover
Definition: test_util.cpp:1654

tm_matpc
void tm_matpc(void *outEven, void **gauge, void *inEven, double kappa, double mu, QudaTwistFlavorType flavor, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:356

QUDA_TWIST_NONDEG_DOUBLET
Definition: enum_quda.h:400

get_prec_str
const char * get_prec_str(QudaPrecision prec)
Definition: misc.cpp:701

loadCloverQuda
void loadCloverQuda(void *h_clover, void *h_clovinv, QudaInvertParam *inv_param)
Definition: interface_quda.cpp:985

QudaInvertParam_s::return_clover
int return_clover
Definition: quda.h:241

quda::ColorSpinorField::Volume
int Volume() const
Definition: color_spinor_field.h:415

quda::DiracMobiusPC::M
void M(ColorSpinorField &out, const ColorSpinorField &in) const
Definition: dirac_mobius.cpp:242

quda::Dirac::Flops
unsigned long long Flops() const
Definition: dirac_quda.h:177

QUDA_UKQCD_GAMMA_BASIS
Definition: enum_quda.h:368

twist_flavor
QudaTwistFlavorType twist_flavor
Definition: test_util.cpp:1660

dslashRef
void dslashRef()
Definition: dslash_ctest.cpp:647

dslash_type
QudaDslashType dslash_type
Definition: test_util.cpp:1621

quda::Dirac::MdagM
virtual void MdagM(ColorSpinorField &out, const ColorSpinorField &in) const =0

quda
Definition: blas_cublas.h:5

quda::LatticeFieldParam::siteSubset
QudaSiteSubset siteSubset
Definition: lattice_field.h:71

QudaInvertParam_s::clover_cuda_prec_sloppy
QudaPrecision clover_cuda_prec_sloppy
Definition: quda.h:226

setDims
void setDims(int *)
Definition: test_util.cpp:151

dslashQuda
void dslashQuda(void *h_out, void *h_in, QudaInvertParam *inv_param, QudaParity parity)
Definition: interface_quda.cpp:1853

QudaInvertParam_s::input_location
QudaFieldLocation input_location
Definition: quda.h:99

freeGaugeQuda
void freeGaugeQuda(void)
Definition: interface_quda.cpp:1259

DslashTest
Definition: dslash_ctest.cpp:989

verify_results
bool verify_results
Definition: test_util.cpp:1643

dirac_quda.h

recon_str
const char * recon_str[]
Definition: dslash_ctest.cpp:83

Ls
int Ls
Definition: test_util.cpp:38

param
QudaGaugeParam param
Definition: pack_test.cpp:17

QudaInvertParam_s::b_5
double_complex b_5[QUDA_MAX_DWF_LS]
Definition: quda.h:111

quda::setDiracParam
void setDiracParam(DiracParam &diracParam, QudaInvertParam *inv_param, bool pc)
Definition: interface_quda.cpp:1562

QudaInvertParam_s::solution_type
QudaSolutionType solution_type
Definition: quda.h:204

QUDA_MATPC_SOLUTION
Definition: enum_quda.h:153

dslashQuda_4dpc
void dslashQuda_4dpc(void *h_out, void *h_in, QudaInvertParam *inv_param, QudaParity parity, int test_type)
Definition: interface_quda.cpp:1945

quda::LatticeFieldParam::x
int x[QUDA_MAX_DIM]
Definition: lattice_field.h:67

QudaInvertParam_s::clover_cuda_prec
QudaPrecision clover_cuda_prec
Definition: quda.h:225

mdw_dslash_4_pre
void mdw_dslash_4_pre(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, double _Complex *b5, double _Complex *c5, bool zero_initialize)
Definition: domain_wall_dslash_reference.cpp:741

quda::DiracMobius::Dslash4
void Dslash4(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Definition: dirac_mobius.cpp:48

quda::DiracParam
Definition: dirac_quda.h:19

dw_matdagmat
void dw_matdagmat(void *out, void **gauge, void *in, double kappa, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:834

dirac
Dirac * dirac
Definition: dslash_ctest.cpp:44

initQuda
void initQuda(int device)
Definition: interface_quda.cpp:679

dw_matpc
void dw_matpc(void *out, void **gauge, void *in, double kappa, QudaMatPCType matpc_type, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:845

quda::ColorSpinorParam::pc_type
QudaPCType pc_type
Definition: color_spinor_field.h:97

QUDA_EVEN_ODD_SITE_ORDER
Definition: enum_quda.h:340

tol
double tol
Definition: test_util.cpp:1656

getPrecision
QudaPrecision getPrecision(int i)
Definition: test_util.h:129

QudaInvertParam_s::output_location
QudaFieldLocation output_location
Definition: quda.h:100

QudaInvertParam_s::clover_cuda_prec_precondition
QudaPrecision clover_cuda_prec_precondition
Definition: quda.h:228

QUDA_RECONSTRUCT_12
Definition: enum_quda.h:68

benchmark
double benchmark(int kernel, const int niter)
Definition: blas_test.cu:303

DslashTest::SetUp
virtual void SetUp()
Definition: dslash_ctest.cpp:1005

QudaInvertParam_s::m5
double m5
Definition: quda.h:108

QudaGaugeParam_s
Definition: quda.h:32

DslashTest::~DslashTest
virtual ~DslashTest()
Definition: dslash_ctest.cpp:1004

quda::ColorSpinorParam::fieldOrder
QudaFieldOrder fieldOrder
Definition: color_spinor_field.h:93

link_recon
QudaReconstructType link_recon
Definition: test_util.cpp:1605

quda::DiracDomainWall4DPC::Dslash5inv
void Dslash5inv(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity, const double &kappa5) const
Definition: dirac_domain_wall_4d.cpp:131

mdw_dslash_5_inv
void mdw_dslash_5_inv(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, double _Complex *kappa)
Definition: domain_wall_dslash_reference.cpp:715

QudaInvertParam_s::verbosity
QudaVerbosity verbosity
Definition: quda.h:244

setSpinorSiteSize
void setSpinorSiteSize(int n)
Definition: test_util.cpp:211

csParam
ColorSpinorParam csParam
Definition: pack_test.cpp:24

newQudaInvertParam
QudaInvertParam newQudaInvertParam(void)

tdim
int tdim
Definition: test_util.cpp:1618

get_recon_str
const char * get_recon_str(QudaReconstructType recon)
Definition: misc.cpp:768

DslashTime::event_time
double event_time
Definition: dslash_ctest.cpp:460

QudaInvertParam_s::clover_order
QudaCloverFieldOrder clover_order
Definition: quda.h:230

QudaMatPCType
enum QudaMatPCType_s QudaMatPCType

quda::ColorSpinorParam::gammaBasis
QudaGammaBasis gammaBasis
Definition: color_spinor_field.h:94

QUDA_CLOVER_WILSON_DSLASH
Definition: enum_quda.h:88

DslashTime::cpu_time
double cpu_time
Definition: dslash_ctest.cpp:461

quda::pow
__host__ __device__ ValueType pow(ValueType x, ExponentType e)
Definition: complex_quda.h:111

QUDA_PARITY_SITE_SUBSET
Definition: enum_quda.h:332

QudaInvertParam_s::gamma_basis
QudaGammaBasis gamma_basis
Definition: quda.h:221

QUDA_FLOAT2_FIELD_ORDER
Definition: enum_quda.h:348

latfile
char latfile[]
Definition: test_util.cpp:1623

QudaGaugeParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:52

quda::DiracMobius::Dslash4pre
void Dslash4pre(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Definition: dirac_mobius.cpp:60

get_dslash_str
const char * get_dslash_str(QudaDslashType type)
Definition: misc.cpp:910

display_test_info
void display_test_info(int precision, QudaReconstructType link_recon)
Definition: dslash_ctest.cpp:961

dslash_util.h

getdslashtestname
std::string getdslashtestname(testing::TestParamInfo<::testing::tuple< int, int, int >> param)
Definition: dslash_ctest.cpp:1118

clover_mat
void clover_mat(void *out, void **gauge, void *clover, void *in, double kappa, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: clover_reference.cpp:149

QUDA_5D_PC
Definition: enum_quda.h:396

tm_ndeg_matpc
void tm_ndeg_matpc(void *outEven1, void *outEven2, void **gauge, void *inEven1, void *inEven2, double kappa, double mu, double epsilon, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:484

QudaDagType
enum QudaDagType_s QudaDagType

QudaParity
enum QudaParity_s QudaParity

QudaGaugeParam_s::reconstruct
QudaReconstructType reconstruct
Definition: quda.h:50

QudaGaugeParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:49

quda::DiracDomainWall4D::Dslash4
void Dslash4(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Definition: dirac_domain_wall_4d.cpp:21

QudaGaugeParam_s::X
int X[4]
Definition: quda.h:36

cuda_prec
QudaPrecision cuda_prec
Definition: dslash_ctest.cpp:34

quda::DiracDomainWall4DPC
Definition: dirac_quda.h:423

QudaInvertParam_s::mass
double mass
Definition: quda.h:105

clover_coeff
double clover_coeff
Definition: test_util.cpp:1653

end
void end()
Definition: dslash_ctest.cpp:428

hostGauge
void * hostGauge[4]
Definition: dslash_ctest.cpp:42

V
int V
Definition: test_util.cpp:27

QUDA_TWISTED_CLOVER_DSLASH
Definition: enum_quda.h:95

hostClover
void * hostClover
Definition: dslash_ctest.cpp:42

zdim
int zdim
Definition: test_util.cpp:1617

quda::LatticeFieldParam::nDim
int nDim
Definition: lattice_field.h:64

quda::cpuColorSpinorField::Compare
static int Compare(const cpuColorSpinorField &a, const cpuColorSpinorField &b, const int resolution=1)
Perform a component by component comparison of two color-spinor fields. In doing we normalize with re...
Definition: cpu_color_spinor_field.cpp:251

QudaInvertParam_s::sp_pad
int sp_pad
Definition: quda.h:246

clover_dslash
void clover_dslash(void *out, void **gauge, void *clover, void *in, int parity, int dagger, QudaPrecision precision, QudaGaugeParam &param)
Definition: clover_reference.cpp:81

QudaInvertParam_s::compute_clover_inverse
int compute_clover_inverse
Definition: quda.h:240

DslashTest::param
::testing::tuple< int, int, int > param
Definition: dslash_ctest.cpp:991

QUDA_WILSON_DSLASH
Definition: enum_quda.h:87

tm_ndeg_dslash
void tm_ndeg_dslash(void *res1, void *res2, void **gauge, void *spinorField1, void *spinorField2, double kappa, double mu, double epsilon, int oddBit, int daggerBit, QudaMatPCType matpc_type, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:468

blas_quda.h

hostCloverInv
void * hostCloverInv
Definition: dslash_ctest.cpp:42

QUDA_RECONSTRUCT_8
Definition: enum_quda.h:69

construct_clover_field
void construct_clover_field(void *clover, double norm, double diag, QudaPrecision precision)
Definition: test_util.cpp:1167

quda::Dirac::M
virtual void M(ColorSpinorField &out, const ColorSpinorField &in) const =0

quda::ColorSpinorParam
Definition: color_spinor_field.h:80

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:62

epsilon
double epsilon
Definition: test_util.cpp:1649

wil_mat
void wil_mat(void *out, void **gauge, void *in, double kappa, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:294

dslashCUDA
DslashTime dslashCUDA(int niter)
Definition: dslash_ctest.cpp:469

QUDA_TWISTED_MASS_DSLASH
Definition: enum_quda.h:94

QUDA_STAGGERED_DSLASH
Definition: enum_quda.h:92

mdw_dslash_5
void mdw_dslash_5(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, double _Complex *kappa, bool zero_initialize)
Definition: domain_wall_dslash_reference.cpp:725

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:61

Lsdim
int Lsdim
Definition: test_util.cpp:1619

quda::ColorSpinorParam::nSpin
int nSpin
Definition: color_spinor_field.h:86

QudaReconstructType
enum QudaReconstructType_s QudaReconstructType

commDimPartitionedReset
void commDimPartitionedReset()
Reset the comm dim partioned array to zero,.
Definition: comm_common.cpp:819

quda.h
Main header file for the QUDA library.

quda::LatticeFieldParam::Precision
QudaPrecision Precision() const
Definition: lattice_field.h:58

QUDA_DEGRAND_ROSSI_GAMMA_BASIS
Definition: enum_quda.h:367

tmc_matpc
void tmc_matpc(void *out, void **gauge, void *in, void *clover, void *cInv, double kappa, double mu, QudaTwistFlavorType flavor, QudaMatPCType matpc_type, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: clover_reference.cpp:284

dslash_quda.h

INSTANTIATE_TEST_SUITE_P
INSTANTIATE_TEST_SUITE_P(QUDA, DslashTest, Combine(Range(0, 4), ::testing::Values(QUDA_RECONSTRUCT_NO, QUDA_RECONSTRUCT_12, QUDA_RECONSTRUCT_8), ::testing::Values(0)), getdslashtestname)

MatQuda
void MatQuda(void *h_out, void *h_in, QudaInvertParam *inv_param)
Definition: interface_quda.cpp:2088

QudaInvertParam_s::Ls
int Ls
Definition: quda.h:109

printfQuda
#define printfQuda(...)
Definition: util_quda.h:115

QudaGaugeParam_s::t_boundary
QudaTboundary t_boundary
Definition: quda.h:45

QudaInvertParam_s::twist_flavor
QudaTwistFlavorType twist_flavor
Definition: quda.h:117

dslash_4_4d
void dslash_4_4d(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:637

DslashTime
Definition: dslash_ctest.cpp:459

quda::ColorSpinorParam::twistFlavor
QudaTwistFlavorType twistFlavor
Definition: color_spinor_field.h:89

usage
void usage(char **)
Definition: test_util.cpp:1783

quda::blas::flops
unsigned long long flops
Definition: blas_quda.cu:22

DslashTime::cpu_max
double cpu_max
Definition: dslash_ctest.cpp:463

quda::ColorSpinorParam::siteOrder
QudaSiteOrder siteOrder
Definition: color_spinor_field.h:91

qio_field.h

quda::DiracMobiusPC::MdagM
void MdagM(ColorSpinorField &out, const ColorSpinorField &in) const
Definition: dirac_mobius.cpp:285

QUDA_DIRAC_ORDER
Definition: enum_quda.h:243

QudaDslashType
enum QudaDslashType_s QudaDslashType

QUDA_ANTI_PERIODIC_T
Definition: enum_quda.h:53

QUDA_RANDOM_SOURCE
Definition: enum_quda.h:375

domain_wall_dslash_reference.h

QudaInvertParam_s::cl_pad
int cl_pad
Definition: quda.h:247

QUDA_DIRECT_PC_SOLVE
Definition: enum_quda.h:163

quda::DiracParam::tmp2
ColorSpinorField * tmp2
Definition: dirac_quda.h:42

DslashTest::SetUpTestCase
static void SetUpTestCase()
Definition: dslash_ctest.cpp:1030

inv_param
QudaInvertParam inv_param
Definition: dslash_ctest.cpp:37

wil_matpc
void wil_matpc(void *outEven, void **gauge, void *inEven, double kappa, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:332

QUDA_EVEN_PARITY
Definition: enum_quda.h:287

DslashTest::TearDownTestCase
static void TearDownTestCase()
Definition: dslash_ctest.cpp:1037

QUDA_MATDAG_MAT_SOLUTION
Definition: enum_quda.h:152

mass
double mass
Definition: test_util.cpp:1646

QudaVerbosity
enum QudaVerbosity_s QudaVerbosity

QudaInvertParam_s::compute_clover
int compute_clover
Definition: quda.h:239

wilson_dslash_reference.h

QudaInvertParam_s::epsilon
double epsilon
Definition: quda.h:115

wil_dslash
void wil_dslash(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:175

quda::DiracDomainWall4DPC::MdagM
void MdagM(ColorSpinorField &out, const ColorSpinorField &in) const
Definition: dirac_domain_wall_4d.cpp:193

spinorTmp
cpuColorSpinorField * spinorTmp
Definition: dslash_ctest.cpp:39

QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:360

quda::Dirac::create
static Dirac * create(const DiracParam &param)
Definition: dirac.cpp:159

QUDA_DOMAIN_WALL_DSLASH
Definition: enum_quda.h:89

quda::DiracDomainWall4D::Dslash5
void Dslash5(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Definition: dirac_domain_wall_4d.cpp:31

QUDA_FLOAT4_FIELD_ORDER
Definition: enum_quda.h:349

quda::ColorSpinorParam::create
QudaFieldCreate create
Definition: color_spinor_field.h:95

cudaSpinorOut
cudaColorSpinorField * cudaSpinorOut
Definition: dslash_ctest.cpp:40

cpu_prec
QudaPrecision cpu_prec
Definition: dslash_ctest.cpp:33

initComms
void initComms(int argc, char **argv, int *const commDims)
Definition: test_util.cpp:88

quda::DiracMobiusPC::Dslash5inv
void Dslash5inv(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Definition: dirac_mobius.cpp:205

QUDA_MATPCDAG_MATPC_SOLUTION
Definition: enum_quda.h:155

device
int device
Definition: test_util.cpp:1602

quda::Dirac::Dslash
virtual void Dslash(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const =0

cudaSpinor
cudaColorSpinorField * cudaSpinor
Definition: dslash_ctest.cpp:40

quda::ColorSpinorField::GhostBytes
size_t GhostBytes() const
Definition: color_spinor_field.h:420

spinor
cpuColorSpinorField * spinor
Definition: dslash_ctest.cpp:39

QudaInvertParam_s::clover_cpu_prec
QudaPrecision clover_cpu_prec
Definition: quda.h:224

QudaInvertParam_s
Definition: quda.h:97

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:325

prec
QudaPrecision prec
Definition: test_util.cpp:1608

quda::DiracDomainWall4DPC::M
void M(ColorSpinorField &out, const ColorSpinorField &in) const
Definition: dirac_domain_wall_4d.cpp:159

init
void init(int precision, QudaReconstructType link_recon)
Definition: dslash_ctest.cpp:100

setVerbosity
void setVerbosity(QudaVerbosity verbosity)
Definition: util_quda.cpp:25

DslashTime::DslashTime
DslashTime()
Definition: dslash_ctest.cpp:465

QudaInvertParam_s::matpc_type
QudaMatPCType matpc_type
Definition: quda.h:206

dslashQuda_mdwf
void dslashQuda_mdwf(void *h_out, void *h_in, QudaInvertParam *inv_param, QudaParity parity, int test_type)
Definition: interface_quda.cpp:2015

test_type
int test_type
Definition: test_util.cpp:1636

QUDA_DOMAIN_WALL_4D_DSLASH
Definition: enum_quda.h:90

getTolerance
double getTolerance(QudaPrecision prec)
Definition: dslash_ctest.cpp:88

dslash_5_inv
void dslash_5_inv(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, double *kappa)
Definition: domain_wall_dslash_reference.cpp:706

quda::DiracParam::tmp1
ColorSpinorField * tmp1
Definition: dirac_quda.h:41

prec_str
const char * prec_str[]
Definition: dslash_ctest.cpp:82

MAX
#define MAX(a, b)
Definition: dslash_ctest.cpp:24

kappa5
double kappa5
Definition: dslash_ctest.cpp:31

quda::cpuColorSpinorField
Definition: color_spinor_field.h:865

QudaGaugeParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:47

quda::ColorSpinorField::V
void * V()
Definition: color_spinor_field.h:424

ydim
int ydim
Definition: test_util.cpp:1616

quda::Dirac
Definition: dirac_quda.h:106

QUDA_4D_PC
Definition: enum_quda.h:396

updateR
void updateR()
update the radius for halos.
Definition: interface_quda.cpp:674

gaugeSiteSize
#define gaugeSiteSize
Definition: face_gauge.cpp:34

newQudaGaugeParam
QudaGaugeParam newQudaGaugeParam(void)

quda_internal.h

quda::LatticeFieldParam::pad
int pad
Definition: lattice_field.h:69

QudaInvertParam_s::clover_coeff
double clover_coeff
Definition: quda.h:233

comm_barrier
void comm_barrier(void)
Definition: comm_mpi.cpp:326

spinorOut
cpuColorSpinorField * spinorOut
Definition: dslash_ctest.cpp:39

QUDA_MOBIUS_DWF_DSLASH
Definition: enum_quda.h:91

QudaTwistFlavorType
enum QudaTwistFlavorType_s QudaTwistFlavorType

dirac_4dpc
DiracDomainWall4DPC * dirac_4dpc
Definition: dslash_ctest.cpp:46

TEST_P
TEST_P(DslashTest, verify)
Definition: dslash_ctest.cpp:1043