v0.9.0/doc/dslash__test_8cpp_source.html

 #include <iostream>
 #include <stdio.h>
 #include <stdlib.h>
 #include <string.h>

 #include <quda.h>
 #include <quda_internal.h>
 #include <dirac_quda.h>
 #include <dslash_quda.h>
 #include <invert_quda.h>
 #include <util_quda.h>
 #include <blas_quda.h>

 #include <test_util.h>
 #include <dslash_util.h>
 #include <wilson_dslash_reference.h>
 #include <domain_wall_dslash_reference.h>
 #include "misc.h"

 #include <qio_field.h>
 // google test frame work
 #include <gtest.h>

 #define MAX(a,b) ((a)>(b)?(a):(b))

 using namespace quda;

 const QudaParity parity = QUDA_EVEN_PARITY; // even or odd?
 const int transfer = 0; // include transfer time in the benchmark?

 double kappa5;

 QudaPrecision cpu_prec = QUDA_DOUBLE_PRECISION;
 QudaPrecision cuda_prec;

 QudaGaugeParam gauge_param;
 QudaInvertParam inv_param;

 cpuColorSpinorField *spinor, *spinorOut, *spinorRef, *spinorTmp;
 cudaColorSpinorField *cudaSpinor, *cudaSpinorOut, *tmp1=0, *tmp2=0;

 void *hostGauge[4], *hostClover, *hostCloverInv;

 Dirac *dirac = NULL;
 DiracMobiusPC *dirac_mdwf = NULL; // create the MDWF Dirac operator
 DiracDomainWall4DPC *dirac_4dpc = NULL; // create the 4d preconditioned DWF Dirac operator

 // What test are we doing (0 = dslash, 1 = MatPC, 2 = Mat, 3 = MatPCDagMatPC, 4 = MatDagMat)
 extern int test_type;

 // Dirac operator type
 extern QudaDslashType dslash_type;

 // Twisted mass flavor type
 extern QudaTwistFlavorType twist_flavor;
 extern QudaMatPCType matpc_type;

 extern int device;
 extern int xdim;
 extern int ydim;
 extern int zdim;
 extern int tdim;
 extern int Lsdim;
 extern int gridsize_from_cmdline[];
 extern QudaReconstructType link_recon;
 extern QudaPrecision prec;
 extern QudaDagType dagger;
 QudaDagType not_dagger;

 extern bool compute_clover;
 extern double clover_coeff;

 extern bool verify_results;
 extern int niter;
 extern char latfile[];

 extern bool kernel_pack_t;

 extern double mass; // mass of Dirac operator
 extern double mu;

 QudaVerbosity verbosity = QUDA_VERBOSE;

 void init(int argc, char **argv) {

   cuda_prec = prec;

   gauge_param = newQudaGaugeParam();
   inv_param = newQudaInvertParam();

   gauge_param.X[0] = xdim;
   gauge_param.X[1] = ydim;
   gauge_param.X[2] = zdim;
   gauge_param.X[3] = tdim;

   if (dslash_type == QUDA_ASQTAD_DSLASH || dslash_type == QUDA_STAGGERED_DSLASH) {
     errorQuda("Asqtad not supported.  Please try staggered_dslash_test instead");
   } else if (dslash_type == QUDA_DOMAIN_WALL_DSLASH ||
              dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH ||
              dslash_type == QUDA_MOBIUS_DWF_DSLASH ) {
     // for these we always use kernel packing
     dw_setDims(gauge_param.X, Lsdim);
     setKernelPackT(true);
   } else {
     setDims(gauge_param.X);
     setKernelPackT(kernel_pack_t);
     Ls = 1;
   }

   setSpinorSiteSize(24);

   gauge_param.anisotropy = 1.0;

   gauge_param.type = QUDA_WILSON_LINKS;
   gauge_param.gauge_order = QUDA_QDP_GAUGE_ORDER;
   gauge_param.t_boundary = QUDA_ANTI_PERIODIC_T;

   gauge_param.cpu_prec = cpu_prec;
   gauge_param.cuda_prec = cuda_prec;
   gauge_param.reconstruct = link_recon;
   gauge_param.reconstruct_sloppy = link_recon;
   gauge_param.cuda_prec_sloppy = cuda_prec;
   gauge_param.gauge_fix = QUDA_GAUGE_FIXED_NO;

   inv_param.kappa = 0.1;

   if (dslash_type == QUDA_TWISTED_MASS_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     inv_param.epsilon = 0.1;
     inv_param.twist_flavor = twist_flavor;
   } else if (dslash_type == QUDA_DOMAIN_WALL_DSLASH ||
              dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH ) {
     inv_param.m5 = -1.5;
     kappa5 = 0.5/(5 + inv_param.m5);
   } else if (dslash_type == QUDA_MOBIUS_DWF_DSLASH ) {
     inv_param.m5 = -1.5;
     kappa5 = 0.5/(5 + inv_param.m5);
     for(int k = 0; k < Lsdim; k++)
     {
       // b5[k], c[k] values are chosen for arbitrary values,
       // but the difference of them are same as 1.0
       inv_param.b_5[k] = 1.50;
       inv_param.c_5[k] = 0.50;
     }
   }

   inv_param.mu = mu;
   inv_param.mass = mass;
   inv_param.Ls = (inv_param.twist_flavor != QUDA_TWIST_NONDEG_DOUBLET) ? Ls : 2;

   inv_param.solve_type = (test_type == 2 || test_type == 4) ? QUDA_DIRECT_SOLVE : QUDA_DIRECT_PC_SOLVE;
   inv_param.matpc_type = matpc_type;
   inv_param.dagger = dagger;
   not_dagger = (QudaDagType)((dagger + 1)%2);

   inv_param.cpu_prec = cpu_prec;
   if (inv_param.cpu_prec != gauge_param.cpu_prec) {
     errorQuda("Gauge and spinor CPU precisions must match");
   }
   inv_param.cuda_prec = cuda_prec;

   inv_param.input_location = QUDA_CPU_FIELD_LOCATION;
   inv_param.output_location = QUDA_CPU_FIELD_LOCATION;

 #ifndef MULTI_GPU // free parameter for single GPU
   gauge_param.ga_pad = 0;
 #else // must be this one c/b face for multi gpu
   int x_face_size = gauge_param.X[1]*gauge_param.X[2]*gauge_param.X[3]/2;
   int y_face_size = gauge_param.X[0]*gauge_param.X[2]*gauge_param.X[3]/2;
   int z_face_size = gauge_param.X[0]*gauge_param.X[1]*gauge_param.X[3]/2;
   int t_face_size = gauge_param.X[0]*gauge_param.X[1]*gauge_param.X[2]/2;
   int pad_size =MAX(x_face_size, y_face_size);
   pad_size = MAX(pad_size, z_face_size);
   pad_size = MAX(pad_size, t_face_size);
   gauge_param.ga_pad = pad_size;
 #endif
   inv_param.sp_pad = 0;
   inv_param.cl_pad = 0;

   //inv_param.sp_pad = xdim*ydim*zdim/2;
   //inv_param.cl_pad = 24*24*24;

   inv_param.gamma_basis = QUDA_DEGRAND_ROSSI_GAMMA_BASIS; // test code only supports DeGrand-Rossi Basis
   inv_param.dirac_order = QUDA_DIRAC_ORDER;

   if(dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH){
     switch(test_type) {
       case 0:
       case 1:
       case 2:
       case 3:
         inv_param.solution_type = QUDA_MATPC_SOLUTION;
         break;
       case 4:
         inv_param.solution_type = QUDA_MATPCDAG_MATPC_SOLUTION;
         break;
       default:
         errorQuda("Test type %d not defined QUDA_DOMAIN_WALL_4D_DSLASH\n", test_type);
     }
   } else if(dslash_type == QUDA_MOBIUS_DWF_DSLASH) {
     switch(test_type) {
       case 0:
       case 1:
       case 2:
       case 3:
       case 4:
         inv_param.solution_type = QUDA_MATPC_SOLUTION;
         break;
       case 5:
         inv_param.solution_type = QUDA_MATPCDAG_MATPC_SOLUTION;
         break;
       default:
         errorQuda("Test type %d not defined on QUDA_MOBIUS_DWF_DSLASH\n", test_type);
     }
   }
   else
   {
     switch(test_type) {
       case 0:
       case 1:
         inv_param.solution_type = QUDA_MATPC_SOLUTION;
         break;
       case 2:
         inv_param.solution_type = QUDA_MAT_SOLUTION;
         break;
       case 3:
         inv_param.solution_type = QUDA_MATPCDAG_MATPC_SOLUTION;
         break;
       case 4:
         inv_param.solution_type = QUDA_MATDAG_MAT_SOLUTION;
         break;
       default:
         errorQuda("Test type %d not defined\n", test_type);
     }
   }

   inv_param.dslash_type = dslash_type;

   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     inv_param.clover_cpu_prec = cpu_prec;
     inv_param.clover_cuda_prec = cuda_prec;
     inv_param.clover_cuda_prec_sloppy = inv_param.clover_cuda_prec;
     inv_param.clover_cuda_prec_precondition = inv_param.clover_cuda_prec_sloppy;
     inv_param.clover_order = QUDA_PACKED_CLOVER_ORDER;
     inv_param.clover_coeff = clover_coeff;
     hostClover = malloc((size_t)V*cloverSiteSize*inv_param.clover_cpu_prec);
     hostCloverInv = malloc((size_t)V*cloverSiteSize*inv_param.clover_cpu_prec);
   }

   // construct input fields
   for (int dir = 0; dir < 4; dir++) hostGauge[dir] = malloc((size_t)V*gaugeSiteSize*gauge_param.cpu_prec);

   ColorSpinorParam csParam;

   csParam.nColor = 3;
   csParam.nSpin = 4;
   csParam.nDim = 4;
   for (int d=0; d<4; d++) csParam.x[d] = gauge_param.X[d];
   if (dslash_type == QUDA_DOMAIN_WALL_DSLASH ||
       dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH ||
       dslash_type == QUDA_MOBIUS_DWF_DSLASH ) {
     csParam.nDim = 5;
     csParam.x[4] = Ls;
   }
   if (dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH ||
       dslash_type == QUDA_MOBIUS_DWF_DSLASH ) {
     csParam.PCtype = QUDA_4D_PC;
   } else {
     csParam.PCtype = QUDA_5D_PC;
   }

 //ndeg_tm
   if (dslash_type == QUDA_TWISTED_MASS_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     csParam.twistFlavor = inv_param.twist_flavor;
     csParam.nDim = (inv_param.twist_flavor == QUDA_TWIST_SINGLET) ? 4 : 5;
     csParam.x[4] = inv_param.Ls;
   }


   csParam.precision = inv_param.cpu_prec;
   csParam.pad = 0;

   if(dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH || dslash_type == QUDA_MOBIUS_DWF_DSLASH) {
     csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;
     csParam.x[0] /= 2;
   } else {
     if (test_type < 2 || test_type == 3) {
       csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;
       csParam.x[0] /= 2;
     } else {
       csParam.siteSubset = QUDA_FULL_SITE_SUBSET;
     }
   }

   csParam.siteOrder = QUDA_EVEN_ODD_SITE_ORDER;
   csParam.fieldOrder = QUDA_SPACE_SPIN_COLOR_FIELD_ORDER;
   csParam.gammaBasis = inv_param.gamma_basis;
   csParam.create = QUDA_ZERO_FIELD_CREATE;

   spinor = new cpuColorSpinorField(csParam);
   spinorOut = new cpuColorSpinorField(csParam);
   spinorRef = new cpuColorSpinorField(csParam);
   spinorTmp = new cpuColorSpinorField(csParam);

   csParam.x[0] = gauge_param.X[0];

   printfQuda("Randomizing fields... ");

   if (strcmp(latfile,"")) {  // load in the command line supplied gauge field
     read_gauge_field(latfile, hostGauge, gauge_param.cpu_prec, gauge_param.X, argc, argv);
     construct_gauge_field(hostGauge, 2, gauge_param.cpu_prec, &gauge_param);
   } else { // else generate a random SU(3) field
     construct_gauge_field(hostGauge, 1, gauge_param.cpu_prec, &gauge_param);
   }

   spinor->Source(QUDA_RANDOM_SOURCE, 0);

   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     double norm = 0.1; // clover components are random numbers in the range (-norm, norm)
     double diag = 1.0; // constant added to the diagonal
     construct_clover_field(hostClover, norm, diag, inv_param.clover_cpu_prec);
     memcpy(hostCloverInv, hostClover, (size_t)V*cloverSiteSize*inv_param.clover_cpu_prec);
   }

   printfQuda("done.\n"); fflush(stdout);

   initQuda(device);

   // set verbosity prior to loadGaugeQuda
   setVerbosity(verbosity);
   inv_param.verbosity = verbosity;

   printfQuda("Sending gauge field to GPU\n");
   loadGaugeQuda(hostGauge, &gauge_param);

   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     if (compute_clover) printfQuda("Computing clover field on GPU\n");
     else printfQuda("Sending clover field to GPU\n");
     inv_param.compute_clover = compute_clover;
     inv_param.return_clover = compute_clover;
     inv_param.compute_clover_inverse = compute_clover;
     inv_param.return_clover_inverse = compute_clover;

     if (dslash_type == QUDA_TWISTED_CLOVER_DSLASH) inv_param.return_clover_inverse = true;

     loadCloverQuda(hostClover, hostCloverInv, &inv_param);
   }

   if (!transfer) {
     csParam.gammaBasis = QUDA_UKQCD_GAMMA_BASIS;
     csParam.pad = inv_param.sp_pad;
     csParam.precision = inv_param.cuda_prec;
     if (csParam.precision == QUDA_DOUBLE_PRECISION ) {
       csParam.fieldOrder = QUDA_FLOAT2_FIELD_ORDER;
     } else {
       /* Single and half */
       csParam.fieldOrder = QUDA_FLOAT4_FIELD_ORDER;
     }

     if(dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH ||
         dslash_type == QUDA_MOBIUS_DWF_DSLASH)
     {
       csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;
       csParam.x[0] /= 2;
     } else
     {
       if (test_type < 2 || test_type == 3) {
         csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;
         csParam.x[0] /= 2;
       }
     }

     printfQuda("Creating cudaSpinor\n");
     cudaSpinor = new cudaColorSpinorField(csParam);
     printfQuda("Creating cudaSpinorOut\n");
     cudaSpinorOut = new cudaColorSpinorField(csParam);

     tmp1 = new cudaColorSpinorField(csParam);

     if(dslash_type != QUDA_DOMAIN_WALL_4D_DSLASH &&
         dslash_type != QUDA_MOBIUS_DWF_DSLASH)
       if (test_type == 2 || test_type == 4) csParam.x[0] /= 2;

     csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;
     tmp2 = new cudaColorSpinorField(csParam);

     printfQuda("Sending spinor field to GPU\n");
     *cudaSpinor = *spinor;

     double cpu_norm = blas::norm2(*spinor);
     double cuda_norm = blas::norm2(*cudaSpinor);
     printfQuda("Source: CPU = %e, CUDA = %e\n", cpu_norm, cuda_norm);

     bool pc;
     if(dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH ||
        dslash_type == QUDA_MOBIUS_DWF_DSLASH)
       pc = true;
     else
       pc = (test_type != 2 && test_type != 4);
     DiracParam diracParam;
     setDiracParam(diracParam, &inv_param, pc);
     diracParam.tmp1 = tmp1;
     diracParam.tmp2 = tmp2;

     if (dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH){
       dirac_4dpc = new DiracDomainWall4DPC(diracParam);
       dirac = (Dirac*)dirac_4dpc;
     }
     else if (dslash_type == QUDA_MOBIUS_DWF_DSLASH){
       dirac_mdwf = new DiracMobiusPC(diracParam);
       dirac = (Dirac*)dirac_mdwf;
     }
     else {
       dirac = Dirac::create(diracParam);
     }
   } else {
     double cpu_norm = blas::norm2(*spinor);
     printfQuda("Source: CPU = %e\n", cpu_norm);
   }

 }

 void end() {
   if (!transfer) {
     if(dirac != NULL)
     {
       delete dirac;
       dirac = NULL;
     }
     delete cudaSpinor;
     delete cudaSpinorOut;
     delete tmp1;
     delete tmp2;
   }

   // release memory
   delete spinor;
   delete spinorOut;
   delete spinorRef;
   delete spinorTmp;

   for (int dir = 0; dir < 4; dir++) free(hostGauge[dir]);
   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     free(hostClover);
     free(hostCloverInv);
   }
   endQuda();

 }

 struct DslashTime {
   double event_time;
   double cpu_time;
   double cpu_min;
   double cpu_max;

   DslashTime() : event_time(0.0), cpu_time(0.0), cpu_min(DBL_MAX), cpu_max(0.0) {}
 };

 // execute kernel
 DslashTime dslashCUDA(int niter) {

   DslashTime dslash_time;
   timeval tstart, tstop;

   cudaEvent_t start, end;
   cudaEventCreate(&start);
   cudaEventCreate(&end);

   comm_barrier();
   cudaEventRecord(start, 0);

   for (int i = 0; i < niter; i++) {

     gettimeofday(&tstart, NULL);

     if (dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH){
       switch (test_type) {
         case 0:
           if (transfer) {
             dslashQuda_4dpc(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);
           } else {
             dirac_4dpc->Dslash4(*cudaSpinorOut, *cudaSpinor, parity);
           }
           break;
         case 1:
           if (transfer) {
             dslashQuda_4dpc(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);
           } else {
             dirac_4dpc->Dslash5(*cudaSpinorOut, *cudaSpinor, parity);
           }
           break;
         case 2:
           if (transfer) {
             dslashQuda_4dpc(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);
           } else {
             dirac_4dpc->Dslash5inv(*cudaSpinorOut, *cudaSpinor, parity, kappa5);
           }
           break;
         case 3:
           if (transfer) {
             MatQuda(spinorOut->V(), spinor->V(), &inv_param);
           } else {
             dirac_4dpc->M(*cudaSpinorOut, *cudaSpinor);
           }
           break;
         case 4:
           if (transfer) {
             MatDagMatQuda(spinorOut->V(), spinor->V(), &inv_param);
           } else {
             dirac_4dpc->MdagM(*cudaSpinorOut, *cudaSpinor);
           }
           break;
       }
     }
     else if (dslash_type == QUDA_MOBIUS_DWF_DSLASH){
       switch (test_type) {
         case 0:
           if (transfer) {
             dslashQuda_mdwf(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);
           } else {
             dirac_mdwf->Dslash4(*cudaSpinorOut, *cudaSpinor, parity);
           }
           break;
         case 1:
           if (transfer) {
             dslashQuda_mdwf(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);
           } else {
             dirac_mdwf->Dslash5(*cudaSpinorOut, *cudaSpinor, parity);
           }
           break;
         case 2:
           if (transfer) {
             dslashQuda_mdwf(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);
           } else {
             dirac_mdwf->Dslash4pre(*cudaSpinorOut, *cudaSpinor, parity);
           }
           break;
         case 3:
           if (transfer) {
             dslashQuda_mdwf(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);
           } else {
             dirac_mdwf->Dslash5inv(*cudaSpinorOut, *cudaSpinor, parity);
           }
           break;
         case 4:
           if (transfer) {
             MatQuda(spinorOut->V(), spinor->V(), &inv_param);
           } else {
             dirac_mdwf->M(*cudaSpinorOut, *cudaSpinor);
           }
           break;
         case 5:
           if (transfer) {
             MatDagMatQuda(spinorOut->V(), spinor->V(), &inv_param);
           } else {
             dirac_mdwf->MdagM(*cudaSpinorOut, *cudaSpinor);
           }
           break;
       }
     } else {
       switch (test_type) {
         case 0:
           if (dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
             if (transfer) {
               dslashQuda(spinorOut->V(), spinor->V(), &inv_param, parity);
             } else {
         if (dagger) {
           ((DiracTwistedCloverPC *) dirac)->TwistCloverInv(*tmp1, *cudaSpinor, (parity+1)%2);
                 dirac->Dslash(*cudaSpinorOut, *tmp1, parity);
         } else {
                 dirac->Dslash(*cudaSpinorOut, *cudaSpinor, parity);
         }
             }
           } else {
             if (transfer) {
               dslashQuda(spinorOut->V(), spinor->V(), &inv_param, parity);
             } else {
               dirac->Dslash(*cudaSpinorOut, *cudaSpinor, parity);
             }
           }
           break;
         case 1:
           if (transfer) {
             MatQuda(spinorOut->V(), spinor->V(), &inv_param);
           } else {
             dirac->M(*cudaSpinorOut, *cudaSpinor);
           }
           break;
         case 2:
           if (transfer) {
             MatQuda(spinorOut->V(), spinor->V(), &inv_param);
           } else {
             dirac->M(*cudaSpinorOut, *cudaSpinor);
           }
           break;
         case 3:
           if (transfer) {
             MatDagMatQuda(spinorOut->V(), spinor->V(), &inv_param);
           } else {
             dirac->MdagM(*cudaSpinorOut, *cudaSpinor);
           }
           break;
         case 4:
           if (transfer) {
             MatDagMatQuda(spinorOut->V(), spinor->V(), &inv_param);
           } else {
             dirac->MdagM(*cudaSpinorOut, *cudaSpinor);
           }
           break;
       }
     }

     gettimeofday(&tstop, NULL);
     long ds = tstop.tv_sec - tstart.tv_sec;
     long dus = tstop.tv_usec - tstart.tv_usec;
     double elapsed = ds + 0.000001*dus;

     dslash_time.cpu_time += elapsed;
     // skip first and last iterations since they may skew these metrics if comms are not synchronous
     if (i>0 && i<niter) {
       if (elapsed < dslash_time.cpu_min) dslash_time.cpu_min = elapsed;
       if (elapsed > dslash_time.cpu_max) dslash_time.cpu_max = elapsed;
     }
   }

   cudaEventRecord(end, 0);
   cudaEventSynchronize(end);
   float runTime;
   cudaEventElapsedTime(&runTime, start, end);
   cudaEventDestroy(start);
   cudaEventDestroy(end);

   dslash_time.event_time = runTime / 1000;

   // check for errors
   cudaError_t stat = cudaGetLastError();
   if (stat != cudaSuccess)
     printfQuda("with ERROR: %s\n", cudaGetErrorString(stat));

   return dslash_time;
 }

 void dslashRef() {

   // compare to dslash reference implementation
   printfQuda("Calculating reference implementation...");
   fflush(stdout);

   if (dslash_type == QUDA_WILSON_DSLASH) {
     switch (test_type) {
     case 0:
       wil_dslash(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, inv_param.cpu_prec, gauge_param);
       break;
     case 1:
       wil_matpc(spinorRef->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.matpc_type, dagger,
     inv_param.cpu_prec, gauge_param);
       break;
     case 2:
       wil_mat(spinorRef->V(), hostGauge, spinor->V(), inv_param.kappa, dagger, inv_param.cpu_prec, gauge_param);
       break;
     case 3:
       wil_matpc(spinorTmp->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.matpc_type, dagger,
     inv_param.cpu_prec, gauge_param);
       wil_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), inv_param.kappa, inv_param.matpc_type, not_dagger,
     inv_param.cpu_prec, gauge_param);
       break;
     case 4:
       wil_mat(spinorTmp->V(), hostGauge, spinor->V(), inv_param.kappa, dagger, inv_param.cpu_prec, gauge_param);
       wil_mat(spinorRef->V(), hostGauge, spinorTmp->V(), inv_param.kappa, not_dagger, inv_param.cpu_prec, gauge_param);
       break;
     default:
       printfQuda("Test type not defined\n");
       exit(-1);
     }
   } else if (dslash_type == QUDA_CLOVER_WILSON_DSLASH) {
     switch (test_type) {
     case 0:
       clover_dslash(spinorRef->V(), hostGauge, hostCloverInv, spinor->V(), parity, dagger, inv_param.cpu_prec, gauge_param);
       break;
     case 1:
       clover_matpc(spinorRef->V(), hostGauge, hostClover, hostCloverInv, spinor->V(), inv_param.kappa, inv_param.matpc_type,
        dagger, inv_param.cpu_prec, gauge_param);
       break;
     case 2:
       clover_mat(spinorRef->V(), hostGauge, hostClover, spinor->V(), inv_param.kappa, dagger, inv_param.cpu_prec, gauge_param);
       break;
     case 3:
       clover_matpc(spinorTmp->V(), hostGauge, hostClover, hostCloverInv, spinor->V(), inv_param.kappa, inv_param.matpc_type,
        dagger, inv_param.cpu_prec, gauge_param);
       clover_matpc(spinorRef->V(), hostGauge, hostClover, hostCloverInv, spinorTmp->V(), inv_param.kappa, inv_param.matpc_type,
        not_dagger, inv_param.cpu_prec, gauge_param);
       break;
     case 4:
       clover_mat(spinorTmp->V(), hostGauge, hostClover, spinor->V(), inv_param.kappa, dagger, inv_param.cpu_prec, gauge_param);
       clover_mat(spinorRef->V(), hostGauge, hostClover, spinorTmp->V(), inv_param.kappa, not_dagger,
      inv_param.cpu_prec, gauge_param);
       break;
     default:
       printfQuda("Test type not defined\n");
       exit(-1);
     }
   } else if (dslash_type == QUDA_TWISTED_MASS_DSLASH) {
     switch (test_type) {
     case 0:
       if(inv_param.twist_flavor == QUDA_TWIST_SINGLET)
   tm_dslash(spinorRef->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor, parity, inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
       else
       {
         int tm_offset = 12*spinorRef->Volume();

   void *ref1 = spinorRef->V();
   void *ref2 = (char*)ref1 + tm_offset*cpu_prec;

   void *flv1 = spinor->V();
   void *flv2 = (char*)flv1 + tm_offset*cpu_prec;

   tm_ndeg_dslash(ref1, ref2, hostGauge, flv1, flv2, inv_param.kappa, inv_param.mu, inv_param.epsilon,
                  parity, dagger, inv_param.matpc_type, inv_param.cpu_prec, gauge_param);
       }
       break;
     case 1:
       if(inv_param.twist_flavor == QUDA_TWIST_SINGLET)
   tm_matpc(spinorRef->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor, inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
       else
       {
         int tm_offset = 12*spinorRef->Volume();

   void *ref1 = spinorRef->V();
   void *ref2 = (char*)ref1 + tm_offset*cpu_prec;

   void *flv1 = spinor->V();
   void *flv2 = (char*)flv1 + tm_offset*cpu_prec;

   tm_ndeg_matpc(ref1, ref2, hostGauge, flv1, flv2, inv_param.kappa, inv_param.mu, inv_param.epsilon, inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
       }
       break;
     case 2:
       if(inv_param.twist_flavor == QUDA_TWIST_SINGLET)
   tm_mat(spinorRef->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor, dagger, inv_param.cpu_prec, gauge_param);
       else
       {
         int tm_offset = 12*spinorRef->Volume();

   void *evenOut = spinorRef->V();
   void *oddOut  = (char*)evenOut + tm_offset*cpu_prec;

   void *evenIn = spinor->V();
   void *oddIn  = (char*)evenIn + tm_offset*cpu_prec;

   tm_ndeg_mat(evenOut, oddOut, hostGauge, evenIn, oddIn, inv_param.kappa, inv_param.mu, inv_param.epsilon, dagger, inv_param.cpu_prec, gauge_param);
       }
       break;
     case 3:
       if(inv_param.twist_flavor == QUDA_TWIST_SINGLET) {
   tm_matpc(spinorTmp->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
          inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
   tm_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
          inv_param.matpc_type, not_dagger, inv_param.cpu_prec, gauge_param);
       }
       else
       {
   int tm_offset = 12*spinorRef->Volume();

   void *ref1 = spinorRef->V();
   void *ref2 = (char*)ref1 + tm_offset*cpu_prec;

   void *flv1 = spinor->V();
   void *flv2 = (char*)flv1 + tm_offset*cpu_prec;

   void *tmp1 = spinorTmp->V();
   void *tmp2 = (char*)tmp1 + tm_offset*cpu_prec;

   tm_ndeg_matpc(tmp1, tmp2, hostGauge, flv1, flv2, inv_param.kappa, inv_param.mu, inv_param.epsilon, inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
   tm_ndeg_matpc(ref1, ref2, hostGauge, tmp1, tmp2, inv_param.kappa, inv_param.mu, inv_param.epsilon, inv_param.matpc_type, not_dagger, inv_param.cpu_prec, gauge_param);
       }
       break;
     case 4:
       if(inv_param.twist_flavor == QUDA_TWIST_SINGLET) {
   tm_mat(spinorTmp->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
        dagger, inv_param.cpu_prec, gauge_param);
   tm_mat(spinorRef->V(), hostGauge, spinorTmp->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
        not_dagger, inv_param.cpu_prec, gauge_param);
       }
       else
       {
   int tm_offset = 12*spinorRef->Volume();

   void *evenOut = spinorRef->V();
   void *oddOut  = (char*)evenOut + tm_offset*cpu_prec;

   void *evenIn = spinor->V();
   void *oddIn  = (char*)evenIn + tm_offset*cpu_prec;

   void *evenTmp = spinorTmp->V();
   void *oddTmp = (char*)evenTmp + tm_offset*cpu_prec;

   tm_ndeg_mat(evenTmp, oddTmp, hostGauge, evenIn, oddIn, inv_param.kappa, inv_param.mu, inv_param.epsilon, dagger, inv_param.cpu_prec, gauge_param);
   tm_ndeg_mat(evenOut, oddOut, hostGauge, evenTmp, oddTmp, inv_param.kappa, inv_param.mu, inv_param.epsilon, not_dagger, inv_param.cpu_prec, gauge_param);
       }
       break;
     default:
       printfQuda("Test type not defined\n");
       exit(-1);
     }
   } else if (dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     switch (test_type) {
     case 0:
       if(inv_param.twist_flavor == QUDA_TWIST_SINGLET)
   tmc_dslash(spinorRef->V(), hostGauge, spinor->V(), hostClover, hostCloverInv, inv_param.kappa, inv_param.mu, inv_param.twist_flavor, parity, inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
       else
         errorQuda("Not supported\n");
       break;
     case 1:
       if(inv_param.twist_flavor == QUDA_TWIST_SINGLET)
   tmc_matpc(spinorRef->V(), hostGauge, spinor->V(), hostClover, hostCloverInv, inv_param.kappa, inv_param.mu, inv_param.twist_flavor, inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
       else
         errorQuda("Not supported\n");
       break;
     case 2:
       if(inv_param.twist_flavor == QUDA_TWIST_SINGLET)
   tmc_mat(spinorRef->V(), hostGauge, hostClover, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor, dagger, inv_param.cpu_prec, gauge_param);
       else
         errorQuda("Not supported\n");
       break;
     case 3:
       if(inv_param.twist_flavor == QUDA_TWIST_SINGLET) {
   tmc_matpc(spinorTmp->V(), hostGauge, spinor->V(), hostClover, hostCloverInv, inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
          inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);
   tmc_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), hostClover, hostCloverInv, inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
          inv_param.matpc_type, not_dagger, inv_param.cpu_prec, gauge_param);
       } else
         errorQuda("Not supported\n");
       break;
     case 4:
       if(inv_param.twist_flavor == QUDA_TWIST_SINGLET) {
   tmc_mat(spinorTmp->V(), hostGauge, hostClover, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor, dagger, inv_param.cpu_prec, gauge_param);
   tmc_mat(spinorRef->V(), hostGauge, hostClover, spinorTmp->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor, not_dagger, inv_param.cpu_prec, gauge_param);
       } else
         errorQuda("Not supported\n");
       break;
     default:
       printfQuda("Test type not defined\n");
       exit(-1);
     }
   } else if (dslash_type == QUDA_DOMAIN_WALL_DSLASH ){
     switch (test_type) {
     case 0:
       dw_dslash(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
       break;
     case 1:
       dw_matpc(spinorRef->V(), hostGauge, spinor->V(), kappa5, inv_param.matpc_type, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
       break;
     case 2:
       dw_mat(spinorRef->V(), hostGauge, spinor->V(), kappa5, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
       break;
     case 3:
       dw_matpc(spinorTmp->V(), hostGauge, spinor->V(), kappa5, inv_param.matpc_type, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
       dw_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), kappa5, inv_param.matpc_type, not_dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
       break;
     case 4:
       dw_matdagmat(spinorRef->V(), hostGauge, spinor->V(), kappa5, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
     break;
     default:
       printf("Test type not supported for domain wall\n");
       exit(-1);
     }
   } else if (dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH){
     double *kappa_5 = (double*)malloc(Ls*sizeof(double));
     for(int xs = 0; xs < Ls ; xs++)
       kappa_5[xs] = kappa5;
     switch (test_type) {
     case 0:
       dslash_4_4d(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
       break;
     case 1:
       dw_dslash_5_4d(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, true);
       break;
     case 2:
       dslash_5_inv(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, kappa_5);
       break;
     case 3:
       dw_4d_matpc(spinorRef->V(), hostGauge, spinor->V(), kappa5, inv_param.matpc_type, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
       break;
     case 4:
       dw_4d_matpc(spinorTmp->V(), hostGauge, spinor->V(), kappa5, inv_param.matpc_type, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
       dw_4d_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), kappa5, inv_param.matpc_type, not_dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
       break;
     break;
     default:
       printf("Test type not supported for domain wall\n");
       exit(-1);
     }
     free(kappa_5);
   } else if (dslash_type == QUDA_MOBIUS_DWF_DSLASH){
     double *kappa_b, *kappa_c, *kappa_5, *kappa_mdwf;
     kappa_b = (double*)malloc(Lsdim*sizeof(double));
     kappa_c = (double*)malloc(Lsdim*sizeof(double));
     kappa_5 = (double*)malloc(Lsdim*sizeof(double));
     kappa_mdwf = (double*)malloc(Lsdim*sizeof(double));
     for(int xs = 0 ; xs < Lsdim ; xs++)
     {
       kappa_b[xs] = 1.0/(2*(inv_param.b_5[xs]*(4.0 + inv_param.m5) + 1.0));
       kappa_c[xs] = 1.0/(2*(inv_param.c_5[xs]*(4.0 + inv_param.m5) - 1.0));
       kappa_5[xs] = 0.5*kappa_b[xs]/kappa_c[xs];
       kappa_mdwf[xs] = -kappa_5[xs];
     }
     switch (test_type) {
     case 0:
       dslash_4_4d(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);
       break;
     case 1:
       mdw_dslash_5(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, kappa_5, true);
       break;
     case 2:
       mdw_dslash_4_pre(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, inv_param.b_5, inv_param.c_5, true);
       break;
     case 3:
       dslash_5_inv(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, kappa_mdwf);
       break;
     case 4:
       mdw_matpc(spinorRef->V(), hostGauge, spinor->V(), kappa_b, kappa_c, inv_param.matpc_type, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, inv_param.b_5, inv_param.c_5);
       break;
     case 5:
       mdw_matpc(spinorTmp->V(), hostGauge, spinor->V(), kappa_b, kappa_c, inv_param.matpc_type, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, inv_param.b_5, inv_param.c_5);
       mdw_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), kappa_b, kappa_c, inv_param.matpc_type, not_dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, inv_param.b_5, inv_param.c_5);
       break;
     break;
     default:
       printf("Test type not supported for domain wall\n");
       exit(-1);
     }
     free(kappa_b);
     free(kappa_c);
     free(kappa_5);
     free(kappa_mdwf);
   } else {
     printfQuda("Unsupported dslash_type\n");
     exit(-1);
   }

   printfQuda("done.\n");
 }


 void display_test_info()
 {
   printfQuda("running the following test:\n");

   printfQuda("prec    recon   test_type     matpc_type   dagger   S_dim         T_dimension   Ls_dimension dslash_type    niter\n");
   printfQuda("%6s   %2s       %d           %12s    %d    %3d/%3d/%3d        %3d             %2d   %14s   %d\n",
        get_prec_str(prec), get_recon_str(link_recon),
        test_type, get_matpc_str(matpc_type), dagger, xdim, ydim, zdim, tdim, Lsdim,
        get_dslash_str(dslash_type), niter);
   printfQuda("Grid partition info:     X  Y  Z  T\n");
   printfQuda("                         %d  %d  %d  %d\n",
        dimPartitioned(0),
        dimPartitioned(1),
        dimPartitioned(2),
        dimPartitioned(3));

   return ;

 }

 extern void usage(char**);

 TEST(dslash, verify) {
   double deviation = pow(10, -(double)(cpuColorSpinorField::Compare(*spinorRef, *spinorOut)));
   double tol = (inv_param.cuda_prec == QUDA_DOUBLE_PRECISION ? 1e-12 :
     (inv_param.cuda_prec == QUDA_SINGLE_PRECISION ? 1e-3 : 1e-1));
   ASSERT_LE(deviation, tol) << "CPU and CUDA implementations do not agree";
 }

 int main(int argc, char **argv)
 {
   // initalize google test, includes command line options
   ::testing::InitGoogleTest(&argc, argv);
   // return code for google test
   int test_rc = 0;
   for (int i =1;i < argc; i++) {
     if(process_command_line_option(argc, argv, &i) == 0){
       continue;
     }

     fprintf(stderr, "ERROR: Invalid option:%s\n", argv[i]);
     usage(argv);
   }

   initComms(argc, argv, gridsize_from_cmdline);

   display_test_info();

   init(argc, argv);

   float spinorGiB = (float)Vh*spinorSiteSize*inv_param.cuda_prec / (1 << 30);
   printfQuda("\nSpinor mem: %.3f GiB\n", spinorGiB);
   printfQuda("Gauge mem: %.3f GiB\n", gauge_param.gaugeGiB);

   int attempts = 1;
   dslashRef();
   for (int i=0; i<attempts; i++) {

     {
       printfQuda("Tuning...\n");
       dslashCUDA(1); // warm-up run
     }
     printfQuda("Executing %d kernel loops...\n", niter);
     if (!transfer) dirac->Flops();
     DslashTime dslash_time = dslashCUDA(niter);
     printfQuda("done.\n\n");

     if (!transfer) *spinorOut = *cudaSpinorOut;

     // print timing information
     printfQuda("%fus per kernel call\n", 1e6*dslash_time.event_time / niter);
     //FIXME No flops count for twisted-clover yet
     unsigned long long flops = 0;
     if (!transfer) flops = dirac->Flops();
     printfQuda("GFLOPS = %f\n", 1.0e-9*flops/dslash_time.event_time);

     printfQuda("Effective halo bi-directional bandwidth (GB/s) GPU = %f ( CPU = %f, min = %f , max = %f ) for aggregate message size %lu bytes\n",
          1.0e-9*2*cudaSpinor->GhostBytes()*niter/dslash_time.event_time, 1.0e-9*2*cudaSpinor->GhostBytes()*niter/dslash_time.cpu_time,
          1.0e-9*2*cudaSpinor->GhostBytes()/dslash_time.cpu_max, 1.0e-9*2*cudaSpinor->GhostBytes()/dslash_time.cpu_min,
          2*cudaSpinor->GhostBytes());

     double norm2_cpu = blas::norm2(*spinorRef);
     double norm2_cpu_cuda= blas::norm2(*spinorOut);
     if (!transfer) {
       double norm2_cuda= blas::norm2(*cudaSpinorOut);
       printfQuda("Results: CPU = %f, CUDA=%f, CPU-CUDA = %f\n", norm2_cpu, norm2_cuda, norm2_cpu_cuda);
     } else {
       printfQuda("Result: CPU = %f, CPU-QUDA = %f\n",  norm2_cpu, norm2_cpu_cuda);
     }

     if (verify_results) {
       test_rc = RUN_ALL_TESTS();
       if (test_rc != 0) warningQuda("Tests failed");
     }
   }
   end();

   finalizeComms();
   return test_rc;
 }
gauge_param
QudaGaugeParam gauge_param
Definition: dslash_test.cpp:36

cudaSpinorOut
cudaColorSpinorField * cudaSpinorOut
Definition: dslash_test.cpp:40

invert_quda.h

dimPartitioned
int dimPartitioned(int dim)
Definition: test_util.cpp:1686

QudaInvertParam_s::dirac_order
QudaDiracFieldOrder dirac_order
Definition: quda.h:195

QUDA_VERBOSE
Definition: enum_quda.h:237

QudaGaugeParam_s::reconstruct_sloppy
QudaReconstructType reconstruct_sloppy
Definition: quda.h:46

QudaGaugeParam_s::anisotropy
double anisotropy
Definition: quda.h:31

tdim
int tdim
Definition: test_util.cpp:1623

quda::DiracTwistedCloverPC
Definition: dirac_quda.h:596

QudaInvertParam_s::b_5
double b_5[QUDA_MAX_DWF_LS]
Definition: quda.h:102

QUDA_MAT_SOLUTION
Definition: enum_quda.h:130

dw_4d_matpc
void dw_4d_matpc(void *out, void **gauge, void *in, double kappa, QudaMatPCType matpc_type, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:767

QUDA_PACKED_CLOVER_ORDER
Definition: enum_quda.h:228

dw_dslash_5_4d
void dw_dslash_5_4d(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, bool zero_initialize)
Definition: domain_wall_dslash_reference.cpp:616

endQuda
void endQuda(void)
Definition: interface_quda.cpp:1290

free
void free(void *)

quda::ColorSpinorParam::PCtype
QudaDWFPCType PCtype
Definition: color_spinor_field.h:96

construct_gauge_field
void construct_gauge_field(void **gauge, int type, QudaPrecision precision, QudaGaugeParam *param)
Definition: test_util.cpp:1054

spinorRef
cpuColorSpinorField * spinorRef
Definition: dslash_test.cpp:39

QudaInvertParam_s::solve_type
QudaSolveType solve_type
Definition: quda.h:182

QUDA_4D_PC
Definition: enum_quda.h:362

QudaPrecision
enum QudaPrecision_s QudaPrecision

quda::DiracDomainWall4DPC::Dslash5
void Dslash5(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Definition: dirac_domain_wall_4d.cpp:40

quda::DiracMobius::Dslash5
void Dslash5(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Definition: dirac_mobius.cpp:61

QudaGaugeParam_s::ga_pad
int ga_pad
Definition: quda.h:53

misc.h

dw_setDims
void dw_setDims(int *X, const int L5)
Definition: test_util.cpp:167

spinorTmp
cpuColorSpinorField * spinorTmp
Definition: dslash_test.cpp:39

QudaInvertParam_s::mu
double mu
Definition: quda.h:105

QudaGaugeParam_s::gauge_fix
QudaGaugeFixed gauge_fix
Definition: quda.h:51

quda::norm
__host__ __device__ ValueType norm(const complex< ValueType > &z)
Returns the magnitude of z squared.
Definition: complex_quda.h:896

tm_mat
void tm_mat(void *out, void **gauge, void *in, double kappa, double mu, QudaTwistFlavorType flavor, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:311

tm_dslash
void tm_dslash(void *res, void **gaugeFull, void *spinorField, double kappa, double mu, QudaTwistFlavorType flavor, int oddBit, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:277

quda::ColorSpinorParam::nColor
int nColor
Definition: color_spinor_field.h:85

timeval::tv_sec
__darwin_time_t tv_sec
Definition: CMakeCUDACompilerId.cpp1.ii:4833

QUDA_ASQTAD_DSLASH
Definition: enum_quda.h:92

QudaGaugeParam_s::type
QudaLinkType type
Definition: quda.h:35

fflush
int fflush(FILE *)

QudaInvertParam_s::kappa
double kappa
Definition: quda.h:97

MatDagMatQuda
void MatDagMatQuda(void *h_out, void *h_in, QudaInvertParam *inv_param)
Definition: interface_quda.cpp:1923

xdim
int xdim
Definition: test_util.cpp:1620

errorQuda
#define errorQuda(...)
Definition: util_quda.h:90

quda::blas::norm2
double norm2(const ColorSpinorField &a)
Definition: reduce_quda.cu:241

QudaInvertParam_s::dslash_type
QudaDslashType dslash_type
Definition: quda.h:93

QUDA_GAUGE_FIXED_NO
Definition: enum_quda.h:76

start
cudaEvent_t start
Definition: CMakeCUDACompilerId.cpp1.ii:2453

test_util.h

QudaInvertParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:191

QudaInvertParam_s::c_5
double c_5[QUDA_MAX_DWF_LS]
Definition: quda.h:103

cloverSiteSize
#define cloverSiteSize
Definition: test_util.h:8

QudaInvertParam_s::return_clover_inverse
int return_clover_inverse
Definition: quda.h:217

QUDA_SPACE_SPIN_COLOR_FIELD_ORDER
Definition: enum_quda.h:321

QUDA_QDP_GAUGE_ORDER
Definition: enum_quda.h:41

loadGaugeQuda
void loadGaugeQuda(void *h_gauge, QudaGaugeParam *param)
Definition: interface_quda.cpp:602

DslashTime::cpu_min
double cpu_min
Definition: dslash_ctest.cpp:463

tmc_dslash
void tmc_dslash(void *out, void **gauge, void *in, void *clover, void *cInv, double kappa, double mu, QudaTwistFlavorType flavor, int parity, QudaMatPCType matpc_type, int dagger, QudaPrecision precision, QudaGaugeParam &param)
Definition: clover_reference.cpp:234

dirac_mdwf
DiracMobiusPC * dirac_mdwf
Definition: dslash_test.cpp:45

QUDA_WILSON_LINKS
Definition: enum_quda.h:29

quda::DiracMobiusPC
Definition: dirac_quda.h:430

kernel_pack_t
bool kernel_pack_t
Definition: test_util.cpp:1650

QudaInvertParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:190

ydim
int ydim
Definition: test_util.cpp:1621

process_command_line_option
int process_command_line_option(int argc, char **argv, int *idx)
Definition: test_util.cpp:1795

quda::cpuColorSpinorField::Source
void Source(const QudaSourceType sourceType, const int st=0, const int s=0, const int c=0)
Definition: cpu_color_spinor_field.cpp:245

tmp1
cudaColorSpinorField * tmp1
Definition: dslash_test.cpp:40

QUDA_FULL_SITE_SUBSET
Definition: enum_quda.h:304

tm_ndeg_mat
void tm_ndeg_mat(void *evenOut, void *oddOut, void **gauge, void *evenIn, void *oddIn, double kappa, double mu, double epsilon, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:545

QUDA_DIRECT_SOLVE
Definition: enum_quda.h:140

end
void end()
Definition: dslash_test.cpp:422

quda::LatticeFieldParam::precision
QudaPrecision precision
Definition: lattice_field.h:54

verbosity
QudaVerbosity verbosity
Definition: dslash_test.cpp:82

clover_matpc
void clover_matpc(void *out, void **gauge, void *clover, void *clover_inv, void *in, double kappa, QudaMatPCType matpc_type, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: clover_reference.cpp:92

QudaInvertParam_s::dagger
QudaDagType dagger
Definition: quda.h:184

get_matpc_str
const char * get_matpc_str(QudaMatPCType type)
Definition: misc.cpp:987

finalizeComms
void finalizeComms()
Definition: test_util.cpp:107

quda::cudaColorSpinorField
Definition: color_spinor_field.h:504

test_type
int test_type
Definition: test_util.cpp:1634

QUDA_TWIST_SINGLET
Definition: enum_quda.h:367

dw_dslash
void dw_dslash(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:494

QudaGaugeParam_s::gauge_order
QudaGaugeFieldOrder gauge_order
Definition: quda.h:36

dw_mat
void dw_mat(void *out, void **gauge, void *in, double kappa, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:670

tmc_mat
void tmc_mat(void *out, void **gauge, void *clover, void *in, double kappa, double mu, QudaTwistFlavorType flavor, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: clover_reference.cpp:257

util_quda.h

spinor
cpuColorSpinorField * spinor
Definition: dslash_test.cpp:39

tm_matpc
void tm_matpc(void *outEven, void **gauge, void *inEven, double kappa, double mu, QudaTwistFlavorType flavor, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:358

QUDA_TWIST_NONDEG_DOUBLET
Definition: enum_quda.h:368

get_prec_str
const char * get_prec_str(QudaPrecision prec)
Definition: misc.cpp:704

TEST
TEST(dslash, verify)
Definition: dslash_test.cpp:967

loadCloverQuda
void loadCloverQuda(void *h_clover, void *h_clovinv, QudaInvertParam *inv_param)
Definition: interface_quda.cpp:859

QudaInvertParam_s::return_clover
int return_clover
Definition: quda.h:216

cpu_prec
QudaPrecision cpu_prec
Definition: dslash_test.cpp:33

quda::ColorSpinorField::Volume
int Volume() const
Definition: color_spinor_field.h:369

quda::DiracMobiusPC::M
void M(ColorSpinorField &out, const ColorSpinorField &in) const
Definition: dirac_mobius.cpp:236

quda::Dirac::Flops
unsigned long long Flops() const
Definition: dirac_quda.h:148

QUDA_UKQCD_GAMMA_BASIS
Definition: enum_quda.h:339

spinorSiteSize
#define spinorSiteSize
Definition: interface_quda.cpp:56

quda::Dirac::MdagM
virtual void MdagM(ColorSpinorField &out, const ColorSpinorField &in) const =0

quda
Definition: blas_cublas.h:6

quda::LatticeFieldParam::siteSubset
QudaSiteSubset siteSubset
Definition: lattice_field.h:55

exit
void exit(int) __attribute__((noreturn))

QudaInvertParam_s::clover_cuda_prec_sloppy
QudaPrecision clover_cuda_prec_sloppy
Definition: quda.h:202

setDims
void setDims(int *)
Definition: test_util.cpp:130

dslashQuda
void dslashQuda(void *h_out, void *h_in, QudaInvertParam *inv_param, QudaParity parity)
Definition: interface_quda.cpp:1616

QudaInvertParam_s::input_location
QudaFieldLocation input_location
Definition: quda.h:90

dagger
QudaDagType dagger
Definition: deg_tm_dslash_cuda_gen.py:960

dirac_quda.h

gridsize_from_cmdline
int gridsize_from_cmdline[]
Definition: test_util.cpp:50

timeval::tv_usec
__darwin_suseconds_t tv_usec
Definition: CMakeCUDACompilerId.cpp1.ii:4834

Ls
int Ls
Definition: test_util.cpp:39

compute_clover
bool compute_clover
Definition: test_util.cpp:1646

quda::setDiracParam
void setDiracParam(DiracParam &diracParam, QudaInvertParam *inv_param, bool pc)
Definition: interface_quda.cpp:1386

QudaInvertParam_s::solution_type
QudaSolutionType solution_type
Definition: quda.h:181

return
else return(__swbuf(_c, _p))

main
int main(int argc, char **argv)
Definition: dslash_test.cpp:974

QUDA_MATPC_SOLUTION
Definition: enum_quda.h:132

dslashQuda_4dpc
void dslashQuda_4dpc(void *h_out, void *h_in, QudaInvertParam *inv_param, QudaParity parity, int test_type)
Definition: interface_quda.cpp:1708

strcmp
int strcmp(const char *__s1, const char *__s2)

quda::LatticeFieldParam::x
int x[QUDA_MAX_DIM]
Definition: lattice_field.h:50

QudaInvertParam_s::clover_cuda_prec
QudaPrecision clover_cuda_prec
Definition: quda.h:201

quda::DiracMobius::Dslash4
void Dslash4(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Definition: dirac_mobius.cpp:31

quda::DiracParam
Definition: dirac_quda.h:19

dw_matdagmat
void dw_matdagmat(void *out, void **gauge, void *in, double kappa, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:736

dslashCUDA
DslashTime dslashCUDA(int niter)
Definition: dslash_test.cpp:460

initQuda
void initQuda(int device)
Definition: interface_quda.cpp:546

dw_matpc
void dw_matpc(void *out, void **gauge, void *in, double kappa, QudaMatPCType matpc_type, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:747

tmp2
cudaColorSpinorField * tmp2
Definition: dslash_test.cpp:40

QUDA_EVEN_ODD_SITE_ORDER
Definition: enum_quda.h:311

tol
double tol
Definition: test_util.cpp:1647

QudaInvertParam_s::output_location
QudaFieldLocation output_location
Definition: quda.h:91

malloc
void * malloc(size_t __size) __attribute__((__warn_unused_result__)) __attribute__((alloc_size(1)))

QudaInvertParam_s::clover_cuda_prec_precondition
QudaPrecision clover_cuda_prec_precondition
Definition: quda.h:203

printf
int printf(const char *,...) __attribute__((__format__(__printf__

mdw_dslash_5
void mdw_dslash_5(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, double *kappa, bool zero_initialize)
Definition: domain_wall_dslash_reference.cpp:636

QudaInvertParam_s::m5
double m5
Definition: quda.h:99

QudaGaugeParam_s
Definition: quda.h:25

quda::ColorSpinorParam::fieldOrder
QudaFieldOrder fieldOrder
Definition: color_spinor_field.h:92

quda::DiracDomainWall4DPC::Dslash5inv
void Dslash5inv(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity, const double &kappa5) const
Definition: dirac_domain_wall_4d.cpp:58

latfile
char latfile[]
Definition: test_util.cpp:1627

QudaInvertParam_s::verbosity
QudaVerbosity verbosity
Definition: quda.h:219

setSpinorSiteSize
void setSpinorSiteSize(int n)
Definition: test_util.cpp:192

transfer
const int transfer
Definition: dslash_test.cpp:29

csParam
ColorSpinorParam csParam
Definition: pack_test.cpp:24

newQudaInvertParam
QudaInvertParam newQudaInvertParam(void)

mdw_dslash_4_pre
void mdw_dslash_4_pre(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, double *b5, double *c5, bool zero_initialize)
Definition: domain_wall_dslash_reference.cpp:650

get_recon_str
const char * get_recon_str(QudaReconstructType recon)
Definition: misc.cpp:770

DslashTime::event_time
double event_time
Definition: dslash_ctest.cpp:461

QudaInvertParam_s::clover_order
QudaCloverFieldOrder clover_order
Definition: quda.h:205

V
int V
Definition: test_util.cpp:28

QudaMatPCType
enum QudaMatPCType_s QudaMatPCType

quda::ColorSpinorParam::gammaBasis
QudaGammaBasis gammaBasis
Definition: color_spinor_field.h:93

dirac_4dpc
DiracDomainWall4DPC * dirac_4dpc
Definition: dslash_test.cpp:46

gaugeSiteSize
#define gaugeSiteSize
Definition: test_util.h:6

MAX
#define MAX(a, b)
Definition: dslash_test.cpp:24

QUDA_CLOVER_WILSON_DSLASH
Definition: enum_quda.h:87

fused_exterior_ndeg_tm_dslash_cuda_gen.i
int i
start here
Definition: fused_exterior_ndeg_tm_dslash_cuda_gen.py:816

hostGauge
void * hostGauge[4]
Definition: dslash_test.cpp:42

DslashTime::cpu_time
double cpu_time
Definition: dslash_ctest.cpp:462

warningQuda
#define warningQuda(...)
Definition: util_quda.h:101

mdw_matpc
void mdw_matpc(void *out, void **gauge, void *in, double *kappa_b, double *kappa_c, QudaMatPCType matpc_type, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, double *b5, double *c5)
Definition: domain_wall_dslash_reference.cpp:808

niter
int niter
Definition: test_util.cpp:1630

quda::pow
__host__ __device__ ValueType pow(ValueType x, ExponentType e)
Definition: complex_quda.h:100

QUDA_PARITY_SITE_SUBSET
Definition: enum_quda.h:303

QudaInvertParam_s::gamma_basis
QudaGammaBasis gamma_basis
Definition: quda.h:197

QUDA_FLOAT2_FIELD_ORDER
Definition: enum_quda.h:319

dslash_type
QudaDslashType dslash_type
Definition: test_util.cpp:1626

QudaGaugeParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:45

dirac
Dirac * dirac
Definition: dslash_test.cpp:44

quda::DiracMobius::Dslash4pre
void Dslash4pre(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Definition: dirac_mobius.cpp:45

get_dslash_str
const char * get_dslash_str(QudaDslashType type)
Definition: misc.cpp:878

verify_results
bool verify_results
Definition: test_util.cpp:1641

dslash_util.h

timeval
Definition: CMakeCUDACompilerId.cpp1.ii:4831

clover_mat
void clover_mat(void *out, void **gauge, void *clover, void *in, double kappa, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: clover_reference.cpp:149

hostClover
void * hostClover
Definition: dslash_test.cpp:42

tm_ndeg_matpc
void tm_ndeg_matpc(void *outEven1, void *outEven2, void **gauge, void *inEven1, void *inEven2, double kappa, double mu, double epsilon, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:477

QudaDagType
enum QudaDagType_s QudaDagType

QudaParity
enum QudaParity_s QudaParity

device
int device
Definition: CMakeCUDACompilerId.cpp1.ii:2238

QudaGaugeParam_s::reconstruct
QudaReconstructType reconstruct
Definition: quda.h:43

QudaGaugeParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:42

QudaGaugeParam_s::X
int X[4]
Definition: quda.h:29

quda::DiracDomainWall4DPC
Definition: dirac_quda.h:363

QudaInvertParam_s::mass
double mass
Definition: quda.h:96

fprintf
int fprintf(FILE *, const char *,...) __attribute__((__format__(__printf__

twist_flavor
QudaTwistFlavorType twist_flavor
Definition: test_util.cpp:1649

display_test_info
void display_test_info()
Definition: dslash_test.cpp:945

memcpy
void * memcpy(void *__dst, const void *__src, size_t __n)

mass
double mass
Definition: test_util.cpp:1642

QUDA_TWISTED_CLOVER_DSLASH
Definition: enum_quda.h:94

quda::LatticeFieldParam::nDim
int nDim
Definition: lattice_field.h:47

mu
double mu
Definition: test_util.cpp:1643

quda::cpuColorSpinorField::Compare
static int Compare(const cpuColorSpinorField &a, const cpuColorSpinorField &b, const int resolution=1)
Definition: cpu_color_spinor_field.cpp:249

QudaInvertParam_s::sp_pad
int sp_pad
Definition: quda.h:221

clover_dslash
void clover_dslash(void *out, void **gauge, void *clover, void *in, int parity, int dagger, QudaPrecision precision, QudaGaugeParam &param)
Definition: clover_reference.cpp:81

QudaInvertParam_s::compute_clover_inverse
int compute_clover_inverse
Definition: quda.h:215

quda::DiracDomainWall4DPC::Dslash4
void Dslash4(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Definition: dirac_domain_wall_4d.cpp:26

QUDA_WILSON_DSLASH
Definition: enum_quda.h:86

tm_ndeg_dslash
void tm_ndeg_dslash(void *res1, void *res2, void **gauge, void *spinorField1, void *spinorField2, double kappa, double mu, double epsilon, int oddBit, int daggerBit, QudaMatPCType matpc_type, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:462

blas_quda.h

cuda_prec
QudaPrecision cuda_prec
Definition: dslash_test.cpp:34

construct_clover_field
void construct_clover_field(void *clover, double norm, double diag, QudaPrecision precision)
Definition: test_util.cpp:1166

quda::Dirac::M
virtual void M(ColorSpinorField &out, const ColorSpinorField &in) const =0

quda::ColorSpinorParam
Definition: color_spinor_field.h:80

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:61

clover_coeff
double clover_coeff
Definition: test_util.cpp:1645

inv_param
QudaInvertParam inv_param
Definition: dslash_test.cpp:37

wil_mat
void wil_mat(void *out, void **gauge, void *in, double kappa, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:296

QudaGaugeParam_s::gaugeGiB
double gaugeGiB
Definition: quda.h:60

QUDA_TWISTED_MASS_DSLASH
Definition: enum_quda.h:93

QUDA_STAGGERED_DSLASH
Definition: enum_quda.h:91

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:60

prec
QudaPrecision prec
Definition: test_util.cpp:1615

QUDA_5D_PC
Definition: enum_quda.h:361

quda::ColorSpinorParam::nSpin
int nSpin
Definition: color_spinor_field.h:86

QudaReconstructType
enum QudaReconstructType_s QudaReconstructType

quda.h
Main header file for the QUDA library.

spinorOut
cpuColorSpinorField * spinorOut
Definition: dslash_test.cpp:39

QUDA_DEGRAND_ROSSI_GAMMA_BASIS
Definition: enum_quda.h:338

tmc_matpc
void tmc_matpc(void *out, void **gauge, void *in, void *clover, void *cInv, double kappa, double mu, QudaTwistFlavorType flavor, QudaMatPCType matpc_type, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: clover_reference.cpp:284

dslash_quda.h

if
if(err !=cudaSuccess)
Definition: CMakeCUDACompilerId.cpp1.ii:15963

MatQuda
void MatQuda(void *h_out, void *h_in, QudaInvertParam *inv_param)
Definition: interface_quda.cpp:1853

QudaInvertParam_s::Ls
int Ls
Definition: quda.h:100

printfQuda
#define printfQuda(...)
Definition: util_quda.h:84

QudaGaugeParam_s::t_boundary
QudaTboundary t_boundary
Definition: quda.h:38

QudaInvertParam_s::twist_flavor
QudaTwistFlavorType twist_flavor
Definition: quda.h:108

Vh
int Vh
Definition: test_util.cpp:29

dslash_4_4d
void dslash_4_4d(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:558

DslashTime
Definition: dslash_ctest.cpp:460

quda::ColorSpinorParam::twistFlavor
QudaTwistFlavorType twistFlavor
Definition: color_spinor_field.h:88

quda::blas::flops
unsigned long long flops
Definition: blas_quda.cu:42

DslashTime::cpu_max
double cpu_max
Definition: dslash_ctest.cpp:464

quda::ColorSpinorParam::siteOrder
QudaSiteOrder siteOrder
Definition: color_spinor_field.h:90

e
return e
Definition: CMakeCUDACompilerId.cpp1.ii:3026

qio_field.h

quda::DiracMobiusPC::MdagM
void MdagM(ColorSpinorField &out, const ColorSpinorField &in) const
Definition: dirac_mobius.cpp:281

QUDA_DIRAC_ORDER
Definition: enum_quda.h:215

Lsdim
int Lsdim
Definition: test_util.cpp:1624

not_dagger
QudaDagType not_dagger
Definition: dslash_test.cpp:68

matpc_type
QudaMatPCType matpc_type
Definition: test_util.cpp:1652

QudaDslashType
enum QudaDslashType_s QudaDslashType

QUDA_ANTI_PERIODIC_T
Definition: enum_quda.h:53

QUDA_RANDOM_SOURCE
Definition: enum_quda.h:346

domain_wall_dslash_reference.h

quda::setKernelPackT
void setKernelPackT(bool pack)
Definition: dslash_quda.cu:59

usage
void usage(char **)
Definition: test_util.cpp:1693

QudaInvertParam_s::cl_pad
int cl_pad
Definition: quda.h:222

QUDA_DIRECT_PC_SOLVE
Definition: enum_quda.h:142

quda::DiracParam::tmp2
ColorSpinorField * tmp2
Definition: dirac_quda.h:41

link_recon
QudaReconstructType link_recon
Definition: test_util.cpp:1612

wil_matpc
void wil_matpc(void *outEven, void **gauge, void *inEven, double kappa, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:334

QUDA_EVEN_PARITY
Definition: enum_quda.h:259

init
void init(int argc, char **argv)
Definition: dslash_test.cpp:84

QUDA_MATDAG_MAT_SOLUTION
Definition: enum_quda.h:131

QudaVerbosity
enum QudaVerbosity_s QudaVerbosity

dslashRef
void dslashRef()
Definition: dslash_test.cpp:643

QudaInvertParam_s::compute_clover
int compute_clover
Definition: quda.h:214

wilson_dslash_reference.h

QudaInvertParam_s::epsilon
double epsilon
Definition: quda.h:106

wil_dslash
void wil_dslash(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:175

quda::DiracDomainWall4DPC::MdagM
void MdagM(ColorSpinorField &out, const ColorSpinorField &in) const
Definition: dirac_domain_wall_4d.cpp:165

QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:331

float
float
Definition: CMakeCUDACompilerId.cpp1.ii:12791

quda::Dirac::create
static Dirac * create(const DiracParam &param)
Definition: dirac.cpp:142

QUDA_DOMAIN_WALL_DSLASH
Definition: enum_quda.h:88

QUDA_FLOAT4_FIELD_ORDER
Definition: enum_quda.h:320

quda::ColorSpinorParam::create
QudaFieldCreate create
Definition: color_spinor_field.h:94

zdim
int zdim
Definition: test_util.cpp:1622

quda::DiracMobiusPC::Dslash5inv
void Dslash5inv(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Definition: dirac_mobius.cpp:201

read_gauge_field
void read_gauge_field(const char *filename, void *gauge[], QudaPrecision prec, const int *X, int argc, char *argv[])
Definition: qio_field.h:12

QUDA_MATPCDAG_MATPC_SOLUTION
Definition: enum_quda.h:134

d
static __inline__ size_t size_t d
Definition: CMakeCUDACompilerId.cpp1.ii:3019

quda::Dirac::Dslash
virtual void Dslash(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const =0

quda::ColorSpinorField::GhostBytes
size_t GhostBytes() const
Definition: color_spinor_field.h:374

QudaInvertParam_s::clover_cpu_prec
QudaPrecision clover_cpu_prec
Definition: quda.h:200

cudaSpinor
cudaColorSpinorField * cudaSpinor
Definition: dslash_test.cpp:40

QudaInvertParam_s
Definition: quda.h:88

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:296

quda::DiracDomainWall4DPC::M
void M(ColorSpinorField &out, const ColorSpinorField &in) const
Definition: dirac_domain_wall_4d.cpp:131

hostCloverInv
void * hostCloverInv
Definition: dslash_test.cpp:42

initComms
void initComms(int argc, char **argv, const int *commDims)
Definition: test_util.cpp:72

parity
const QudaParity parity
Definition: dslash_test.cpp:28

DslashTime::DslashTime
DslashTime()
Definition: dslash_test.cpp:456

setVerbosity
void setVerbosity(const QudaVerbosity verbosity)
Definition: util_quda.cpp:24

QudaInvertParam_s::matpc_type
QudaMatPCType matpc_type
Definition: quda.h:183

dslashQuda_mdwf
void dslashQuda_mdwf(void *h_out, void *h_in, QudaInvertParam *inv_param, QudaParity parity, int test_type)
Definition: interface_quda.cpp:1779

QUDA_DOMAIN_WALL_4D_DSLASH
Definition: enum_quda.h:89

dslash_5_inv
void dslash_5_inv(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, double *kappa)
Definition: domain_wall_dslash_reference.cpp:627

quda::DiracParam::tmp1
ColorSpinorField * tmp1
Definition: dirac_quda.h:40

dslash
Definition: dslash_events.cuh:1

kappa5
double kappa5
Definition: dslash_test.cpp:31

quda::cpuColorSpinorField
Definition: color_spinor_field.h:789

QudaGaugeParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:40

quda::ColorSpinorField::V
void * V()
Definition: color_spinor_field.h:380

quda::Dirac
Definition: dirac_quda.h:86

newQudaGaugeParam
QudaGaugeParam newQudaGaugeParam(void)

quda_internal.h

quda::LatticeFieldParam::pad
int pad
Definition: lattice_field.h:52

QudaInvertParam_s::clover_coeff
double clover_coeff
Definition: quda.h:208

comm_barrier
void comm_barrier(void)
Definition: comm_mpi.cpp:328

QUDA_MOBIUS_DWF_DSLASH
Definition: enum_quda.h:90

QudaTwistFlavorType
enum QudaTwistFlavorType_s QudaTwistFlavorType