quda-ref/v0.7.0/dslash__test_8cpp_source.html

 #include <iostream>

 #include <stdio.h>

 #include <stdlib.h>

 #include <string.h>


 #include <quda.h>

 #include <quda_internal.h>

 #include <dirac_quda.h>

 #include <dslash_quda.h>

 #include <invert_quda.h>

 #include <util_quda.h>

 #include <blas_quda.h>


 #include <test_util.h>

 #include <dslash_util.h>

 #include <wilson_dslash_reference.h>

 #include <domain_wall_dslash_reference.h>

 #include "misc.h"


 // google test frame work

 #include <gtest.h>


 #include <gauge_qio.h>


 #define MAX(a,b) ((a)>(b)?(a):(b))


 using namespace quda;


 const QudaParity parity = QUDA_EVEN_PARITY; // even or odd?

 const int transfer = 0; // include transfer time in the benchmark?


 double kappa5;


 QudaPrecision cpu_prec = QUDA_DOUBLE_PRECISION;

 QudaPrecision cuda_prec;


 QudaGaugeParam gauge_param;

 QudaInvertParam inv_param;


 cpuColorSpinorField *spinor, *spinorOut, *spinorRef, *spinorTmp;

 cudaColorSpinorField *cudaSpinor, *cudaSpinorOut, *tmp1=0, *tmp2=0;


 void *hostGauge[4], *hostClover, *hostCloverInv;


 Dirac *dirac = NULL;

 DiracMobiusDomainWallPC *dirac_mdwf = NULL; // create the MDWF Dirac operator

 DiracDomainWall4DPC *dirac_4dpc = NULL; // create the 4d preconditioned DWF Dirac operator


 // What test are we doing (0 = dslash, 1 = MatPC, 2 = Mat, 3 = MatPCDagMatPC, 4 = MatDagMat)

 extern int test_type;


 // Dirac operator type

 extern QudaDslashType dslash_type;


 // Twisted mass flavor type

 extern QudaTwistFlavorType twist_flavor;

 extern QudaMatPCType matpc_type;


 extern bool tune;


 extern int device;

 extern int xdim;

 extern int ydim;

 extern int zdim;

 extern int tdim;

 extern int Lsdim;

 extern int gridsize_from_cmdline[];

 extern QudaReconstructType link_recon;

 extern QudaPrecision prec;

 extern QudaDagType dagger;

 QudaDagType not_dagger;


 extern bool verify_results;

 extern int niter;

 extern char latfile[];


 extern bool kernel_pack_t;


 void init(int argc, char **argv) {


   cuda_prec = prec;


   gauge_param = newQudaGaugeParam();

   inv_param = newQudaInvertParam();


   gauge_param.X[0] = xdim;

   gauge_param.X[1] = ydim;

   gauge_param.X[2] = zdim;

   gauge_param.X[3] = tdim;


   if (dslash_type == QUDA_ASQTAD_DSLASH || dslash_type == QUDA_STAGGERED_DSLASH) {

     errorQuda("Asqtad not supported.  Please try staggered_dslash_test instead");

   } else if (dslash_type == QUDA_DOMAIN_WALL_DSLASH ||

              dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH ||

              dslash_type == QUDA_MOBIUS_DWF_DSLASH ) {

     // for these we always use kernel packing

     dw_setDims(gauge_param.X, Lsdim);

     setKernelPackT(true);

   } else {

     setDims(gauge_param.X);

     setKernelPackT(kernel_pack_t);

     Ls = 1;

   }


   setSpinorSiteSize(24);


   gauge_param.anisotropy = 1.0;


   gauge_param.type = QUDA_WILSON_LINKS;

   gauge_param.gauge_order = QUDA_QDP_GAUGE_ORDER;

   gauge_param.t_boundary = QUDA_ANTI_PERIODIC_T;


   gauge_param.cpu_prec = cpu_prec;

   gauge_param.cuda_prec = cuda_prec;

   gauge_param.reconstruct = link_recon;

   gauge_param.reconstruct_sloppy = link_recon;

   gauge_param.cuda_prec_sloppy = cuda_prec;

   gauge_param.gauge_fix = QUDA_GAUGE_FIXED_NO;


   inv_param.kappa = 0.1;


   if (dslash_type == QUDA_TWISTED_MASS_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {

     inv_param.mu = 0.01;

     inv_param.epsilon = 0.01;

     inv_param.twist_flavor = twist_flavor;

   } else if (dslash_type == QUDA_DOMAIN_WALL_DSLASH ||

              dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH ) {

     inv_param.mass = 0.01;

     inv_param.m5 = -1.5;

     kappa5 = 0.5/(5 + inv_param.m5);

   } else if (dslash_type == QUDA_MOBIUS_DWF_DSLASH ) {

     inv_param.mass = 0.01;

     inv_param.m5 = -1.5;

     kappa5 = 0.5/(5 + inv_param.m5);

     for(int k = 0; k < Lsdim; k++)

     {

       // b5[k], c[k] values are chosen for arbitrary values,

       // but the difference of them are same as 1.0

       inv_param.b_5[k] = 1.50;

       inv_param.c_5[k] = 0.50;

     }

   }


   inv_param.Ls = (inv_param.twist_flavor != QUDA_TWIST_NONDEG_DOUBLET) ? Ls : 2;


   inv_param.matpc_type = matpc_type;

   inv_param.dagger = dagger;

   not_dagger = (QudaDagType)((dagger + 1)%2);


   inv_param.cpu_prec = cpu_prec;

   if (inv_param.cpu_prec != gauge_param.cpu_prec) {

     errorQuda("Gauge and spinor CPU precisions must match");

   }

   inv_param.cuda_prec = cuda_prec;


   inv_param.input_location = QUDA_CPU_FIELD_LOCATION;

   inv_param.output_location = QUDA_CPU_FIELD_LOCATION;


 #ifndef MULTI_GPU // free parameter for single GPU

   gauge_param.ga_pad = 0;

 #else // must be this one c/b face for multi gpu

   int x_face_size = gauge_param.X[1]*gauge_param.X[2]*gauge_param.X[3]/2;

   int y_face_size = gauge_param.X[0]*gauge_param.X[2]*gauge_param.X[3]/2;

   int z_face_size = gauge_param.X[0]*gauge_param.X[1]*gauge_param.X[3]/2;

   int t_face_size = gauge_param.X[0]*gauge_param.X[1]*gauge_param.X[2]/2;

   int pad_size =MAX(x_face_size, y_face_size);

   pad_size = MAX(pad_size, z_face_size);

   pad_size = MAX(pad_size, t_face_size);

   gauge_param.ga_pad = pad_size;

 #endif

   inv_param.sp_pad = 0;

   inv_param.cl_pad = 0;


   //inv_param.sp_pad = xdim*ydim*zdim/2;

   //inv_param.cl_pad = 24*24*24;


   inv_param.gamma_basis = QUDA_DEGRAND_ROSSI_GAMMA_BASIS; // test code only supports DeGrand-Rossi Basis

   inv_param.dirac_order = QUDA_DIRAC_ORDER;


   if(dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH){

     switch(test_type) {

       case 0:

       case 1:

       case 2:

       case 3:

         inv_param.solution_type = QUDA_MATPC_SOLUTION;

         break;

       case 4:

         inv_param.solution_type = QUDA_MATPCDAG_MATPC_SOLUTION;

         break;

       default:

         errorQuda("Test type %d not defined QUDA_DOMAIN_WALL_4D_DSLASH\n", test_type);

     }

   } else if(dslash_type == QUDA_MOBIUS_DWF_DSLASH) {

     switch(test_type) {

       case 0:

       case 1:

       case 2:

       case 3:

       case 4:

         inv_param.solution_type = QUDA_MATPC_SOLUTION;

         break;

       case 5:

         inv_param.solution_type = QUDA_MATPCDAG_MATPC_SOLUTION;

         break;

       default:

         errorQuda("Test type %d not defined on QUDA_MOBIUS_DWF_DSLASH\n", test_type);

     }

   }

   else

   {

     switch(test_type) {

       case 0:

       case 1:

         inv_param.solution_type = QUDA_MATPC_SOLUTION;

         break;

       case 2:

         inv_param.solution_type = QUDA_MAT_SOLUTION;

         break;

       case 3:

         inv_param.solution_type = QUDA_MATPCDAG_MATPC_SOLUTION;

         break;

       case 4:

         inv_param.solution_type = QUDA_MATDAG_MAT_SOLUTION;

         break;

       default:

         errorQuda("Test type %d not defined\n", test_type);

     }

   }


   inv_param.dslash_type = dslash_type;


   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {

     inv_param.clover_cpu_prec = cpu_prec;

     inv_param.clover_cuda_prec = cuda_prec;

     inv_param.clover_cuda_prec_sloppy = inv_param.clover_cuda_prec;

     inv_param.clover_order = QUDA_PACKED_CLOVER_ORDER;

     inv_param.clover_coeff = 1.5*inv_param.kappa;

     //if (test_type > 0) {

       hostClover = malloc(V*cloverSiteSize*inv_param.clover_cpu_prec);

       hostCloverInv = hostClover; // fake it

       /*} else {

       hostClover = NULL;

       hostCloverInv = malloc(V*cloverSiteSize*inv_param.clover_cpu_prec);

       }*/

   } else if (dslash_type == QUDA_TWISTED_MASS_DSLASH) {


   }


   setVerbosity(QUDA_VERBOSE);


   // construct input fields

   for (int dir = 0; dir < 4; dir++) hostGauge[dir] = malloc(V*gaugeSiteSize*gauge_param.cpu_prec);


   ColorSpinorParam csParam;


   csParam.nColor = 3;

   csParam.nSpin = 4;

   if (dslash_type == QUDA_TWISTED_MASS_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {

     csParam.twistFlavor = inv_param.twist_flavor;

   }

   csParam.nDim = 4;

   for (int d=0; d<4; d++) csParam.x[d] = gauge_param.X[d];

   if (dslash_type == QUDA_DOMAIN_WALL_DSLASH ||

       dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH ||

       dslash_type == QUDA_MOBIUS_DWF_DSLASH ) {

     csParam.nDim = 5;

     csParam.x[4] = Ls;

   }

   if (dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH ||

       dslash_type == QUDA_MOBIUS_DWF_DSLASH ) {

     csParam.PCtype = QUDA_4D_PC;

   } else {

     csParam.PCtype = QUDA_5D_PC;

   }


 //ndeg_tm

   if (dslash_type == QUDA_TWISTED_MASS_DSLASH) {

     csParam.twistFlavor = inv_param.twist_flavor;

     csParam.nDim = (inv_param.twist_flavor == QUDA_TWIST_PLUS || inv_param.twist_flavor == QUDA_TWIST_MINUS) ? 4 : 5;

     csParam.x[4] = inv_param.Ls;

   }


   csParam.precision = inv_param.cpu_prec;

   csParam.pad = 0;


   if(dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH ||

       dslash_type == QUDA_MOBIUS_DWF_DSLASH)

   {

     csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;

     csParam.x[0] /= 2;


   } else

   {

     if (test_type < 2 || test_type ==3) {

       csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;

       csParam.x[0] /= 2;

     } else {

       csParam.siteSubset = QUDA_FULL_SITE_SUBSET;

     }

   }


   csParam.siteOrder = QUDA_EVEN_ODD_SITE_ORDER;

   csParam.fieldOrder = QUDA_SPACE_SPIN_COLOR_FIELD_ORDER;

   csParam.gammaBasis = inv_param.gamma_basis;

   csParam.create = QUDA_ZERO_FIELD_CREATE;


   spinor = new cpuColorSpinorField(csParam);

   spinorOut = new cpuColorSpinorField(csParam);

   spinorRef = new cpuColorSpinorField(csParam);

   spinorTmp = new cpuColorSpinorField(csParam);


   csParam.x[0] = gauge_param.X[0];


   printfQuda("Randomizing fields... ");


   if (strcmp(latfile,"")) {  // load in the command line supplied gauge field

     read_gauge_field(latfile, hostGauge, gauge_param.cpu_prec, gauge_param.X, argc, argv);

     construct_gauge_field(hostGauge, 2, gauge_param.cpu_prec, &gauge_param);

   } else { // else generate a random SU(3) field

     construct_gauge_field(hostGauge, 1, gauge_param.cpu_prec, &gauge_param);

   }


   spinor->Source(QUDA_RANDOM_SOURCE);


   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH) {

     double norm = 0.0; // clover components are random numbers in the range (-norm, norm)

     double diag = 1.0; // constant added to the diagonal


     if (test_type == 2 || test_type == 4) {

       construct_clover_field(hostClover, norm, diag, inv_param.clover_cpu_prec);

     } else {

       construct_clover_field(hostCloverInv, norm, diag, inv_param.clover_cpu_prec);

     }

   }

   printfQuda("done.\n"); fflush(stdout);


   initQuda(device);


   printfQuda("Sending gauge field to GPU\n");

   loadGaugeQuda(hostGauge, &gauge_param);


   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH) {

     printfQuda("Sending clover field to GPU\n");

     loadCloverQuda(hostClover, hostCloverInv, &inv_param);

   }


   if (dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {

     printfQuda("Sending clover field to GPU\n");

     loadCloverQuda(NULL, NULL, &inv_param);

   }


   if (!transfer) {

     csParam.gammaBasis = QUDA_UKQCD_GAMMA_BASIS;

     csParam.pad = inv_param.sp_pad;

     csParam.precision = inv_param.cuda_prec;

     if (csParam.precision == QUDA_DOUBLE_PRECISION ) {

       csParam.fieldOrder = QUDA_FLOAT2_FIELD_ORDER;

     } else {

       /* Single and half */

       csParam.fieldOrder = QUDA_FLOAT4_FIELD_ORDER;

     }


     if(dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH ||

         dslash_type == QUDA_MOBIUS_DWF_DSLASH)

     {

       csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;

       csParam.x[0] /= 2;

     } else

     {

       if (test_type < 2 || test_type == 3) {

         csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;

         csParam.x[0] /= 2;

       }

     }


     printfQuda("Creating cudaSpinor\n");

     cudaSpinor = new cudaColorSpinorField(csParam);

     printfQuda("Creating cudaSpinorOut\n");

     cudaSpinorOut = new cudaColorSpinorField(csParam);


     tmp1 = new cudaColorSpinorField(csParam);


     if(dslash_type != QUDA_DOMAIN_WALL_4D_DSLASH &&

         dslash_type != QUDA_MOBIUS_DWF_DSLASH)

       if (test_type == 2 || test_type == 4) csParam.x[0] /= 2;


     csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;

     tmp2 = new cudaColorSpinorField(csParam);


     printfQuda("Sending spinor field to GPU\n");

     *cudaSpinor = *spinor;


     double cpu_norm = norm2(*spinor);

     double cuda_norm = norm2(*cudaSpinor);

     printfQuda("Source: CPU = %e, CUDA = %e\n", cpu_norm, cuda_norm);


     bool pc;

     if(dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH ||

        dslash_type == QUDA_MOBIUS_DWF_DSLASH)

       pc = true;

     else

       pc = (test_type != 2 && test_type != 4);

     DiracParam diracParam;

     setDiracParam(diracParam, &inv_param, pc);

     diracParam.tmp1 = tmp1;

     diracParam.tmp2 = tmp2;


     if (dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH){

       dirac_4dpc = new DiracDomainWall4DPC(diracParam);

       dirac = (Dirac*)dirac_4dpc;

     }

     else if (dslash_type == QUDA_MOBIUS_DWF_DSLASH){

       dirac_mdwf = new DiracMobiusDomainWallPC(diracParam);

       dirac = (Dirac*)dirac_mdwf;

     }

     else {

       dirac = Dirac::create(diracParam);

     }

   } else {

     double cpu_norm = norm2(*spinor);

     printfQuda("Source: CPU = %e\n", cpu_norm);

   }


 }


 void end() {

   if (!transfer) {

     if(dirac != NULL)

     {

       delete dirac;

       dirac = NULL;

     }

     delete cudaSpinor;

     delete cudaSpinorOut;

     delete tmp1;

     delete tmp2;

   }


   // release memory

   delete spinor;

   delete spinorOut;

   delete spinorRef;

   delete spinorTmp;


   for (int dir = 0; dir < 4; dir++) free(hostGauge[dir]);

   if((dslash_type == QUDA_CLOVER_WILSON_DSLASH) || (dslash_type == QUDA_TWISTED_CLOVER_DSLASH)){

     if (hostClover != hostCloverInv && hostClover) free(hostClover);

     free(hostCloverInv);

   }

   endQuda();


 }


 // execute kernel

 double dslashCUDA(int niter) {


   cudaEvent_t start, end;

   cudaEventCreate(&start);

   cudaEventCreate(&end);

   cudaEventRecord(start, 0);


   for (int i = 0; i < niter; i++) {

     if (dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH){

       switch (test_type) {

         case 0:

           if (transfer) {

             dslashQuda_4dpc(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);

           } else {

             dirac_4dpc->Dslash4(*cudaSpinorOut, *cudaSpinor, parity);

           }

           break;

         case 1:

           if (transfer) {

             dslashQuda_4dpc(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);

           } else {

             dirac_4dpc->Dslash5(*cudaSpinorOut, *cudaSpinor, parity);

           }

           break;

         case 2:

           if (transfer) {

             dslashQuda_4dpc(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);

           } else {

             dirac_4dpc->Dslash5inv(*cudaSpinorOut, *cudaSpinor, parity, kappa5);

           }

           break;

         case 3:

           if (transfer) {

             MatQuda(spinorOut->V(), spinor->V(), &inv_param);

           } else {

             dirac_4dpc->M(*cudaSpinorOut, *cudaSpinor);

           }

           break;

         case 4:

           if (transfer) {

             MatDagMatQuda(spinorOut->V(), spinor->V(), &inv_param);

           } else {

             dirac_4dpc->MdagM(*cudaSpinorOut, *cudaSpinor);

           }

           break;

       }

     }

     else if (dslash_type == QUDA_MOBIUS_DWF_DSLASH){

       switch (test_type) {

         case 0:

           if (transfer) {

             dslashQuda_mdwf(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);

           } else {

             dirac_mdwf->Dslash4(*cudaSpinorOut, *cudaSpinor, parity);

           }

           break;

         case 1:

           if (transfer) {

             dslashQuda_mdwf(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);

           } else {

             dirac_mdwf->Dslash5(*cudaSpinorOut, *cudaSpinor, parity);

           }

           break;

         case 2:

           if (transfer) {

             dslashQuda_mdwf(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);

           } else {

             dirac_mdwf->Dslash4pre(*cudaSpinorOut, *cudaSpinor, parity);

           }

           break;

         case 3:

           if (transfer) {

             dslashQuda_mdwf(spinorOut->V(), spinor->V(), &inv_param, parity, test_type);

           } else {

             dirac_mdwf->Dslash5inv(*cudaSpinorOut, *cudaSpinor, parity, kappa5);

           }

           break;

         case 4:

           if (transfer) {

             MatQuda(spinorOut->V(), spinor->V(), &inv_param);

           } else {

             dirac_mdwf->M(*cudaSpinorOut, *cudaSpinor);

           }

           break;

         case 5:

           if (transfer) {

             MatDagMatQuda(spinorOut->V(), spinor->V(), &inv_param);

           } else {

             dirac_mdwf->MdagM(*cudaSpinorOut, *cudaSpinor);

           }

           break;

       }

     } else {

       switch (test_type) {

         case 0:

           if (dslash_type == QUDA_TWISTED_CLOVER_DSLASH && (matpc_type == QUDA_MATPC_EVEN_EVEN || matpc_type == QUDA_MATPC_ODD_ODD)) {

             if (transfer) {

               dslashQuda(spinorOut->V(), spinor->V(), &inv_param, parity);

             } else {

               ((DiracTwistedCloverPC *) dirac)->TwistCloverInv(*tmp1, *cudaSpinor, (parity+1)%2);

               dirac->Dslash(*cudaSpinorOut, *tmp1, parity);

             }

           } else {

             if (transfer) {

               dslashQuda(spinorOut->V(), spinor->V(), &inv_param, parity);

             } else {

               dirac->Dslash(*cudaSpinorOut, *cudaSpinor, parity);

             }

           }

           break;

         case 1:

           if (transfer) {

             MatQuda(spinorOut->V(), spinor->V(), &inv_param);

           } else {

             dirac->M(*cudaSpinorOut, *cudaSpinor);

           }

           break;

         case 2:

           if (transfer) {

             MatQuda(spinorOut->V(), spinor->V(), &inv_param);

           } else {

             dirac->M(*cudaSpinorOut, *cudaSpinor);

           }

           break;

         case 3:

           if (transfer) {

             MatDagMatQuda(spinorOut->V(), spinor->V(), &inv_param);

           } else {

             dirac->MdagM(*cudaSpinorOut, *cudaSpinor);

           }

           break;

         case 4:

           if (transfer) {

             MatDagMatQuda(spinorOut->V(), spinor->V(), &inv_param);

           } else {

             dirac->MdagM(*cudaSpinorOut, *cudaSpinor);

           }

           break;

       }

     }

   }


   cudaEventRecord(end, 0);

   cudaEventSynchronize(end);

   float runTime;

   cudaEventElapsedTime(&runTime, start, end);

   cudaEventDestroy(start);

   cudaEventDestroy(end);


   double secs = runTime / 1000; //stopwatchReadSeconds();


   // check for errors

   cudaError_t stat = cudaGetLastError();

   if (stat != cudaSuccess)

     printfQuda("with ERROR: %s\n", cudaGetErrorString(stat));


   return secs;

 }


 void dslashRef() {


   // compare to dslash reference implementation

   printfQuda("Calculating reference implementation...");

   fflush(stdout);


   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH ||

       dslash_type == QUDA_WILSON_DSLASH) {

     switch (test_type) {

     case 0:

       wil_dslash(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, inv_param.cpu_prec, gauge_param);

       break;

     case 1:

       wil_matpc(spinorRef->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.matpc_type, dagger,

                 inv_param.cpu_prec, gauge_param);

       break;

     case 2:

       wil_mat(spinorRef->V(), hostGauge, spinor->V(), inv_param.kappa, dagger, inv_param.cpu_prec, gauge_param);

       break;

     case 3:

       wil_matpc(spinorTmp->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.matpc_type, dagger,

                 inv_param.cpu_prec, gauge_param);

       wil_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), inv_param.kappa, inv_param.matpc_type, not_dagger,

                 inv_param.cpu_prec, gauge_param);

       break;

     case 4:

       wil_mat(spinorTmp->V(), hostGauge, spinor->V(), inv_param.kappa, dagger, inv_param.cpu_prec, gauge_param);

       wil_mat(spinorRef->V(), hostGauge, spinorTmp->V(), inv_param.kappa, not_dagger, inv_param.cpu_prec, gauge_param);

       break;

     default:

       printfQuda("Test type not defined\n");

       exit(-1);

     }

   } else if((dslash_type == QUDA_TWISTED_MASS_DSLASH) || (dslash_type == QUDA_TWISTED_CLOVER_DSLASH)){

     switch (test_type) {

     case 0:

       if(inv_param.twist_flavor == QUDA_TWIST_PLUS || inv_param.twist_flavor == QUDA_TWIST_MINUS)

         tm_dslash(spinorRef->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor, parity, inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);

       else

       {

         int tm_offset = 12*spinorRef->Volume();


         void *ref1 = spinorRef->V();

         void *ref2 = cpu_prec == sizeof(double) ? (void*)((double*)ref1 + tm_offset): (void*)((float*)ref1 + tm_offset);


         void *flv1 = spinor->V();

         void *flv2 = cpu_prec == sizeof(double) ? (void*)((double*)flv1 + tm_offset): (void*)((float*)flv1 + tm_offset);


         tm_ndeg_dslash(ref1, ref2, hostGauge, flv1, flv2, inv_param.kappa, inv_param.mu, inv_param.epsilon,

                        parity, dagger, inv_param.matpc_type, inv_param.cpu_prec, gauge_param);

       }

       break;

     case 1:

       if(inv_param.twist_flavor == QUDA_TWIST_PLUS || inv_param.twist_flavor == QUDA_TWIST_MINUS)

         tm_matpc(spinorRef->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor, inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);

       else

       {

         int tm_offset = 12*spinorRef->Volume();


         void *ref1 = spinorRef->V();

         void *ref2 = cpu_prec == sizeof(double) ? (void*)((double*)ref1 + tm_offset): (void*)((float*)ref1 + tm_offset);


         void *flv1 = spinor->V();

         void *flv2 = cpu_prec == sizeof(double) ? (void*)((double*)flv1 + tm_offset): (void*)((float*)flv1 + tm_offset);


         tm_ndeg_matpc(ref1, ref2, hostGauge, flv1, flv2, inv_param.kappa, inv_param.mu, inv_param.epsilon, inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);

       }

       break;

     case 2:

       if(inv_param.twist_flavor == QUDA_TWIST_PLUS || inv_param.twist_flavor == QUDA_TWIST_MINUS)

         tm_mat(spinorRef->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor, dagger, inv_param.cpu_prec, gauge_param);

       else

       {

         int tm_offset = 12*spinorRef->Volume();


         void *evenOut = spinorRef->V();

         void *oddOut  = cpu_prec == sizeof(double) ? (void*)((double*)evenOut + tm_offset): (void*)((float*)evenOut + tm_offset);


         void *evenIn = spinor->V();

         void *oddIn  = cpu_prec == sizeof(double) ? (void*)((double*)evenIn + tm_offset): (void*)((float*)evenIn + tm_offset);


         tm_ndeg_mat(evenOut, oddOut, hostGauge, evenIn, oddIn, inv_param.kappa, inv_param.mu, inv_param.epsilon, dagger, inv_param.cpu_prec, gauge_param);

       }

       break;

     case 3:

       if(inv_param.twist_flavor == QUDA_TWIST_PLUS || inv_param.twist_flavor == QUDA_TWIST_MINUS){

         tm_matpc(spinorTmp->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor,

                inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);

         tm_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor,

                inv_param.matpc_type, not_dagger, inv_param.cpu_prec, gauge_param);

       }

       else

       {

         int tm_offset = 12*spinorRef->Volume();


         void *ref1 = spinorRef->V();

         void *ref2 = cpu_prec == sizeof(double) ? (void*)((double*)ref1 + tm_offset): (void*)((float*)ref1 + tm_offset);


         void *flv1 = spinor->V();

         void *flv2 = cpu_prec == sizeof(double) ? (void*)((double*)flv1 + tm_offset): (void*)((float*)flv1 + tm_offset);


         void *tmp1 = spinorTmp->V();

         void *tmp2 = cpu_prec == sizeof(double) ? (void*)((double*)tmp1 + tm_offset): (void*)((float*)tmp1 + tm_offset);


         tm_ndeg_matpc(tmp1, tmp2, hostGauge, flv1, flv2, inv_param.kappa, inv_param.mu, inv_param.epsilon, inv_param.matpc_type, dagger, inv_param.cpu_prec, gauge_param);

         tm_ndeg_matpc(ref1, ref2, hostGauge, tmp1, tmp2, inv_param.kappa, inv_param.mu, inv_param.epsilon, inv_param.matpc_type, not_dagger, inv_param.cpu_prec, gauge_param);

       }

       break;

     case 4:

       if(inv_param.twist_flavor == QUDA_TWIST_PLUS || inv_param.twist_flavor == QUDA_TWIST_MINUS){

         tm_mat(spinorTmp->V(), hostGauge, spinor->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor,

              dagger, inv_param.cpu_prec, gauge_param);

         tm_mat(spinorRef->V(), hostGauge, spinorTmp->V(), inv_param.kappa, inv_param.mu, inv_param.twist_flavor,

              not_dagger, inv_param.cpu_prec, gauge_param);

       }

       else

       {

         int tm_offset = 12*spinorRef->Volume();


         void *evenOut = spinorRef->V();

         void *oddOut  = cpu_prec == sizeof(double) ? (void*)((double*)evenOut + tm_offset): (void*)((float*)evenOut + tm_offset);


         void *evenIn = spinor->V();

         void *oddIn  = cpu_prec == sizeof(double) ? (void*)((double*)evenIn + tm_offset): (void*)((float*)evenIn + tm_offset);


         void *evenTmp = spinorTmp->V();

         void *oddTmp = cpu_prec == sizeof(double) ? (void*)((double*)evenTmp + tm_offset): (void*)((float*)evenTmp + tm_offset);


         tm_ndeg_mat(evenTmp, oddTmp, hostGauge, evenIn, oddIn, inv_param.kappa, inv_param.mu, inv_param.epsilon, dagger, inv_param.cpu_prec, gauge_param);

         tm_ndeg_mat(evenOut, oddOut, hostGauge, evenTmp, oddTmp, inv_param.kappa, inv_param.mu, inv_param.epsilon, not_dagger, inv_param.cpu_prec, gauge_param);

       }

       break;

     default:

       printfQuda("Test type not defined\n");

       exit(-1);

     }

   } else if (dslash_type == QUDA_DOMAIN_WALL_DSLASH ){

     switch (test_type) {

     case 0:

       dw_dslash(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);

       break;

     case 1:

       dw_matpc(spinorRef->V(), hostGauge, spinor->V(), kappa5, inv_param.matpc_type, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);

       break;

     case 2:

       dw_mat(spinorRef->V(), hostGauge, spinor->V(), kappa5, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);

       break;

     case 3:

       dw_matpc(spinorTmp->V(), hostGauge, spinor->V(), kappa5, inv_param.matpc_type, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);

       dw_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), kappa5, inv_param.matpc_type, not_dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);

       break;

     case 4:

       dw_matdagmat(spinorRef->V(), hostGauge, spinor->V(), kappa5, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);

     break;

     default:

       printf("Test type not supported for domain wall\n");

       exit(-1);

     }

   } else if (dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH){

     double *kappa_5 = (double*)malloc(Ls*sizeof(double));

     for(int xs = 0; xs < Ls ; xs++)

       kappa_5[xs] = kappa5;

     switch (test_type) {

     case 0:

       dslash_4_4d(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);

       break;

     case 1:

       dw_dslash_5_4d(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);

       break;

     case 2:

       dslash_5_inv(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, kappa_5);

       break;

     case 3:

       dw_4d_matpc(spinorRef->V(), hostGauge, spinor->V(), kappa5, inv_param.matpc_type, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);

       break;

     case 4:

       dw_4d_matpc(spinorTmp->V(), hostGauge, spinor->V(), kappa5, inv_param.matpc_type, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);

       dw_4d_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), kappa5, inv_param.matpc_type, not_dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);

       break;

     break;

     default:

       printf("Test type not supported for domain wall\n");

       exit(-1);

     }

     free(kappa_5);

   } else if (dslash_type == QUDA_MOBIUS_DWF_DSLASH){

     double *kappa_b, *kappa_c, *kappa_5, *kappa_mdwf;

     kappa_b = (double*)malloc(Lsdim*sizeof(double));

     kappa_c = (double*)malloc(Lsdim*sizeof(double));

     kappa_5 = (double*)malloc(Lsdim*sizeof(double));

     kappa_mdwf = (double*)malloc(Lsdim*sizeof(double));

     for(int xs = 0 ; xs < Lsdim ; xs++)

     {

       kappa_b[xs] = 1.0/(2*(inv_param.b_5[xs]*(4.0 + inv_param.m5) + 1.0));

       kappa_c[xs] = 1.0/(2*(inv_param.c_5[xs]*(4.0 + inv_param.m5) - 1.0));

       kappa_5[xs] = 0.5*kappa_b[xs]/kappa_c[xs];

       kappa_mdwf[xs] = -kappa_5[xs];

     }

     switch (test_type) {

     case 0:

       dslash_4_4d(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass);

       break;

     case 1:

       mdw_dslash_5(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, kappa_5);

       break;

     case 2:

       mdw_dslash_4_pre(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, inv_param.b_5, inv_param.c_5 );

       break;

     case 3:

       dslash_5_inv(spinorRef->V(), hostGauge, spinor->V(), parity, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, kappa_mdwf);

       break;

     case 4:

       mdw_matpc(spinorRef->V(), hostGauge, spinor->V(), kappa_b, kappa_c, inv_param.matpc_type, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, inv_param.b_5, inv_param.c_5);

       break;

     case 5:

       mdw_matpc(spinorTmp->V(), hostGauge, spinor->V(), kappa_b, kappa_c, inv_param.matpc_type, dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, inv_param.b_5, inv_param.c_5);

       mdw_matpc(spinorRef->V(), hostGauge, spinorTmp->V(), kappa_b, kappa_c, inv_param.matpc_type, not_dagger, gauge_param.cpu_prec, gauge_param, inv_param.mass, inv_param.b_5, inv_param.c_5);

       break;

     break;

     default:

       printf("Test type not supported for domain wall\n");

       exit(-1);

     }

     free(kappa_b);

     free(kappa_c);

     free(kappa_5);

     free(kappa_mdwf);

   } else {

     printfQuda("Unsupported dslash_type\n");

     exit(-1);

   }


   printfQuda("done.\n");

 }


 void display_test_info()

 {

   printfQuda("running the following test:\n");


   printfQuda("prec    recon   test_type     matpc_type   dagger   S_dim         T_dimension   Ls_dimension dslash_type    niter\n");

   printfQuda("%6s   %2s       %d           %12s    %d    %3d/%3d/%3d        %3d             %2d   %14s   %d\n",

              get_prec_str(prec), get_recon_str(link_recon),

              test_type, get_matpc_str(matpc_type), dagger, xdim, ydim, zdim, tdim, Lsdim,

              get_dslash_str(dslash_type), niter);

   printfQuda("Grid partition info:     X  Y  Z  T\n");

   printfQuda("                         %d  %d  %d  %d\n",

              dimPartitioned(0),

              dimPartitioned(1),

              dimPartitioned(2),

              dimPartitioned(3));


   return ;


 }


 extern void usage(char**);


 TEST(dslash, verify) {

   double deviation = pow(10, -(double)(cpuColorSpinorField::Compare(*spinorRef, *spinorOut)));

   double tol = (inv_param.cuda_prec == QUDA_DOUBLE_PRECISION ? 1e-12 :

                 (inv_param.cuda_prec == QUDA_SINGLE_PRECISION ? 1e-3 : 1e-1));

   ASSERT_LE(deviation, tol) << "CPU and CUDA implementations do not agree";

 }


 int main(int argc, char **argv)

 {


   for (int i =1;i < argc; i++){

     if(process_command_line_option(argc, argv, &i) == 0){

       continue;

     }


     fprintf(stderr, "ERROR: Invalid option:%s\n", argv[i]);

     usage(argv);

   }


   initComms(argc, argv, gridsize_from_cmdline);


   display_test_info();


   init(argc, argv);


   float spinorGiB = (float)Vh*spinorSiteSize*inv_param.cuda_prec / (1 << 30);

   printfQuda("\nSpinor mem: %.3f GiB\n", spinorGiB);

   printfQuda("Gauge mem: %.3f GiB\n", gauge_param.gaugeGiB);


   int attempts = 1;

   dslashRef();

   for (int i=0; i<attempts; i++) {


     if (tune) { // warm-up run

       printfQuda("Tuning...\n");

       setTuning(QUDA_TUNE_YES);

       dslashCUDA(1);

     }

     printfQuda("Executing %d kernel loops...\n", niter);

     if (!transfer) dirac->Flops();

     double secs = dslashCUDA(niter);

     printfQuda("done.\n\n");


     if (!transfer) *spinorOut = *cudaSpinorOut;


     // print timing information

     printfQuda("%fus per kernel call\n", 1e6*secs / niter);

     //FIXME No flops count for twisted-clover yet

     unsigned long long flops = 0;

     if (!transfer) flops = dirac->Flops();

     int spinor_floats = test_type ? 2*(7*24+24)+24 : 7*24+24;

     if (inv_param.cuda_prec == QUDA_HALF_PRECISION)

       spinor_floats += test_type ? 2*(7*2 + 2) + 2 : 7*2 + 2; // relative size of norm is twice a short

     int gauge_floats = (test_type ? 2 : 1) * (gauge_param.gauge_fix ? 6 : 8) * gauge_param.reconstruct;

     if (dslash_type == QUDA_CLOVER_WILSON_DSLASH) {

       gauge_floats += test_type ? 72*2 : 72;

     }

     printfQuda("GFLOPS = %f\n", 1.0e-9*flops/secs);

     printfQuda("GB/s = %f\n\n",

                (double)Vh*(Ls*spinor_floats+gauge_floats)*inv_param.cuda_prec/((secs/niter)*1e+9));


     double norm2_cpu = norm2(*spinorRef);

     double norm2_cpu_cuda= norm2(*spinorOut);

     if (!transfer) {

       double norm2_cuda= norm2(*cudaSpinorOut);

       printfQuda("Results: CPU = %f, CUDA=%f, CPU-CUDA = %f\n", norm2_cpu, norm2_cuda, norm2_cpu_cuda);

     } else {

       printfQuda("Result: CPU = %f, CPU-QUDA = %f\n",  norm2_cpu, norm2_cpu_cuda);

     }


     if (verify_results) {

       ::testing::InitGoogleTest(&argc, argv);

       if (RUN_ALL_TESTS() != 0) warningQuda("Tests failed");

     }

   }

   end();


   finalizeComms();

 }

gauge_param
QudaGaugeParam gauge_param
Definition: dslash_test.cpp:37

cudaSpinorOut
cudaColorSpinorField * cudaSpinorOut
Definition: dslash_test.cpp:41

quda::DiracDomainWall4DPC::Dslash5
void Dslash5(cudaColorSpinorField &out, const cudaColorSpinorField &in, const QudaParity parity) const
Definition: dirac_domain_wall_4d.cpp:53

invert_quda.h

dimPartitioned
int dimPartitioned(int dim)
Definition: test_util.cpp:1577

QudaInvertParam_s::dirac_order
QudaDiracFieldOrder dirac_order
Definition: quda.h:156

QUDA_VERBOSE
Definition: enum_quda.h:217

QudaGaugeParam_s::reconstruct_sloppy
QudaReconstructType reconstruct_sloppy
Definition: quda.h:46

QudaGaugeParam_s::anisotropy
double anisotropy
Definition: quda.h:31

Vh
__constant__ int Vh
Definition: dslash_constants.h:152

quda::DiracDomainWall4DPC::MdagM
void MdagM(cudaColorSpinorField &out, const cudaColorSpinorField &in) const
Definition: dirac_domain_wall_4d.cpp:148

tdim
int tdim
Definition: test_util.cpp:1556

quda::DiracTwistedCloverPC
Definition: dirac_quda.h:445

quda::DiracParam::tmp1
cudaColorSpinorField * tmp1
Definition: dirac_quda.h:39

dw_dslash_5_4d
void dw_dslash_5_4d(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:1226

QudaInvertParam_s::b_5
double b_5[QUDA_MAX_DWF_LS]
Definition: quda.h:94

QUDA_MAT_SOLUTION
Definition: enum_quda.h:119

dw_4d_matpc
void dw_4d_matpc(void *out, void **gauge, void *in, double kappa, QudaMatPCType matpc_type, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:1357

QUDA_PACKED_CLOVER_ORDER
Definition: enum_quda.h:208

endQuda
void endQuda(void)
Definition: interface_quda.cpp:1018

quda::ColorSpinorParam::PCtype
QudaDWFPCType PCtype
Definition: color_spinor_field.h:27

construct_gauge_field
void construct_gauge_field(void **gauge, int type, QudaPrecision precision, QudaGaugeParam *param)
Definition: test_util.cpp:1003

spinorRef
cpuColorSpinorField * spinorRef
Definition: dslash_test.cpp:40

QUDA_4D_PC
Definition: enum_quda.h:326

QudaPrecision
enum QudaPrecision_s QudaPrecision

V
int V
Definition: test_util.cpp:29

attempts
int attempts
Definition: gauge_force_test.cpp:33

QudaGaugeParam_s::ga_pad
int ga_pad
Definition: quda.h:53

misc.h

ASSERT_LE
#define ASSERT_LE(val1, val2)
Definition: gtest.h:19789

QUDA_MATPC_ODD_ODD
Definition: enum_quda.h:164

dw_setDims
void dw_setDims(int *X, const int L5)
Definition: test_util.cpp:125

spinorTmp
cpuColorSpinorField * spinorTmp
Definition: dslash_test.cpp:40

QudaInvertParam_s::mu
double mu
Definition: quda.h:97

QudaGaugeParam_s::gauge_fix
QudaGaugeFixed gauge_fix
Definition: quda.h:51

quda::norm
__host__ __device__ ValueType norm(const complex< ValueType > &z)
Returns the magnitude of z squared.
Definition: complex_quda.h:859

tm_mat
void tm_mat(void *out, void **gauge, void *in, double kappa, double mu, QudaTwistFlavorType flavor, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:312

quda::DiracMobiusDomainWallPC::Dslash5inv
void Dslash5inv(cudaColorSpinorField &out, const cudaColorSpinorField &in, const QudaParity parity, const double &k) const
Definition: dirac_mobius.cpp:87

tm_dslash
void tm_dslash(void *res, void **gaugeFull, void *spinorField, double kappa, double mu, QudaTwistFlavorType flavor, int oddBit, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:277

quda::ColorSpinorParam::nColor
int nColor
Definition: color_spinor_field.h:16

QUDA_ASQTAD_DSLASH
Definition: enum_quda.h:81

QUDA_TWIST_PLUS
Definition: enum_quda.h:332

QudaGaugeParam_s::type
QudaLinkType type
Definition: quda.h:35

mdw_matpc
void mdw_matpc(void *out, void **gauge, void *in, double *kappa_b, double *kappa_c, QudaMatPCType matpc_type, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, double *b5, double *c5)
Definition: domain_wall_dslash_reference.cpp:1393

QudaInvertParam_s::kappa
double kappa
Definition: quda.h:89

MatDagMatQuda
void MatDagMatQuda(void *h_out, void *h_in, QudaInvertParam *inv_param)
Definition: interface_quda.cpp:1643

xdim
int xdim
Definition: test_util.cpp:1553

quda::DiracMobiusDomainWallPC::MdagM
void MdagM(cudaColorSpinorField &out, const cudaColorSpinorField &in) const
Definition: dirac_mobius.cpp:201

errorQuda
#define errorQuda(...)
Definition: util_quda.h:73

QudaInvertParam_s::dslash_type
QudaDslashType dslash_type
Definition: quda.h:85

QUDA_GAUGE_FIXED_NO
Definition: enum_quda.h:65

quda::DiracMobiusDomainWallPC::M
void M(cudaColorSpinorField &out, const cudaColorSpinorField &in) const
Definition: dirac_mobius.cpp:138

test_util.h

QudaInvertParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:152

QudaInvertParam_s::c_5
double c_5[QUDA_MAX_DWF_LS]
Definition: quda.h:95

cloverSiteSize
#define cloverSiteSize
Definition: test_util.h:8

setDims
void setDims(int *)
Definition: test_util.cpp:88

QUDA_SPACE_SPIN_COLOR_FIELD_ORDER
Definition: enum_quda.h:295

QUDA_HALF_PRECISION
Definition: enum_quda.h:48

QUDA_QDP_GAUGE_ORDER
Definition: enum_quda.h:32

loadGaugeQuda
void loadGaugeQuda(void *h_gauge, QudaGaugeParam *param)
Definition: interface_quda.cpp:452

QUDA_WILSON_LINKS
Definition: enum_quda.h:20

kernel_pack_t
bool kernel_pack_t
Definition: test_util.cpp:1571

QudaInvertParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:151

ydim
int ydim
Definition: test_util.cpp:1554

process_command_line_option
int process_command_line_option(int argc, char **argv, int *idx)
Definition: test_util.cpp:1635

quda::cpuColorSpinorField::Source
void Source(const QudaSourceType sourceType, const int st=0, const int s=0, const int c=0)
Definition: cpu_color_spinor_field.cpp:176

tmp1
cudaColorSpinorField * tmp1
Definition: dslash_test.cpp:41

QUDA_FULL_SITE_SUBSET
Definition: enum_quda.h:277

tm_ndeg_mat
void tm_ndeg_mat(void *evenOut, void *oddOut, void **gauge, void *evenIn, void *oddIn, double kappa, double mu, double epsilon, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:556

quda::LatticeFieldParam::precision
QudaPrecision precision
Definition: lattice_field.h:41

gaugeSiteSize
#define gaugeSiteSize
Definition: fat_force_quda.h:11

gauge_qio.h

QudaInvertParam_s::dagger
QudaDagType dagger
Definition: quda.h:145

dirac_mdwf
DiracMobiusDomainWallPC * dirac_mdwf
Definition: dslash_test.cpp:46

get_matpc_str
const char * get_matpc_str(QudaMatPCType type)
Definition: misc.cpp:920

finalizeComms
void finalizeComms()
Definition: test_util.cpp:65

quda::cudaColorSpinorField
Definition: color_spinor_field.h:302

test_type
int test_type
Definition: test_util.cpp:1564

quda::DiracDomainWall4DPC::Dslash5inv
void Dslash5inv(cudaColorSpinorField &out, const cudaColorSpinorField &in, const QudaParity parity, const double &k) const
Definition: dirac_domain_wall_4d.cpp:70

dw_dslash
void dw_dslash(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:1068

QudaGaugeParam_s::gauge_order
QudaGaugeFieldOrder gauge_order
Definition: quda.h:36

dw_mat
void dw_mat(void *out, void **gauge, void *in, double kappa, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:1279

util_quda.h

dslashCUDA
double dslashCUDA(int niter)
Definition: dslash_test.cpp:457

spinor
cpuColorSpinorField * spinor
Definition: dslash_test.cpp:40

tm_matpc
void tm_matpc(void *outEven, void **gauge, void *inEven, double kappa, double mu, QudaTwistFlavorType flavor, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:361

QUDA_TWIST_NONDEG_DOUBLET
Definition: enum_quda.h:333

get_prec_str
const char * get_prec_str(QudaPrecision prec)
Definition: misc.cpp:658

TEST
TEST(dslash, verify)
Definition: dslash_test.cpp:874

loadCloverQuda
void loadCloverQuda(void *h_clover, void *h_clovinv, QudaInvertParam *inv_param)
Definition: interface_quda.cpp:659

cpu_prec
QudaPrecision cpu_prec
Definition: dslash_test.cpp:34

QUDA_UKQCD_GAMMA_BASIS
Definition: enum_quda.h:312

gtest.h

spinorSiteSize
#define spinorSiteSize
Definition: interface_quda.cpp:54

quda::LatticeFieldParam::siteSubset
QudaSiteSubset siteSubset
Definition: lattice_field.h:42

QudaInvertParam_s::clover_cuda_prec_sloppy
QudaPrecision clover_cuda_prec_sloppy
Definition: quda.h:163

dslashQuda
void dslashQuda(void *h_out, void *h_in, QudaInvertParam *inv_param, QudaParity parity)
Definition: interface_quda.cpp:1329

QudaInvertParam_s::input_location
QudaFieldLocation input_location
Definition: quda.h:82

dagger
QudaDagType dagger
Definition: test_util.cpp:1558

dirac_quda.h

gridsize_from_cmdline
int gridsize_from_cmdline[]
Definition: test_util.cpp:1559

Ls
int Ls
Definition: test_util.cpp:40

xs
int xs
Definition: dw_dslash4_core.h:188

quda::setDiracParam
void setDiracParam(DiracParam &diracParam, QudaInvertParam *inv_param, bool pc)
Definition: interface_quda.cpp:1102

QudaInvertParam_s::solution_type
QudaSolutionType solution_type
Definition: quda.h:142

main
int main(int argc, char **argv)
Definition: dslash_test.cpp:881

QUDA_MATPC_SOLUTION
Definition: enum_quda.h:121

QUDA_TUNE_YES
Definition: enum_quda.h:224

dslashQuda_4dpc
void dslashQuda_4dpc(void *h_out, void *h_in, QudaInvertParam *inv_param, QudaParity parity, int test_type)
Definition: interface_quda.cpp:1411

quda::Dirac::Dslash
virtual void Dslash(cudaColorSpinorField &out, const cudaColorSpinorField &in, const QudaParity parity) const =0

quda::LatticeFieldParam::x
int x[QUDA_MAX_DIM]
Definition: lattice_field.h:38

QudaInvertParam_s::clover_cuda_prec
QudaPrecision clover_cuda_prec
Definition: quda.h:162

quda::DiracParam
Definition: dirac_quda.h:18

tune
bool tune
Definition: test_util.cpp:1562

dw_matdagmat
void dw_matdagmat(void *out, void **gauge, void *in, double kappa, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:1325

setTuning
void setTuning(QudaTune tune)
Definition: util_quda.cpp:33

initQuda
void initQuda(int device)
Definition: interface_quda.cpp:428

dw_matpc
void dw_matpc(void *out, void **gauge, void *in, double kappa, QudaMatPCType matpc_type, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:1336

tmp2
cudaColorSpinorField * tmp2
Definition: dslash_test.cpp:41

quda::DiracMobiusDomainWallPC::Dslash4
void Dslash4(cudaColorSpinorField &out, const cudaColorSpinorField &in, const QudaParity parity) const
Definition: dirac_mobius.cpp:39

quda::DiracMobiusDomainWallPC::Dslash5
void Dslash5(cudaColorSpinorField &out, const cudaColorSpinorField &in, const QudaParity parity) const
Definition: dirac_mobius.cpp:70

quda::DiracDomainWall4DPC::M
void M(cudaColorSpinorField &out, const cudaColorSpinorField &in) const
Definition: dirac_domain_wall_4d.cpp:122

QUDA_EVEN_ODD_SITE_ORDER
Definition: enum_quda.h:285

QudaInvertParam_s::output_location
QudaFieldLocation output_location
Definition: quda.h:83

QudaInvertParam_s::m5
double m5
Definition: quda.h:91

QudaGaugeParam_s
Definition: quda.h:25

quda::ColorSpinorParam::fieldOrder
QudaFieldOrder fieldOrder
Definition: color_spinor_field.h:23

latfile
char latfile[]
Definition: test_util.cpp:1561

quda::Dirac::Flops
unsigned long long Flops() const
Definition: dirac_quda.h:136

setSpinorSiteSize
void setSpinorSiteSize(int n)
Definition: test_util.cpp:150

transfer
const int transfer
Definition: dslash_test.cpp:30

csParam
ColorSpinorParam csParam
Definition: pack_test.cpp:24

newQudaInvertParam
QudaInvertParam newQudaInvertParam(void)

get_recon_str
const char * get_recon_str(QudaReconstructType recon)
Definition: misc.cpp:724

QudaInvertParam_s::clover_order
QudaCloverFieldOrder clover_order
Definition: quda.h:166

testing::InitGoogleTest
GTEST_API_ void InitGoogleTest(int *argc, char **argv)

QudaMatPCType
enum QudaMatPCType_s QudaMatPCType

quda::ColorSpinorParam::gammaBasis
QudaGammaBasis gammaBasis
Definition: color_spinor_field.h:24

dirac_4dpc
DiracDomainWall4DPC * dirac_4dpc
Definition: dslash_test.cpp:47

MAX
#define MAX(a, b)
Definition: dslash_test.cpp:25

QUDA_CLOVER_WILSON_DSLASH
Definition: enum_quda.h:76

hostGauge
void * hostGauge[4]
Definition: dslash_test.cpp:43

quda::Dirac::MdagM
virtual void MdagM(cudaColorSpinorField &out, const cudaColorSpinorField &in) const =0

warningQuda
#define warningQuda(...)
Definition: util_quda.h:84

quda::DiracParam::tmp2
cudaColorSpinorField * tmp2
Definition: dirac_quda.h:40

niter
int niter
Definition: test_util.cpp:1563

quda::pow
__host__ __device__ ValueType pow(ValueType x, ExponentType e)
Definition: complex_quda.h:100

QUDA_PARITY_SITE_SUBSET
Definition: enum_quda.h:278

QudaInvertParam_s::gamma_basis
QudaGammaBasis gamma_basis
Definition: quda.h:158

QUDA_FLOAT2_FIELD_ORDER
Definition: enum_quda.h:293

dslash_type
QudaDslashType dslash_type
Definition: test_util.cpp:1560

QudaGaugeParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:45

dirac
Dirac * dirac
Definition: dslash_test.cpp:45

get_dslash_str
const char * get_dslash_str(QudaDslashType type)
Definition: misc.cpp:814

verify_results
bool verify_results
Definition: test_util.cpp:1568

dslash_util.h

hostClover
void * hostClover
Definition: dslash_test.cpp:43

tm_ndeg_matpc
void tm_ndeg_matpc(void *outEven1, void *outEven2, void **gauge, void *inEven1, void *inEven2, double kappa, double mu, double epsilon, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:482

QudaDagType
enum QudaDagType_s QudaDagType

QudaParity
enum QudaParity_s QudaParity

device
int device
Definition: test_util.cpp:1546

QudaGaugeParam_s::reconstruct
QudaReconstructType reconstruct
Definition: quda.h:43

read_gauge_field
void read_gauge_field(char *filename, void *gauge[], QudaPrecision precision, int *X, int argc, char *argv[])
Definition: gauge_qio.cpp:86

QudaGaugeParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:42

QudaGaugeParam_s::X
int X[4]
Definition: quda.h:29

quda::DiracDomainWall4DPC
Definition: dirac_quda.h:298

QudaInvertParam_s::mass
double mass
Definition: quda.h:88

mdw_dslash_5
void mdw_dslash_5(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, double *kappa)
Definition: domain_wall_dslash_reference.cpp:1244

twist_flavor
QudaTwistFlavorType twist_flavor
Definition: test_util.cpp:1570

display_test_info
void display_test_info()
Definition: dslash_test.cpp:852

QUDA_TWISTED_CLOVER_DSLASH
Definition: enum_quda.h:83

quda::LatticeFieldParam::nDim
int nDim
Definition: lattice_field.h:37

quda::cpuColorSpinorField::Compare
static int Compare(const cpuColorSpinorField &a, const cpuColorSpinorField &b, const int resolution=1)
Definition: cpu_color_spinor_field.cpp:180

QudaInvertParam_s::sp_pad
int sp_pad
Definition: quda.h:176

quda::DiracDomainWall4DPC::Dslash4
void Dslash4(cudaColorSpinorField &out, const cudaColorSpinorField &in, const QudaParity parity) const
Definition: dirac_domain_wall_4d.cpp:39

QUDA_WILSON_DSLASH
Definition: enum_quda.h:75

tm_ndeg_dslash
void tm_ndeg_dslash(void *res1, void *res2, void **gauge, void *spinorField1, void *spinorField2, double kappa, double mu, double epsilon, int oddBit, int daggerBit, QudaMatPCType matpc_type, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:467

quda::DiracMobiusDomainWallPC::Dslash4pre
void Dslash4pre(cudaColorSpinorField &out, const cudaColorSpinorField &in, const QudaParity parity) const
Definition: dirac_mobius.cpp:53

quda::DiracMobiusDomainWallPC
Definition: dirac_quda.h:328

blas_quda.h

cuda_prec
QudaPrecision cuda_prec
Definition: dslash_test.cpp:35

construct_clover_field
void construct_clover_field(void *clover, double norm, double diag, QudaPrecision precision)
Definition: test_util.cpp:1103

quda::ColorSpinorParam
Definition: color_spinor_field.h:14

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:50

inv_param
QudaInvertParam inv_param
Definition: dslash_test.cpp:38

wil_mat
void wil_mat(void *out, void **gauge, void *in, double kappa, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:296

QudaGaugeParam_s::gaugeGiB
double gaugeGiB
Definition: quda.h:60

mdw_dslash_4_pre
void mdw_dslash_4_pre(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, double *b5, double *c5)
Definition: domain_wall_dslash_reference.cpp:1261

QUDA_TWISTED_MASS_DSLASH
Definition: enum_quda.h:82

QUDA_STAGGERED_DSLASH
Definition: enum_quda.h:80

if
if(x2 >=X2) return

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:49

prec
QudaPrecision prec
Definition: test_util.cpp:1551

QUDA_5D_PC
Definition: enum_quda.h:325

quda::ColorSpinorParam::nSpin
int nSpin
Definition: color_spinor_field.h:17

QudaReconstructType
enum QudaReconstructType_s QudaReconstructType

quda.h
Main header file for the QUDA library.

spinorOut
cpuColorSpinorField * spinorOut
Definition: dslash_test.cpp:40

quda::Dirac::M
virtual void M(cudaColorSpinorField &out, const cudaColorSpinorField &in) const =0

QUDA_DEGRAND_ROSSI_GAMMA_BASIS
Definition: enum_quda.h:311

dslash_quda.h

MatQuda
void MatQuda(void *h_out, void *h_in, QudaInvertParam *inv_param)
Definition: interface_quda.cpp:1567

QudaInvertParam_s::Ls
int Ls
Definition: quda.h:92

printfQuda
#define printfQuda(...)
Definition: util_quda.h:67

QudaGaugeParam_s::t_boundary
QudaTboundary t_boundary
Definition: quda.h:38

QudaInvertParam_s::twist_flavor
QudaTwistFlavorType twist_flavor
Definition: quda.h:100

dslash_4_4d
void dslash_4_4d(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:1149

quda::ColorSpinorParam::twistFlavor
QudaTwistFlavorType twistFlavor
Definition: color_spinor_field.h:19

quda::ColorSpinorParam::siteOrder
QudaSiteOrder siteOrder
Definition: color_spinor_field.h:21

QUDA_DIRAC_ORDER
Definition: enum_quda.h:196

quda::ColorSpinorField::Volume
int Volume() const
Definition: color_spinor_field.h:253

Lsdim
int Lsdim
Definition: test_util.cpp:1557

RUN_ALL_TESTS
int RUN_ALL_TESTS() GTEST_MUST_USE_RESULT_
Definition: gtest.h:20057

not_dagger
QudaDagType not_dagger
Definition: dslash_test.cpp:71

matpc_type
QudaMatPCType matpc_type
Definition: test_util.cpp:1573

QudaDslashType
enum QudaDslashType_s QudaDslashType

QUDA_ANTI_PERIODIC_T
Definition: enum_quda.h:42

QUDA_RANDOM_SOURCE
Definition: enum_quda.h:319

domain_wall_dslash_reference.h

quda::setKernelPackT
void setKernelPackT(bool pack)
Definition: dslash_quda.cu:82

usage
void usage(char **)
Definition: test_util.cpp:1584

QudaInvertParam_s::cl_pad
int cl_pad
Definition: quda.h:177

link_recon
QudaReconstructType link_recon
Definition: test_util.cpp:1549

wil_matpc
void wil_matpc(void *outEven, void **gauge, void *inEven, double kappa, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:336

QUDA_EVEN_PARITY
Definition: enum_quda.h:239

init
void init(int argc, char **argv)
Definition: dslash_test.cpp:79

QUDA_MATDAG_MAT_SOLUTION
Definition: enum_quda.h:120

dslashRef
void dslashRef()
Definition: dslash_test.cpp:616

return
return
Definition: hisq_paths_force_core.h:380

wilson_dslash_reference.h

QudaInvertParam_s::epsilon
double epsilon
Definition: quda.h:98

wil_dslash
void wil_dslash(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:175

QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:304

quda::Dirac::create
static Dirac * create(const DiracParam &param)
Definition: dirac.cpp:134

QUDA_DOMAIN_WALL_DSLASH
Definition: enum_quda.h:77

QUDA_FLOAT4_FIELD_ORDER
Definition: enum_quda.h:294

quda::ColorSpinorParam::create
QudaFieldCreate create
Definition: color_spinor_field.h:25

zdim
int zdim
Definition: test_util.cpp:1555

QUDA_MATPCDAG_MATPC_SOLUTION
Definition: enum_quda.h:123

QUDA_MATPC_EVEN_EVEN
Definition: enum_quda.h:163

quda::norm2
double norm2(const ColorSpinorField &)
Definition: color_spinor_field.cpp:486

QudaInvertParam_s::clover_cpu_prec
QudaPrecision clover_cpu_prec
Definition: quda.h:161

QUDA_TWIST_MINUS
Definition: enum_quda.h:331

cudaSpinor
cudaColorSpinorField * cudaSpinor
Definition: dslash_test.cpp:41

QudaInvertParam_s
Definition: quda.h:80

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:270

hostCloverInv
void * hostCloverInv
Definition: dslash_test.cpp:43

initComms
void initComms(int argc, char **argv, const int *commDims)
Definition: test_util.cpp:48

parity
const QudaParity parity
Definition: dslash_test.cpp:29

setVerbosity
void setVerbosity(const QudaVerbosity verbosity)
Definition: util_quda.cpp:24

QudaInvertParam_s::matpc_type
QudaMatPCType matpc_type
Definition: quda.h:144

dslashQuda_mdwf
void dslashQuda_mdwf(void *h_out, void *h_in, QudaInvertParam *inv_param, QudaParity parity, int test_type)
Definition: interface_quda.cpp:1487

QUDA_DOMAIN_WALL_4D_DSLASH
Definition: enum_quda.h:78

dslash_5_inv
void dslash_5_inv(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, double *kappa)
Definition: domain_wall_dslash_reference.cpp:1235

kappa5
double kappa5
Definition: dslash_test.cpp:32

quda::cpuColorSpinorField
Definition: color_spinor_field.h:517

end
void end()
Definition: dslash_test.cpp:428

QudaGaugeParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:40

quda::ColorSpinorField::V
void * V()
Definition: color_spinor_field.h:262

quda::Dirac
Definition: dirac_quda.h:79

newQudaGaugeParam
QudaGaugeParam newQudaGaugeParam(void)

quda_internal.h

quda::LatticeFieldParam::pad
int pad
Definition: lattice_field.h:39

QudaInvertParam_s::clover_coeff
double clover_coeff
Definition: quda.h:169

QUDA_MOBIUS_DWF_DSLASH
Definition: enum_quda.h:79

QudaTwistFlavorType
enum QudaTwistFlavorType_s QudaTwistFlavorType