quda-ref/v0.7.0/staggered__invert__test_8cpp_source.html

 #include <stdlib.h>

 #include <stdio.h>

 #include <time.h>

 #include <math.h>


 #include <test_util.h>

 #include <dslash_util.h>

 #include <blas_reference.h>

 #include <staggered_dslash_reference.h>

 #include <quda.h>

 #include <string.h>

 #include <face_quda.h>

 #include "misc.h"

 #include <gauge_field.h>

 #include <blas_quda.h>


 #if defined(QMP_COMMS)

 #include <qmp.h>

 #elif defined(MPI_COMMS)

 #include <mpi.h>

 #endif


 #ifdef MULTI_GPU

 #include <face_quda.h>

 #endif


 #define MAX(a,b) ((a)>(b)?(a):(b))

 #define mySpinorSiteSize 6


 extern void usage(char** argv);

 void *qdp_fatlink[4];

 void *qdp_longlink[4];


 void *fatlink;

 void *longlink;


 #ifdef MULTI_GPU

 void** ghost_fatlink, **ghost_longlink;

 #endif


 extern int device;

 extern bool tune;


 extern QudaReconstructType link_recon;

 extern QudaPrecision prec;

 QudaPrecision cpu_prec = QUDA_DOUBLE_PRECISION;


 extern QudaReconstructType link_recon_sloppy;

 extern QudaPrecision  prec_sloppy;

 cpuColorSpinorField* in;

 cpuColorSpinorField* out;

 cpuColorSpinorField* ref;

 cpuColorSpinorField* tmp;


 cpuGaugeField *cpuFat = NULL;

 cpuGaugeField *cpuLong = NULL;


 static double tol = 1e-7;


 extern int test_type;

 extern int xdim;

 extern int ydim;

 extern int zdim;

 extern int tdim;

 extern int gridsize_from_cmdline[];


 // Dirac operator type

 extern QudaDslashType dslash_type;


 extern QudaInverterType inv_type;

 extern double mass; // the mass of the Dirac operator


 static void end();


 template<typename Float>

 void constructSpinorField(Float *res) {

   for(int i = 0; i < Vh; i++) {

     for (int s = 0; s < 1; s++) {

       for (int m = 0; m < 3; m++) {

         res[i*(1*3*2) + s*(3*2) + m*(2) + 0] = rand() / (Float)RAND_MAX;

         res[i*(1*3*2) + s*(3*2) + m*(2) + 1] = rand() / (Float)RAND_MAX;

       }

     }

   }

 }


 static void

 set_params(QudaGaugeParam* gaugeParam, QudaInvertParam* inv_param,

     int X1, int  X2, int X3, int X4,

     QudaPrecision cpu_prec, QudaPrecision prec, QudaPrecision prec_sloppy,

     QudaReconstructType link_recon, QudaReconstructType link_recon_sloppy,

     double mass, double tol, int maxiter, double reliable_delta,

     double tadpole_coeff

     )

 {

   gaugeParam->X[0] = X1;

   gaugeParam->X[1] = X2;

   gaugeParam->X[2] = X3;

   gaugeParam->X[3] = X4;


   gaugeParam->cpu_prec = cpu_prec;

   gaugeParam->cuda_prec = prec;

   gaugeParam->reconstruct = link_recon;

   gaugeParam->cuda_prec_sloppy = prec_sloppy;

   gaugeParam->reconstruct_sloppy = link_recon_sloppy;

   gaugeParam->gauge_fix = QUDA_GAUGE_FIXED_NO;

   gaugeParam->anisotropy = 1.0;

   gaugeParam->tadpole_coeff = tadpole_coeff;

   gaugeParam->scale = -1.0/(24.0*tadpole_coeff*tadpole_coeff);


   gaugeParam->t_boundary = QUDA_ANTI_PERIODIC_T;

   gaugeParam->gauge_order = QUDA_MILC_GAUGE_ORDER;

   gaugeParam->ga_pad = X1*X2*X3/2;


   inv_param->verbosity = QUDA_VERBOSE;

   inv_param->mass = mass;


   // outer solver parameters

   inv_param->inv_type = inv_type;

   inv_param->tol = tol;

   inv_param->tol_restart = 1e-3; //now theoretical background for this parameter...

   inv_param->maxiter = 500000;

   inv_param->reliable_delta = 1e-1;

   inv_param->use_sloppy_partial_accumulator = false;

   inv_param->pipeline = false;


 #if __COMPUTE_CAPABILITY__ >= 200

   // require both L2 relative and heavy quark residual to determine convergence

   inv_param->residual_type = static_cast<QudaResidualType>(QUDA_L2_RELATIVE_RESIDUAL | QUDA_HEAVY_QUARK_RESIDUAL);

   inv_param->tol_hq = 1e-3; // specify a tolerance for the residual for heavy quark residual

 #else

   // Pre Fermi architecture only supports L2 relative residual norm

   inv_param->residual_type = QUDA_L2_RELATIVE_RESIDUAL;

 #endif

   inv_param->residual_type = QUDA_L2_RELATIVE_RESIDUAL;


   inv_param->Nsteps = 2;


   //inv_param->inv_type = QUDA_GCR_INVERTER;

   //inv_param->gcrNkrylov = 10;


   // domain decomposition preconditioner parameters

   inv_param->inv_type_precondition = QUDA_SD_INVERTER;

   inv_param->tol_precondition = 1e-1;

   inv_param->maxiter_precondition = 10;

   inv_param->verbosity_precondition = QUDA_SILENT;

   inv_param->cuda_prec_precondition = QUDA_HALF_PRECISION;


   inv_param->solution_type = QUDA_MATPCDAG_MATPC_SOLUTION;

   inv_param->solve_type = QUDA_NORMOP_PC_SOLVE;

   inv_param->matpc_type = QUDA_MATPC_EVEN_EVEN;

   inv_param->dagger = QUDA_DAG_NO;

   inv_param->mass_normalization = QUDA_MASS_NORMALIZATION;


   inv_param->cpu_prec = cpu_prec;

   inv_param->cuda_prec = prec;

   inv_param->cuda_prec_sloppy = prec_sloppy;

   inv_param->preserve_source = QUDA_PRESERVE_SOURCE_YES;

   inv_param->gamma_basis = QUDA_DEGRAND_ROSSI_GAMMA_BASIS; // this is meaningless, but must be thus set

   inv_param->dirac_order = QUDA_DIRAC_ORDER;


   if (dslash_type != QUDA_ASQTAD_DSLASH && dslash_type != QUDA_STAGGERED_DSLASH)

     dslash_type = QUDA_STAGGERED_DSLASH;

   inv_param->dslash_type = dslash_type;


   inv_param->tune = tune ? QUDA_TUNE_YES : QUDA_TUNE_NO;

   inv_param->sp_pad = X1*X2*X3/2;

   inv_param->use_init_guess = QUDA_USE_INIT_GUESS_YES;


   inv_param->input_location = QUDA_CPU_FIELD_LOCATION;

   inv_param->output_location = QUDA_CPU_FIELD_LOCATION;

 }


   int

 invert_test(void)

 {

   QudaGaugeParam gaugeParam = newQudaGaugeParam();

   QudaInvertParam inv_param = newQudaInvertParam();


   set_params(&gaugeParam, &inv_param,

       xdim, ydim, zdim, tdim,

       cpu_prec, prec, prec_sloppy,

       link_recon, link_recon_sloppy, mass, tol, 500, 1e-3,

       0.8);


   // this must be before the FaceBuffer is created (this is because it allocates pinned memory - FIXME)

   initQuda(device);


   setDims(gaugeParam.X);

   setSpinorSiteSize(6);


   size_t gSize = (gaugeParam.cpu_prec == QUDA_DOUBLE_PRECISION) ? sizeof(double) : sizeof(float);

   for (int dir = 0; dir < 4; dir++) {

     qdp_fatlink[dir] = malloc(V*gaugeSiteSize*gSize);

     qdp_longlink[dir] = malloc(V*gaugeSiteSize*gSize);

   }

   fatlink = malloc(4*V*gaugeSiteSize*gSize);

   longlink = malloc(4*V*gaugeSiteSize*gSize);


   construct_fat_long_gauge_field(qdp_fatlink, qdp_longlink, 1, gaugeParam.cpu_prec,

                                  &gaugeParam, dslash_type);


   const double cos_pi_3 = 0.5; // Cos(pi/3)

   const double sin_pi_3 = sqrt(0.75); // Sin(pi/3)


   for(int dir=0; dir<4; ++dir){

     for(int i=0; i<V; ++i){

       for(int j=0; j<gaugeSiteSize; ++j){

         if(gaugeParam.cpu_prec == QUDA_DOUBLE_PRECISION){

           ((double*)qdp_fatlink[dir])[i*gaugeSiteSize + j] = 0.5*rand()/RAND_MAX;

           if(link_recon != QUDA_RECONSTRUCT_8 && link_recon != QUDA_RECONSTRUCT_12){ // incorporate non-trivial phase into long links

             if(j%2 == 0){

               const double real = ((double*)qdp_longlink[dir])[i*gaugeSiteSize + j];

               const double imag = ((double*)qdp_longlink[dir])[i*gaugeSiteSize + j + 1];

               ((double*)qdp_longlink[dir])[i*gaugeSiteSize + j]     = real*cos_pi_3 - imag*sin_pi_3;

               ((double*)qdp_longlink[dir])[i*gaugeSiteSize + j + 1] = real*sin_pi_3 + imag*cos_pi_3;

             }

           }

           ((double*)fatlink)[(i*4 + dir)*gaugeSiteSize + j] = ((double*)qdp_fatlink[dir])[i*gaugeSiteSize + j];

           ((double*)longlink)[(i*4 + dir)*gaugeSiteSize + j] = ((double*)qdp_longlink[dir])[i*gaugeSiteSize + j];

         }else{

           ((float*)qdp_fatlink[dir])[i] = 0.5*rand()/RAND_MAX;

           if(link_recon != QUDA_RECONSTRUCT_8 && link_recon != QUDA_RECONSTRUCT_12){ // incorporate non-trivial phase into long links

             if(j%2 == 0){

               const float real = ((float*)qdp_longlink[dir])[i*gaugeSiteSize + j];

               const float imag = ((float*)qdp_longlink[dir])[i*gaugeSiteSize + j + 1];

               ((float*)qdp_longlink[dir])[i*gaugeSiteSize + j]     = real*cos_pi_3 - imag*sin_pi_3;

               ((float*)qdp_longlink[dir])[i*gaugeSiteSize + j + 1] = real*sin_pi_3 + imag*cos_pi_3;

             }

           }

           ((double*)fatlink)[(i*4 + dir)*gaugeSiteSize + j] = ((double*)qdp_fatlink[dir])[i*gaugeSiteSize + j];

           ((float*)fatlink)[(i*4 + dir)*gaugeSiteSize + j] = ((float*)qdp_fatlink[dir])[i*gaugeSiteSize + j];

           ((float*)longlink)[(i*4 + dir)*gaugeSiteSize + j] = ((float*)qdp_longlink[dir])[i*gaugeSiteSize + j];

         }

       }

     }

   }


   ColorSpinorParam csParam;

   csParam.nColor=3;

   csParam.nSpin=1;

   csParam.nDim=4;

   for(int d = 0; d < 4; d++) {

     csParam.x[d] = gaugeParam.X[d];

   }

   csParam.x[0] /= 2;


   csParam.precision = inv_param.cpu_prec;

   csParam.pad = 0;

   csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;

   csParam.siteOrder = QUDA_EVEN_ODD_SITE_ORDER;

   csParam.fieldOrder  = QUDA_SPACE_SPIN_COLOR_FIELD_ORDER;

   csParam.gammaBasis = inv_param.gamma_basis;

   csParam.create = QUDA_ZERO_FIELD_CREATE;

   in = new cpuColorSpinorField(csParam);

   out = new cpuColorSpinorField(csParam);

   ref = new cpuColorSpinorField(csParam);

   tmp = new cpuColorSpinorField(csParam);


   if (inv_param.cpu_prec == QUDA_SINGLE_PRECISION){

     constructSpinorField((float*)in->V());

   }else{

     constructSpinorField((double*)in->V());

   }


 #ifdef MULTI_GPU

   int tmp_value = MAX(ydim*zdim*tdim/2, xdim*zdim*tdim/2);

   tmp_value = MAX(tmp_value, xdim*ydim*tdim/2);

   tmp_value = MAX(tmp_value, xdim*ydim*zdim/2);


   int fat_pad = tmp_value;

   int link_pad =  3*tmp_value;


   // FIXME: currently assume staggered is SU(3)

   gaugeParam.type = dslash_type == QUDA_STAGGERED_DSLASH ?

     QUDA_SU3_LINKS : QUDA_ASQTAD_FAT_LINKS;

   gaugeParam.reconstruct = QUDA_RECONSTRUCT_NO;

   GaugeFieldParam cpuFatParam(fatlink, gaugeParam);

   cpuFat = new cpuGaugeField(cpuFatParam);

   ghost_fatlink = (void**)cpuFat->Ghost();


   gaugeParam.type = QUDA_ASQTAD_LONG_LINKS;

   GaugeFieldParam cpuLongParam(longlink, gaugeParam);

   cpuLong = new cpuGaugeField(cpuLongParam);

   ghost_longlink = (void**)cpuLong->Ghost();


   gaugeParam.type = dslash_type == QUDA_STAGGERED_DSLASH ?

     QUDA_SU3_LINKS : QUDA_ASQTAD_FAT_LINKS;

   gaugeParam.ga_pad = fat_pad;

   gaugeParam.reconstruct= gaugeParam.reconstruct_sloppy = QUDA_RECONSTRUCT_NO;

   gaugeParam.cuda_prec_precondition = QUDA_HALF_PRECISION;

   loadGaugeQuda(fatlink, &gaugeParam);


   if (dslash_type == QUDA_ASQTAD_DSLASH) {

     gaugeParam.type = QUDA_ASQTAD_LONG_LINKS;

     gaugeParam.ga_pad = link_pad;

     gaugeParam.reconstruct= link_recon;

     gaugeParam.reconstruct_sloppy = link_recon_sloppy;

     loadGaugeQuda(longlink, &gaugeParam);

   }

 #else

   gaugeParam.type = QUDA_ASQTAD_FAT_LINKS;

   gaugeParam.reconstruct = gaugeParam.reconstruct_sloppy = QUDA_RECONSTRUCT_NO;

   gaugeParam.cuda_prec_precondition = QUDA_HALF_PRECISION;

   loadGaugeQuda(fatlink, &gaugeParam);


   if (dslash_type == QUDA_ASQTAD_DSLASH) {

     gaugeParam.type = QUDA_ASQTAD_LONG_LINKS;

     gaugeParam.reconstruct = link_recon;

     gaugeParam.reconstruct_sloppy = link_recon_sloppy;

     loadGaugeQuda(longlink, &gaugeParam);

   }

 #endif


   double time0 = -((double)clock()); // Start the timer


   double nrm2=0;

   double src2=0;

   int ret = 0;


   switch(test_type){

     case 0: //even

       if(inv_type == QUDA_GCR_INVERTER){

         inv_param.inv_type = QUDA_GCR_INVERTER;

         inv_param.gcrNkrylov = 50;

       }else if(inv_type == QUDA_PCG_INVERTER){

         inv_param.inv_type = QUDA_PCG_INVERTER;

       }

       inv_param.matpc_type = QUDA_MATPC_EVEN_EVEN;


       invertQuda(out->V(), in->V(), &inv_param);


       time0 += clock();

       time0 /= CLOCKS_PER_SEC;


 #ifdef MULTI_GPU

       matdagmat_mg4dir(ref, qdp_fatlink, qdp_longlink, ghost_fatlink, ghost_longlink,

           out, mass, 0, inv_param.cpu_prec, gaugeParam.cpu_prec, tmp, QUDA_EVEN_PARITY);

 #else

       matdagmat(ref->V(), qdp_fatlink, qdp_longlink, out->V(), mass, 0, inv_param.cpu_prec, gaugeParam.cpu_prec, tmp->V(), QUDA_EVEN_PARITY);

 #endif


       mxpy(in->V(), ref->V(), Vh*mySpinorSiteSize, inv_param.cpu_prec);

       nrm2 = norm_2(ref->V(), Vh*mySpinorSiteSize, inv_param.cpu_prec);

       src2 = norm_2(in->V(), Vh*mySpinorSiteSize, inv_param.cpu_prec);


       break;


     case 1: //odd

       if(inv_type == QUDA_GCR_INVERTER){

         inv_param.inv_type = QUDA_GCR_INVERTER;

         inv_param.gcrNkrylov = 50;

       }else if(inv_type == QUDA_PCG_INVERTER){

         inv_param.inv_type = QUDA_PCG_INVERTER;

       }


       inv_param.matpc_type = QUDA_MATPC_ODD_ODD;

       invertQuda(out->V(), in->V(), &inv_param);

       time0 += clock(); // stop the timer

       time0 /= CLOCKS_PER_SEC;


 #ifdef MULTI_GPU

       matdagmat_mg4dir(ref, qdp_fatlink, qdp_longlink, ghost_fatlink, ghost_longlink,

           out, mass, 0, inv_param.cpu_prec, gaugeParam.cpu_prec, tmp, QUDA_ODD_PARITY);

 #else

       matdagmat(ref->V(), qdp_fatlink, qdp_longlink, out->V(), mass, 0, inv_param.cpu_prec, gaugeParam.cpu_prec, tmp->V(), QUDA_ODD_PARITY);

 #endif

       mxpy(in->V(), ref->V(), Vh*mySpinorSiteSize, inv_param.cpu_prec);

       nrm2 = norm_2(ref->V(), Vh*mySpinorSiteSize, inv_param.cpu_prec);

       src2 = norm_2(in->V(), Vh*mySpinorSiteSize, inv_param.cpu_prec);


       break;


     case 2: //full spinor


       errorQuda("full spinor not supported\n");

       break;


     case 3: //multi mass CG, even

     case 4:


 #define NUM_OFFSETS 12


       {

         double masses[NUM_OFFSETS] ={0.002, 0.0021, 0.0064, 0.070, 0.077, 0.081, 0.1, 0.11, 0.12, 0.13, 0.14, 0.205};

         inv_param.num_offset = NUM_OFFSETS;

         // these can be set independently

         for (int i=0; i<inv_param.num_offset; i++) {

           inv_param.tol_offset[i] = inv_param.tol;

           inv_param.tol_hq_offset[i] = inv_param.tol_hq;

         }

         void* outArray[NUM_OFFSETS];

         int len;


         cpuColorSpinorField* spinorOutArray[NUM_OFFSETS];

         spinorOutArray[0] = out;

         for(int i=1;i < inv_param.num_offset; i++){

           spinorOutArray[i] = new cpuColorSpinorField(csParam);

         }


         for(int i=0;i < inv_param.num_offset; i++){

           outArray[i] = spinorOutArray[i]->V();

           inv_param.offset[i] = 4*masses[i]*masses[i];

         }


         len=Vh;


         if (test_type == 3) {

           inv_param.matpc_type = QUDA_MATPC_EVEN_EVEN;

         } else {

           inv_param.matpc_type = QUDA_MATPC_ODD_ODD;

         }


         invertMultiShiftQuda(outArray, in->V(), &inv_param);


         cudaDeviceSynchronize();

         time0 += clock(); // stop the timer

         time0 /= CLOCKS_PER_SEC;


         printfQuda("done: total time = %g secs, compute time = %g, %i iter / %g secs = %g gflops\n",

             time0, inv_param.secs, inv_param.iter, inv_param.secs,

             inv_param.gflops/inv_param.secs);


         printfQuda("checking the solution\n");

         QudaParity parity = QUDA_INVALID_PARITY;

         if (inv_param.solve_type == QUDA_NORMOP_SOLVE){

           //parity = QUDA_EVENODD_PARITY;

           errorQuda("full parity not supported\n");

         }else if (inv_param.matpc_type == QUDA_MATPC_EVEN_EVEN){

           parity = QUDA_EVEN_PARITY;

         }else if (inv_param.matpc_type == QUDA_MATPC_ODD_ODD){

           parity = QUDA_ODD_PARITY;

         }else{

           errorQuda("ERROR: invalid spinor parity \n");

           exit(1);

         }

         for(int i=0;i < inv_param.num_offset;i++){

           printfQuda("%dth solution: mass=%f, ", i, masses[i]);

 #ifdef MULTI_GPU

           matdagmat_mg4dir(ref, qdp_fatlink, qdp_longlink, ghost_fatlink, ghost_longlink,

               spinorOutArray[i], masses[i], 0, inv_param.cpu_prec,

               gaugeParam.cpu_prec, tmp, parity);

 #else

           matdagmat(ref->V(), qdp_fatlink, qdp_longlink, outArray[i], masses[i], 0, inv_param.cpu_prec, gaugeParam.cpu_prec, tmp->V(), parity);

 #endif

           mxpy(in->V(), ref->V(), len*mySpinorSiteSize, inv_param.cpu_prec);

           double nrm2 = norm_2(ref->V(), len*mySpinorSiteSize, inv_param.cpu_prec);

           double src2 = norm_2(in->V(), len*mySpinorSiteSize, inv_param.cpu_prec);

           double hqr = sqrt(HeavyQuarkResidualNormCpu(*spinorOutArray[i], *ref).z);

           double l2r = sqrt(nrm2/src2);


           printfQuda("Shift %d residuals: (L2 relative) tol %g, QUDA = %g, host = %g; (heavy-quark) tol %g, QUDA = %g, host = %g\n",

               i, inv_param.tol_offset[i], inv_param.true_res_offset[i], l2r,

               inv_param.tol_hq_offset[i], inv_param.true_res_hq_offset[i], hqr);


           //emperical, if the cpu residue is more than 1 order the target accuracy, the it fails to converge

           if (sqrt(nrm2/src2) > 10*inv_param.tol_offset[i]){

             ret |=1;

           }

         }


         for(int i=1; i < inv_param.num_offset;i++) delete spinorOutArray[i];

       }

       break;


     default:

       errorQuda("Unsupported test type");


   }//switch


   if (test_type <=2){


     double hqr = sqrt(HeavyQuarkResidualNormCpu(*out, *ref).z);

     double l2r = sqrt(nrm2/src2);


     printfQuda("Residuals: (L2 relative) tol %g, QUDA = %g, host = %g; (heavy-quark) tol %g, QUDA = %g, host = %g\n",

         inv_param.tol, inv_param.true_res, l2r, inv_param.tol_hq, inv_param.true_res_hq, hqr);


     printfQuda("done: total time = %g secs, compute time = %g secs, %i iter / %g secs = %g gflops, \n",

         time0, inv_param.secs, inv_param.iter, inv_param.secs,

         inv_param.gflops/inv_param.secs);

   }


   end();

   return ret;

 }


   static void

 end(void)

 {

   for(int i=0;i < 4;i++){

     free(qdp_fatlink[i]);

     free(qdp_longlink[i]);

   }


   free(fatlink);

   free(longlink);


   delete in;

   delete out;

   delete ref;

   delete tmp;


   if (cpuFat) delete cpuFat;

   if (cpuLong) delete cpuLong;


   endQuda();

 }


   void

 display_test_info()

 {

   printfQuda("running the following test:\n");


   printfQuda("prec    sloppy_prec    link_recon  sloppy_link_recon test_type  S_dimension T_dimension\n");

   printfQuda("%s   %s             %s            %s            %s         %d/%d/%d          %d \n",

       get_prec_str(prec),get_prec_str(prec_sloppy),

       get_recon_str(link_recon),

       get_recon_str(link_recon_sloppy), get_test_type(test_type), xdim, ydim, zdim, tdim);


   printfQuda("Grid partition info:     X  Y  Z  T\n");

   printfQuda("                         %d  %d  %d  %d\n",

       dimPartitioned(0),

       dimPartitioned(1),

       dimPartitioned(2),

       dimPartitioned(3));


   return ;


 }


   void

 usage_extra(char** argv )

 {

   printfQuda("Extra options:\n");

   printfQuda("    --tol  <resid_tol>                       # Set residual tolerance\n");

   printfQuda("    --test <0/1>                             # Test method\n");

   printfQuda("                                                0: Even even spinor CG inverter\n");

   printfQuda("                                                1: Odd odd spinor CG inverter\n");

   printfQuda("                                                3: Even even spinor multishift CG inverter\n");

   printfQuda("                                                4: Odd odd spinor multishift CG inverter\n");

   printfQuda("    --cpu_prec <double/single/half>          # Set CPU precision\n");


   return ;

 }

 int main(int argc, char** argv)

 {

   for (int i = 1; i < argc; i++) {


     if(process_command_line_option(argc, argv, &i) == 0){

       continue;

     }


     if( strcmp(argv[i], "--tol") == 0){

       float tmpf;

       if (i+1 >= argc){

         usage(argv);

       }

       sscanf(argv[i+1], "%f", &tmpf);

       if (tmpf <= 0){

         printf("ERROR: invalid tol(%f)\n", tmpf);

         usage(argv);

       }

       tol = tmpf;

       i++;

       continue;

     }


     if( strcmp(argv[i], "--cpu_prec") == 0){

       if (i+1 >= argc){

         usage(argv);

       }

       cpu_prec= get_prec(argv[i+1]);

       i++;

       continue;

     }


     printf("ERROR: Invalid option:%s\n", argv[i]);

     usage(argv);

   }


   if (prec_sloppy == QUDA_INVALID_PRECISION){

     prec_sloppy = prec;

   }

   if (link_recon_sloppy == QUDA_RECONSTRUCT_INVALID){

     link_recon_sloppy = link_recon;

   }


   if(inv_type != QUDA_CG_INVERTER){

     if(test_type != 0 && test_type != 1) errorQuda("Preconditioning is currently not supported in multi-shift solver solvers");

   }


   // initialize QMP/MPI, QUDA comms grid and RNG (test_util.cpp)

   initComms(argc, argv, gridsize_from_cmdline);


   display_test_info();


   printfQuda("dslash_type = %d\n", dslash_type);


   int ret = invert_test();


   // finalize the communications layer

   finalizeComms();


   return ret;

 }

QudaInvertParam_s::maxiter_precondition
int maxiter_precondition
Definition: quda.h:216

QUDA_TUNE_NO
Definition: enum_quda.h:223

zdim
int zdim
Definition: test_util.cpp:1555

QudaInvertParam_s::secs
double secs
Definition: quda.h:183

dimPartitioned
int dimPartitioned(int dim)
Definition: test_util.cpp:1577

QudaInvertParam_s::dirac_order
QudaDiracFieldOrder dirac_order
Definition: quda.h:156

QUDA_VERBOSE
Definition: enum_quda.h:217

QudaInvertParam_s::mass_normalization
QudaMassNormalization mass_normalization
Definition: quda.h:146

QudaInvertParam_s::tol_hq_offset
double tol_hq_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:134

QudaInvertParam_s::Nsteps
int Nsteps
Definition: quda.h:189

QudaGaugeParam_s::reconstruct_sloppy
QudaReconstructType reconstruct_sloppy
Definition: quda.h:46

QudaGaugeParam_s::anisotropy
double anisotropy
Definition: quda.h:31

QUDA_RECONSTRUCT_NO
Definition: enum_quda.h:55

Vh
__constant__ int Vh
Definition: dslash_constants.h:152

QUDA_GCR_INVERTER
Definition: enum_quda.h:100

invertMultiShiftQuda
void invertMultiShiftQuda(void **_hp_x, void *_hp_b, QudaInvertParam *param)
Definition: interface_quda.cpp:2473

endQuda
void endQuda(void)
Definition: interface_quda.cpp:1018

quda::GaugeField::Ghost
const void ** Ghost() const
Definition: gauge_field.h:209

QudaInvertParam_s::solve_type
QudaSolveType solve_type
Definition: quda.h:143

QudaInvertParam_s::verbosity_precondition
QudaVerbosity verbosity_precondition
Definition: quda.h:210

X2
__constant__ int X2
Definition: dslash_constants.h:107

QudaPrecision
enum QudaPrecision_s QudaPrecision

V
int V
Definition: test_util.cpp:29

matdagmat_mg4dir
void matdagmat_mg4dir(cpuColorSpinorField *out, void **fatlink, void **longlink, void **ghost_fatlink, void **ghost_longlink, cpuColorSpinorField *in, double mass, int dagger_bit, QudaPrecision sPrecision, QudaPrecision gPrecision, cpuColorSpinorField *tmp, QudaParity parity)

QUDA_INVALID_PARITY
Definition: enum_quda.h:241

QudaGaugeParam_s::ga_pad
int ga_pad
Definition: quda.h:53

misc.h

QUDA_MATPC_ODD_ODD
Definition: enum_quda.h:164

prec_sloppy
QudaPrecision prec_sloppy
Definition: test_util.cpp:1552

QudaGaugeParam_s::gauge_fix
QudaGaugeFixed gauge_fix
Definition: quda.h:51

QudaInvertParam_s::tune
QudaTune tune
Definition: quda.h:185

QUDA_PRESERVE_SOURCE_YES
Definition: enum_quda.h:190

QudaResidualType
enum QudaResidualType_s QudaResidualType

QUDA_MASS_NORMALIZATION
Definition: enum_quda.h:178

QudaInvertParam_s::inv_type_precondition
QudaInverterType inv_type_precondition
Definition: quda.h:203

quda::ColorSpinorParam::nColor
int nColor
Definition: color_spinor_field.h:16

QUDA_INVALID_PRECISION
Definition: enum_quda.h:51

QUDA_ASQTAD_DSLASH
Definition: enum_quda.h:81

QudaGaugeParam_s::type
QudaLinkType type
Definition: quda.h:35

staggered_dslash_reference.h

invertQuda
void invertQuda(void *h_x, void *h_b, QudaInvertParam *param)
Definition: interface_quda.cpp:1977

usage_extra
void usage_extra(char **argv)
Definition: staggered_invert_test.cpp:549

errorQuda
#define errorQuda(...)
Definition: util_quda.h:73

QudaInvertParam_s::tol
double tol
Definition: quda.h:102

QudaInvertParam_s::dslash_type
QudaDslashType dslash_type
Definition: quda.h:85

QUDA_GAUGE_FIXED_NO
Definition: enum_quda.h:65

QudaInvertParam_s::inv_type
QudaInverterType inv_type
Definition: quda.h:86

test_util.h

gaugeParam
QudaGaugeParam gaugeParam
Definition: staggered_dslash_test.cpp:39

QudaInvertParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:152

ydim
int ydim
Definition: test_util.cpp:1554

link_recon_sloppy
QudaReconstructType link_recon_sloppy
Definition: test_util.cpp:1550

QUDA_ODD_PARITY
Definition: enum_quda.h:240

setDims
void setDims(int *)
Definition: test_util.cpp:88

QUDA_SPACE_SPIN_COLOR_FIELD_ORDER
Definition: enum_quda.h:295

X1
__constant__ int X1
Definition: dslash_constants.h:106

QUDA_HALF_PRECISION
Definition: enum_quda.h:48

quda::sqrt
__host__ __device__ ValueType sqrt(ValueType x)
Definition: complex_quda.h:105

loadGaugeQuda
void loadGaugeQuda(void *h_gauge, QudaGaugeParam *param)
Definition: interface_quda.cpp:452

device
int device
Definition: test_util.cpp:1546

QudaInvertParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:151

process_command_line_option
int process_command_line_option(int argc, char **argv, int *idx)
Definition: test_util.cpp:1635

constructSpinorField
void constructSpinorField(Float *res)
Definition: staggered_invert_test.cpp:76

quda::LatticeFieldParam::precision
QudaPrecision precision
Definition: lattice_field.h:41

gaugeSiteSize
#define gaugeSiteSize
Definition: fat_force_quda.h:11

QudaInvertParam_s::dagger
QudaDagType dagger
Definition: quda.h:145

finalizeComms
void finalizeComms()
Definition: test_util.cpp:65

QUDA_CG_INVERTER
Definition: enum_quda.h:98

link_recon
QudaReconstructType link_recon
Definition: test_util.cpp:1549

QudaGaugeParam_s::gauge_order
QudaGaugeFieldOrder gauge_order
Definition: quda.h:36

QudaInvertParam_s::true_res
double true_res
Definition: quda.h:105

test_type
int test_type
Definition: test_util.cpp:1564

get_prec_str
const char * get_prec_str(QudaPrecision prec)
Definition: misc.cpp:658

qdp_longlink
void * qdp_longlink[4]
Definition: staggered_invert_test.cpp:32

tdim
int tdim
Definition: test_util.cpp:1556

inv_type
QudaInverterType inv_type
Definition: test_util.cpp:1565

quda::LatticeFieldParam::siteSubset
QudaSiteSubset siteSubset
Definition: lattice_field.h:42

get_test_type
const char * get_test_type(int t)
Definition: misc.cpp:752

QudaInvertParam_s::input_location
QudaFieldLocation input_location
Definition: quda.h:82

QudaInvertParam_s::true_res_hq_offset
double true_res_hq_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:140

QudaInvertParam_s::reliable_delta
double reliable_delta
Definition: quda.h:108

QudaInvertParam_s::pipeline
int pipeline
Definition: quda.h:121

QudaInvertParam_s::use_init_guess
QudaUseInitGuess use_init_guess
Definition: quda.h:167

QudaInvertParam_s::solution_type
QudaSolutionType solution_type
Definition: quda.h:142

QUDA_TUNE_YES
Definition: enum_quda.h:224

quda::LatticeFieldParam::x
int x[QUDA_MAX_DIM]
Definition: lattice_field.h:38

QUDA_SILENT
Definition: enum_quda.h:215

quda::GaugeFieldParam
Definition: gauge_field.h:10

QudaGaugeParam_s::scale
double scale
Definition: quda.h:33

initQuda
void initQuda(int device)
Definition: interface_quda.cpp:428

prec
QudaPrecision prec
Definition: test_util.cpp:1551

QUDA_EVEN_ODD_SITE_ORDER
Definition: enum_quda.h:285

QudaInvertParam_s::output_location
QudaFieldLocation output_location
Definition: quda.h:83

QUDA_USE_INIT_GUESS_YES
Definition: enum_quda.h:362

cpu_prec
QudaPrecision cpu_prec
Definition: staggered_invert_test.cpp:46

QUDA_RECONSTRUCT_12
Definition: enum_quda.h:56

qdp_fatlink
void * qdp_fatlink[4]
Definition: staggered_invert_test.cpp:31

QudaGaugeParam_s
Definition: quda.h:25

quda::ColorSpinorParam::fieldOrder
QudaFieldOrder fieldOrder
Definition: color_spinor_field.h:23

QudaInvertParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:153

testing::internal::Float
FloatingPoint< float > Float
Definition: gtest.h:7350

QudaInvertParam_s::verbosity
QudaVerbosity verbosity
Definition: quda.h:174

setSpinorSiteSize
void setSpinorSiteSize(int n)
Definition: test_util.cpp:150

csParam
ColorSpinorParam csParam
Definition: pack_test.cpp:24

QudaInvertParam_s::tol_offset
double tol_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:131

QUDA_MILC_GAUGE_ORDER
Definition: enum_quda.h:35

QudaInvertParam_s::true_res_offset
double true_res_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:137

in
cpuColorSpinorField * in
Definition: staggered_invert_test.cpp:50

newQudaInvertParam
QudaInvertParam newQudaInvertParam(void)

QudaInvertParam_s::gflops
double gflops
Definition: quda.h:182

get_recon_str
const char * get_recon_str(QudaReconstructType recon)
Definition: misc.cpp:724

tmp
cpuColorSpinorField * tmp
Definition: staggered_invert_test.cpp:53

quda::cpuGaugeField
Definition: gauge_field.h:278

QudaGaugeParam_s::cuda_prec_precondition
QudaPrecision cuda_prec_precondition
Definition: quda.h:48

mySpinorSiteSize
#define mySpinorSiteSize
Definition: staggered_invert_test.cpp:28

QudaInvertParam_s::tol_hq
double tol_hq
Definition: quda.h:104

face_quda.h

quda::ColorSpinorParam::gammaBasis
QudaGammaBasis gammaBasis
Definition: color_spinor_field.h:24

xdim
int xdim
Definition: test_util.cpp:1553

blas_reference.h

QudaInvertParam_s::true_res_hq
double true_res_hq
Definition: quda.h:106

QUDA_PARITY_SITE_SUBSET
Definition: enum_quda.h:278

QudaInvertParam_s::gamma_basis
QudaGammaBasis gamma_basis
Definition: quda.h:158

QUDA_PCG_INVERTER
Definition: enum_quda.h:105

QudaGaugeParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:45

QudaInvertParam_s::tol_precondition
double tol_precondition
Definition: quda.h:213

cpuLong
cpuGaugeField * cpuLong
Definition: staggered_invert_test.cpp:56

dslash_util.h

mxpy
void mxpy(void *x, void *y, int len, QudaPrecision precision)
Definition: blas_reference.cpp:33

QudaInvertParam_s::offset
double offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:128

QudaInvertParam_s::use_sloppy_partial_accumulator
int use_sloppy_partial_accumulator
Definition: quda.h:109

QudaParity
enum QudaParity_s QudaParity

QudaGaugeParam_s::reconstruct
QudaReconstructType reconstruct
Definition: quda.h:43

QudaGaugeParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:42

QUDA_ASQTAD_LONG_LINKS
Definition: enum_quda.h:22

QudaGaugeParam_s::X
int X[4]
Definition: quda.h:29

QudaInvertParam_s::mass
double mass
Definition: quda.h:88

QUDA_HEAVY_QUARK_RESIDUAL
Definition: enum_quda.h:149

QudaInvertParam_s::gcrNkrylov
int gcrNkrylov
Definition: quda.h:192

QudaInvertParam_s::maxiter
int maxiter
Definition: quda.h:107

NUM_OFFSETS
#define NUM_OFFSETS

QUDA_SD_INVERTER
Definition: enum_quda.h:103

mass
double mass
Definition: test_util.cpp:1569

longlink
void * longlink
Definition: staggered_invert_test.cpp:35

norm_2
double norm_2(void *v, int len, QudaPrecision precision)
Definition: blas_reference.cpp:48

quda::LatticeFieldParam::nDim
int nDim
Definition: lattice_field.h:37

QudaInvertParam_s::sp_pad
int sp_pad
Definition: quda.h:176

main
int main(int argc, char **argv)
Definition: staggered_invert_test.cpp:562

blas_quda.h

QUDA_RECONSTRUCT_8
Definition: enum_quda.h:57

construct_fat_long_gauge_field
void construct_fat_long_gauge_field(void **fatlink, void **longlink, int type, QudaPrecision precision, QudaGaugeParam *param, QudaDslashType dslash_type)
Definition: test_util.cpp:1018

quda::ColorSpinorParam
Definition: color_spinor_field.h:14

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:50

cpuFat
cpuGaugeField * cpuFat
Definition: staggered_invert_test.cpp:55

display_test_info
void display_test_info()
Definition: staggered_invert_test.cpp:527

inv_param
QudaInvertParam inv_param
Definition: dslash_test.cpp:38

dslash_type
QudaDslashType dslash_type
Definition: test_util.cpp:1560

QudaGaugeParam_s::tadpole_coeff
double tadpole_coeff
Definition: quda.h:32

out
cpuColorSpinorField * out
Definition: staggered_invert_test.cpp:51

QudaInvertParam_s::cuda_prec_precondition
QudaPrecision cuda_prec_precondition
Definition: quda.h:154

ref
cpuColorSpinorField * ref
Definition: staggered_invert_test.cpp:52

QudaInvertParam_s::iter
int iter
Definition: quda.h:179

QUDA_STAGGERED_DSLASH
Definition: enum_quda.h:80

get_prec
QudaPrecision get_prec(QIO_Reader *infile)
Definition: gauge_qio.cpp:38

QudaInvertParam_s::tol_restart
double tol_restart
Definition: quda.h:103

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:49

quda::ColorSpinorParam::nSpin
int nSpin
Definition: color_spinor_field.h:17

QudaReconstructType
enum QudaReconstructType_s QudaReconstructType

quda.h
Main header file for the QUDA library.

MAX
#define MAX(a, b)
Definition: staggered_invert_test.cpp:27

X3
__constant__ int X3
Definition: dslash_constants.h:108

QUDA_DEGRAND_ROSSI_GAMMA_BASIS
Definition: enum_quda.h:311

printfQuda
#define printfQuda(...)
Definition: util_quda.h:67

QUDA_DAG_NO
Definition: enum_quda.h:171

QudaGaugeParam_s::t_boundary
QudaTboundary t_boundary
Definition: quda.h:38

QUDA_NORMOP_SOLVE
Definition: enum_quda.h:130

quda::ColorSpinorParam::siteOrder
QudaSiteOrder siteOrder
Definition: color_spinor_field.h:21

QUDA_DIRAC_ORDER
Definition: enum_quda.h:196

QudaDslashType
enum QudaDslashType_s QudaDslashType

QUDA_ANTI_PERIODIC_T
Definition: enum_quda.h:42

matdagmat
void matdagmat(void *out, void **gauge, void *in, double kappa, QudaPrecision sPrecision, QudaPrecision gPrecision, double mferm)
Definition: domain_wall_dslash_reference.cpp:1578

QudaInvertParam_s::residual_type
QudaResidualType residual_type
Definition: quda.h:235

gridsize_from_cmdline
int gridsize_from_cmdline[]
Definition: test_util.cpp:1559

QUDA_EVEN_PARITY
Definition: enum_quda.h:239

QudaInvertParam_s::num_offset
int num_offset
Definition: quda.h:123

return
return
Definition: hisq_paths_force_core.h:380

QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:304

quda::HeavyQuarkResidualNormCpu
double3 HeavyQuarkResidualNormCpu(cpuColorSpinorField &x, cpuColorSpinorField &r)
Definition: blas_cpu.cpp:331

quda::ColorSpinorParam::create
QudaFieldCreate create
Definition: color_spinor_field.h:25

s
VOLATILE spinorFloat * s
Definition: asym_wilson_clover_dslash_dagger_g80_core.h:387

QUDA_NORMOP_PC_SOLVE
Definition: enum_quda.h:132

QUDA_MATPCDAG_MATPC_SOLUTION
Definition: enum_quda.h:123

QUDA_MATPC_EVEN_EVEN
Definition: enum_quda.h:163

QUDA_SU3_LINKS
Definition: enum_quda.h:16

fatlink
void * fatlink
Definition: staggered_invert_test.cpp:34

QudaInvertParam_s
Definition: quda.h:80

invert_test
int invert_test(void)
Definition: staggered_invert_test.cpp:182

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:270

initComms
void initComms(int argc, char **argv, const int *commDims)
Definition: test_util.cpp:48

QUDA_ASQTAD_FAT_LINKS
Definition: enum_quda.h:21

parity
const QudaParity parity
Definition: dslash_test.cpp:29

gauge_field.h

QudaInvertParam_s::matpc_type
QudaMatPCType matpc_type
Definition: quda.h:144

tune
bool tune
Definition: test_util.cpp:1562

usage
void usage(char **argv)
Definition: test_util.cpp:1584

QudaInverterType
enum QudaInverterType_s QudaInverterType

QUDA_L2_RELATIVE_RESIDUAL
Definition: enum_quda.h:147

quda::cpuColorSpinorField
Definition: color_spinor_field.h:517

QudaGaugeParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:40

end
void end()
Definition: dslash_test.cpp:428

quda::ColorSpinorField::V
void * V()
Definition: color_spinor_field.h:262

X4
__constant__ int X4
Definition: dslash_constants.h:109

newQudaGaugeParam
QudaGaugeParam newQudaGaugeParam(void)

QUDA_RECONSTRUCT_INVALID
Definition: enum_quda.h:61

QudaInvertParam_s::preserve_source
QudaPreserveSource preserve_source
Definition: quda.h:149

quda::LatticeFieldParam::pad
int pad
Definition: lattice_field.h:39