quda-ref/v1.0.0/staggered__invertmsrc__test_8cpp_source.html

 #include <stdlib.h>
 #include <stdio.h>
 #include <time.h>
 #include <math.h>

 #include <test_util.h>
 #include <dslash_util.h>
 #include <blas_reference.h>
 #include <staggered_dslash_reference.h>
 #include <quda.h>
 #include <string.h>
 #include "misc.h"
 #include <gauge_field.h>
 #include <blas_quda.h>

 #if defined(QMP_COMMS)
 #include <qmp.h>
 #elif defined(MPI_COMMS)
 #include <mpi.h>
 #endif

 #define MAX(a,b) ((a)>(b)?(a):(b))
 #define mySpinorSiteSize 6

 extern void usage(char** argv);
 void *qdp_fatlink[4];
 void *qdp_longlink[4];

 void *fatlink;
 void *longlink;

 #ifdef MULTI_GPU
 void** ghost_fatlink, **ghost_longlink;
 #endif

 extern int device;
 extern int niter;
 extern int Nsrc; // number of spinors to apply to simultaneously


 extern QudaReconstructType link_recon;
 extern QudaPrecision prec;
 QudaPrecision cpu_prec = QUDA_DOUBLE_PRECISION;

 extern QudaReconstructType link_recon_sloppy;
 extern QudaPrecision  prec_sloppy;
 cpuColorSpinorField* in;
 cpuColorSpinorField* out;
 cpuColorSpinorField* ref;
 cpuColorSpinorField* tmp;

 cpuGaugeField *cpuFat = NULL;
 cpuGaugeField *cpuLong = NULL;

 extern double tol; // tolerance for inverter
 extern double tol_hq; // heavy-quark tolerance for inverter
 extern int test_type;
 extern int xdim;
 extern int ydim;
 extern int zdim;
 extern int tdim;
 extern int gridsize_from_cmdline[];

 // Dirac operator type
 extern QudaDslashType dslash_type;

 extern QudaInverterType inv_type;
 extern double mass; // the mass of the Dirac operator

 extern double mass;

 static void end();

 template<typename Float>
 void constructSpinorField(Float *res) {
   for(int i = 0; i < Vh; i++) {
     for (int s = 0; s < 1; s++) {
       for (int m = 0; m < 3; m++) {
         res[i*(1*3*2) + s*(3*2) + m*(2) + 0] = rand() / (Float)RAND_MAX;
         res[i*(1*3*2) + s*(3*2) + m*(2) + 1] = rand() / (Float)RAND_MAX;
       }
     }
   }
 }


 static void
 set_params(QudaGaugeParam* gaugeParam, QudaInvertParam* inv_param,
     int X1, int  X2, int X3, int X4,
     QudaPrecision cpu_prec, QudaPrecision prec, QudaPrecision prec_sloppy,
     QudaReconstructType link_recon, QudaReconstructType link_recon_sloppy,
     double mass, double tol, int maxiter, double reliable_delta,
     double tadpole_coeff
     )
 {
   gaugeParam->X[0] = X1;
   gaugeParam->X[1] = X2;
   gaugeParam->X[2] = X3;
   gaugeParam->X[3] = X4;

   gaugeParam->cpu_prec = cpu_prec;
   gaugeParam->cuda_prec = prec;
   gaugeParam->reconstruct = link_recon;
   gaugeParam->cuda_prec_sloppy = prec_sloppy;
   gaugeParam->reconstruct_sloppy = link_recon_sloppy;
   gaugeParam->gauge_fix = QUDA_GAUGE_FIXED_NO;
   gaugeParam->anisotropy = 1.0;
   gaugeParam->tadpole_coeff = tadpole_coeff;

   if (dslash_type != QUDA_ASQTAD_DSLASH && dslash_type != QUDA_STAGGERED_DSLASH)
     dslash_type = QUDA_ASQTAD_DSLASH;

   gaugeParam->scale = dslash_type == QUDA_STAGGERED_DSLASH ? 1.0 : -1.0/(24.0*tadpole_coeff*tadpole_coeff);

   gaugeParam->t_boundary = QUDA_ANTI_PERIODIC_T;
   gaugeParam->gauge_order = QUDA_MILC_GAUGE_ORDER;
   gaugeParam->ga_pad = X1*X2*X3/2;

   inv_param->verbosity = QUDA_VERBOSE;
   inv_param->mass = mass;

   // outer solver parameters
   inv_param->inv_type = inv_type;
   inv_param->tol = tol;
   inv_param->tol_restart = 1e-3; //now theoretical background for this parameter...
   inv_param->maxiter = niter;
   inv_param->reliable_delta = 0;//1e-1;
   inv_param->use_sloppy_partial_accumulator = false;
   inv_param->pipeline = false;

   inv_param->Ls = 1;


   if(tol_hq == 0 && tol == 0){
     errorQuda("qudaInvert: requesting zero residual\n");
     exit(1);
   }
   // require both L2 relative and heavy quark residual to determine convergence
   inv_param->residual_type = static_cast<QudaResidualType_s>(0);
   inv_param->residual_type = (tol != 0) ? static_cast<QudaResidualType_s> ( inv_param->residual_type | QUDA_L2_RELATIVE_RESIDUAL) : inv_param->residual_type;
   inv_param->residual_type = (tol_hq != 0) ? static_cast<QudaResidualType_s> (inv_param->residual_type | QUDA_HEAVY_QUARK_RESIDUAL) : inv_param->residual_type;

   inv_param->tol_hq = tol_hq; // specify a tolerance for the residual for heavy quark residual

   inv_param->Nsteps = 2;


   //inv_param->inv_type = QUDA_GCR_INVERTER;
   //inv_param->gcrNkrylov = 10;

   // domain decomposition preconditioner parameters
   inv_param->inv_type_precondition = QUDA_SD_INVERTER;
   inv_param->tol_precondition = 1e-1;
   inv_param->maxiter_precondition = 10;
   inv_param->verbosity_precondition = QUDA_SILENT;
   inv_param->cuda_prec_precondition = QUDA_HALF_PRECISION;

   inv_param->solution_type = QUDA_MATPCDAG_MATPC_SOLUTION;
   inv_param->solve_type = QUDA_NORMOP_PC_SOLVE;
   inv_param->matpc_type = QUDA_MATPC_EVEN_EVEN;
   inv_param->dagger = QUDA_DAG_NO;
   inv_param->mass_normalization = QUDA_MASS_NORMALIZATION;

   inv_param->cpu_prec = cpu_prec;
   inv_param->cuda_prec = prec;
   inv_param->cuda_prec_sloppy = prec_sloppy;
   inv_param->preserve_source = QUDA_PRESERVE_SOURCE_YES;
   inv_param->gamma_basis = QUDA_DEGRAND_ROSSI_GAMMA_BASIS; // this is meaningless, but must be thus set
   inv_param->dirac_order = QUDA_DIRAC_ORDER;

   inv_param->dslash_type = dslash_type;

   inv_param->sp_pad = X1*X2*X3/2;
   inv_param->use_init_guess = QUDA_USE_INIT_GUESS_YES;

   inv_param->input_location = QUDA_CPU_FIELD_LOCATION;
   inv_param->output_location = QUDA_CPU_FIELD_LOCATION;
 }


   int
 invert_test(void)
 {
   QudaGaugeParam gaugeParam = newQudaGaugeParam();
   QudaInvertParam inv_param = newQudaInvertParam();

   set_params(&gaugeParam, &inv_param,
       xdim, ydim, zdim, tdim,
       cpu_prec, prec, prec_sloppy,
       link_recon, link_recon_sloppy, mass, tol, 500, 1e-3,
       0.8);

   // this must be before the FaceBuffer is created (this is because it allocates pinned memory - FIXME)
   initQuda(device);

   setDims(gaugeParam.X);
   dw_setDims(gaugeParam.X,1); // so we can use 5-d indexing from dwf
   setSpinorSiteSize(6);

   size_t gSize = (gaugeParam.cpu_prec == QUDA_DOUBLE_PRECISION) ? sizeof(double) : sizeof(float);
   for (int dir = 0; dir < 4; dir++) {
     qdp_fatlink[dir] = malloc(V*gaugeSiteSize*gSize);
     qdp_longlink[dir] = malloc(V*gaugeSiteSize*gSize);
   }
   fatlink = malloc(4*V*gaugeSiteSize*gSize);
   longlink = malloc(4*V*gaugeSiteSize*gSize);

   construct_fat_long_gauge_field(qdp_fatlink, qdp_longlink, 1, gaugeParam.cpu_prec,
          &gaugeParam, dslash_type);

   for(int dir=0; dir<4; ++dir){
     for(int i=0; i<V; ++i){
       for(int j=0; j<gaugeSiteSize; ++j){
         if(gaugeParam.cpu_prec == QUDA_DOUBLE_PRECISION){
           ((double*)fatlink)[(i*4 + dir)*gaugeSiteSize + j] = ((double*)qdp_fatlink[dir])[i*gaugeSiteSize + j];
           ((double*)longlink)[(i*4 + dir)*gaugeSiteSize + j] = ((double*)qdp_longlink[dir])[i*gaugeSiteSize + j];
         }else{
           ((float*)fatlink)[(i*4 + dir)*gaugeSiteSize + j] = ((float*)qdp_fatlink[dir])[i*gaugeSiteSize + j];
           ((float*)longlink)[(i*4 + dir)*gaugeSiteSize + j] = ((float*)qdp_longlink[dir])[i*gaugeSiteSize + j];
         }
       }
     }
   }


   ColorSpinorParam csParam;
   csParam.nColor=3;
   csParam.nSpin=1;
   csParam.nDim=5;
   for (int d = 0; d < 4; d++) csParam.x[d] = gaugeParam.X[d];
   csParam.x[0] /= 2;
   csParam.x[4] = 1;

   csParam.setPrecision(inv_param.cpu_prec);
   csParam.pad = 0;
   csParam.siteSubset = QUDA_PARITY_SITE_SUBSET;
   csParam.siteOrder = QUDA_EVEN_ODD_SITE_ORDER;
   csParam.fieldOrder  = QUDA_SPACE_SPIN_COLOR_FIELD_ORDER;
   csParam.gammaBasis = inv_param.gamma_basis;
   csParam.create = QUDA_ZERO_FIELD_CREATE;
   in = new cpuColorSpinorField(csParam);
   out = new cpuColorSpinorField(csParam);
   ref = new cpuColorSpinorField(csParam);
   tmp = new cpuColorSpinorField(csParam);

   if (inv_param.cpu_prec == QUDA_SINGLE_PRECISION){
     constructSpinorField((float*)in->V());
   }else{
     constructSpinorField((double*)in->V());
   }

 #ifdef MULTI_GPU
   int tmp_value = MAX(ydim*zdim*tdim/2, xdim*zdim*tdim/2);
   tmp_value = MAX(tmp_value, xdim*ydim*tdim/2);
   tmp_value = MAX(tmp_value, xdim*ydim*zdim/2);

   int fat_pad = tmp_value;
   int link_pad =  3*tmp_value;

   // FIXME: currently assume staggered is SU(3)
   gaugeParam.type = dslash_type == QUDA_STAGGERED_DSLASH ?
     QUDA_SU3_LINKS : QUDA_ASQTAD_FAT_LINKS;
   gaugeParam.reconstruct = QUDA_RECONSTRUCT_NO;
   GaugeFieldParam cpuFatParam(fatlink, gaugeParam);
   cpuFatParam.ghostExchange = QUDA_GHOST_EXCHANGE_PAD;
   cpuFat = new cpuGaugeField(cpuFatParam);
   ghost_fatlink = (void**)cpuFat->Ghost();

   gaugeParam.type = QUDA_ASQTAD_LONG_LINKS;
   GaugeFieldParam cpuLongParam(longlink, gaugeParam);
   cpuLongParam.ghostExchange = QUDA_GHOST_EXCHANGE_PAD;
   cpuLong = new cpuGaugeField(cpuLongParam);
   ghost_longlink = (void**)cpuLong->Ghost();


 #else
   int fat_pad = 0;
   int link_pad = 0;
 #endif

   gaugeParam.type = dslash_type == QUDA_STAGGERED_DSLASH ?
     QUDA_SU3_LINKS : QUDA_ASQTAD_FAT_LINKS;
   gaugeParam.ga_pad = fat_pad;
   if (dslash_type == QUDA_STAGGERED_DSLASH) {
     gaugeParam.reconstruct = link_recon;
     gaugeParam.reconstruct_sloppy = link_recon_sloppy;
   } else {
     gaugeParam.reconstruct= gaugeParam.reconstruct_sloppy = QUDA_RECONSTRUCT_NO;
   }
   gaugeParam.cuda_prec_precondition = QUDA_HALF_PRECISION;
   loadGaugeQuda(fatlink, &gaugeParam);

   if (dslash_type == QUDA_ASQTAD_DSLASH) {
     gaugeParam.type = QUDA_ASQTAD_LONG_LINKS;
     gaugeParam.ga_pad = link_pad;
     gaugeParam.reconstruct= link_recon;
     gaugeParam.reconstruct_sloppy = link_recon_sloppy;
     loadGaugeQuda(longlink, &gaugeParam);
   }

   double time0 = -((double)clock()); // Start the timer

   double nrm2=0;
   double src2=0;
   int ret = 0;


   switch(test_type){
     case 0: //even
       if(inv_type == QUDA_GCR_INVERTER){
         inv_param.inv_type = QUDA_GCR_INVERTER;
         inv_param.gcrNkrylov = 50;
       }else if(inv_type == QUDA_PCG_INVERTER){
   inv_param.inv_type = QUDA_PCG_INVERTER;
       }
       inv_param.matpc_type = QUDA_MATPC_EVEN_EVEN;
       #define NUM_SRC 20
       inv_param.num_src=Nsrc; // number of spinors to apply to simultaneously
       void* outArray[NUM_SRC];
       void* inArray[NUM_SRC];
       int len;

       cpuColorSpinorField* spinorOutArray[NUM_SRC];
       cpuColorSpinorField* spinorInArray[NUM_SRC];
       spinorOutArray[0] = out;
       spinorInArray[0] = in;
       // in = new cpuColorSpinorField(csParam);
       // out = new cpuColorSpinorField(csParam);
       // ref = new cpuColorSpinorField(csParam);
       // tmp = new cpuColorSpinorField(csParam);

       if (inv_param.cpu_prec == QUDA_SINGLE_PRECISION){
         constructSpinorField((float*)in->V());
       }else{
         constructSpinorField((double*)in->V());
       }

       for(int i=1;i < inv_param.num_src; i++){
         spinorOutArray[i] = new cpuColorSpinorField(csParam);
         spinorInArray[i] = new cpuColorSpinorField(csParam);
         if (inv_param.cpu_prec == QUDA_SINGLE_PRECISION){
           constructSpinorField((float*)spinorInArray[i]->V());
         }else{
           constructSpinorField((double*)spinorInArray[i]->V());
         }
       }

       for(int i=0;i < inv_param.num_src; i++){
         outArray[i] = spinorOutArray[i]->V();
         inArray[i] = spinorInArray[i]->V();
         // inv_param.offset[i] = 4*masses[i]*masses[i];
       }
       invertMultiSrcQuda(outArray, inArray, &inv_param);

       time0 += clock();
       time0 /= CLOCKS_PER_SEC;


 #ifdef MULTI_GPU
       matdagmat_mg4dir(ref, qdp_fatlink, qdp_longlink, ghost_fatlink, ghost_longlink,
           out, mass, 0, inv_param.cpu_prec, gaugeParam.cpu_prec, tmp, QUDA_EVEN_PARITY);
 #else
       matdagmat(ref->V(), qdp_fatlink, qdp_longlink, out->V(), mass, 0, inv_param.cpu_prec, gaugeParam.cpu_prec, tmp->V(), QUDA_EVEN_PARITY);
 #endif

       mxpy(in->V(), ref->V(), Vh*mySpinorSiteSize, inv_param.cpu_prec);
       nrm2 = norm_2(ref->V(), Vh*mySpinorSiteSize, inv_param.cpu_prec);
       src2 = norm_2(in->V(), Vh*mySpinorSiteSize, inv_param.cpu_prec);

       for(int i=1; i < inv_param.num_src;i++) delete spinorOutArray[i];
       for(int i=1; i < inv_param.num_src;i++) delete spinorInArray[i];


       break;

     case 1: //odd
       if(inv_type == QUDA_GCR_INVERTER){
         inv_param.inv_type = QUDA_GCR_INVERTER;
         inv_param.gcrNkrylov = 50;
       }else if(inv_type == QUDA_PCG_INVERTER){
   inv_param.inv_type = QUDA_PCG_INVERTER;
       }

       inv_param.matpc_type = QUDA_MATPC_ODD_ODD;
       invertQuda(out->V(), in->V(), &inv_param);
       time0 += clock(); // stop the timer
       time0 /= CLOCKS_PER_SEC;

 #ifdef MULTI_GPU
       matdagmat_mg4dir(ref, qdp_fatlink, qdp_longlink, ghost_fatlink, ghost_longlink,
           out, mass, 0, inv_param.cpu_prec, gaugeParam.cpu_prec, tmp, QUDA_ODD_PARITY);
 #else
       matdagmat(ref->V(), qdp_fatlink, qdp_longlink, out->V(), mass, 0, inv_param.cpu_prec, gaugeParam.cpu_prec, tmp->V(), QUDA_ODD_PARITY);
 #endif
       mxpy(in->V(), ref->V(), Vh*mySpinorSiteSize, inv_param.cpu_prec);
       nrm2 = norm_2(ref->V(), Vh*mySpinorSiteSize, inv_param.cpu_prec);
       src2 = norm_2(in->V(), Vh*mySpinorSiteSize, inv_param.cpu_prec);

       break;

     case 2: //full spinor

       errorQuda("full spinor not supported\n");
       break;

     case 3: //multi mass CG, even
     case 4:

 #define NUM_OFFSETS 12

       {
         double masses[NUM_OFFSETS] ={0.06, 0.061, 0.064, 0.070, 0.077, 0.081, 0.1, 0.11, 0.12, 0.13, 0.14, 0.205};
         inv_param.num_offset = NUM_OFFSETS;
         // these can be set independently
         for (int i=0; i<inv_param.num_offset; i++) {
           inv_param.tol_offset[i] = inv_param.tol;
           inv_param.tol_hq_offset[i] = inv_param.tol_hq;
         }
         void* outArray[NUM_OFFSETS];
         int len;

         cpuColorSpinorField* spinorOutArray[NUM_OFFSETS];
         spinorOutArray[0] = out;
         for(int i=1;i < inv_param.num_offset; i++){
           spinorOutArray[i] = new cpuColorSpinorField(csParam);
         }

         for(int i=0;i < inv_param.num_offset; i++){
           outArray[i] = spinorOutArray[i]->V();
           inv_param.offset[i] = 4*masses[i]*masses[i];
         }

         len=Vh;

         if (test_type == 3) {
           inv_param.matpc_type = QUDA_MATPC_EVEN_EVEN;
         } else {
           inv_param.matpc_type = QUDA_MATPC_ODD_ODD;
         }

         invertMultiShiftQuda(outArray, in->V(), &inv_param);

         cudaDeviceSynchronize();
         time0 += clock(); // stop the timer
         time0 /= CLOCKS_PER_SEC;

         printfQuda("done: total time = %g secs, compute time = %g, %i iter / %g secs = %g gflops\n",
             time0, inv_param.secs, inv_param.iter, inv_param.secs,
             inv_param.gflops/inv_param.secs);


         printfQuda("checking the solution\n");
         QudaParity parity = QUDA_INVALID_PARITY;
         if (inv_param.solve_type == QUDA_NORMOP_SOLVE){
           //parity = QUDA_EVENODD_PARITY;
           errorQuda("full parity not supported\n");
         }else if (inv_param.matpc_type == QUDA_MATPC_EVEN_EVEN){
           parity = QUDA_EVEN_PARITY;
         }else if (inv_param.matpc_type == QUDA_MATPC_ODD_ODD){
           parity = QUDA_ODD_PARITY;
         }else{
           errorQuda("ERROR: invalid spinor parity \n");
           exit(1);
         }
         for(int i=0;i < inv_param.num_offset;i++){
           printfQuda("%dth solution: mass=%f, ", i, masses[i]);
 #ifdef MULTI_GPU
           matdagmat_mg4dir(ref, qdp_fatlink, qdp_longlink, ghost_fatlink, ghost_longlink,
               spinorOutArray[i], masses[i], 0, inv_param.cpu_prec,
               gaugeParam.cpu_prec, tmp, parity);
 #else
           matdagmat(ref->V(), qdp_fatlink, qdp_longlink, outArray[i], masses[i], 0, inv_param.cpu_prec, gaugeParam.cpu_prec, tmp->V(), parity);
 #endif

     mxpy(in->V(), ref->V(), len*mySpinorSiteSize, inv_param.cpu_prec);
     double nrm2 = norm_2(ref->V(), len*mySpinorSiteSize, inv_param.cpu_prec);
     double src2 = norm_2(in->V(), len*mySpinorSiteSize, inv_param.cpu_prec);
     double hqr = sqrt(blas::HeavyQuarkResidualNorm(*spinorOutArray[i], *ref).z);
     double l2r = sqrt(nrm2/src2);

     printfQuda("Shift %d residuals: (L2 relative) tol %g, QUDA = %g, host = %g; (heavy-quark) tol %g, QUDA = %g, host = %g\n",
        i, inv_param.tol_offset[i], inv_param.true_res_offset[i], l2r,
        inv_param.tol_hq_offset[i], inv_param.true_res_hq_offset[i], hqr);

     //emperical, if the cpu residue is more than 1 order the target accuracy, the it fails to converge
     if (sqrt(nrm2/src2) > 10*inv_param.tol_offset[i]){
       ret |=1;
     }
   }

         for(int i=1; i < inv_param.num_offset;i++) delete spinorOutArray[i];
       }
       break;

     default:
       errorQuda("Unsupported test type");

   }//switch

   if (test_type <=2){

     double hqr = sqrt(blas::HeavyQuarkResidualNorm(*out, *ref).z);
     double l2r = sqrt(nrm2/src2);

     printfQuda("Residuals: (L2 relative) tol %g, QUDA = %g, host = %g; (heavy-quark) tol %g, QUDA = %g, host = %g\n",
         inv_param.tol, inv_param.true_res, l2r, inv_param.tol_hq, inv_param.true_res_hq, hqr);

     printfQuda("done: total time = %g secs, compute time = %g secs, %i iter / %g secs = %g gflops, \n",
         time0, inv_param.secs, inv_param.iter, inv_param.secs,
         inv_param.gflops/inv_param.secs);
   }

   end();
   return ret;
 }


   static void
 end(void)
 {
   for(int i=0;i < 4;i++){
     free(qdp_fatlink[i]);
     free(qdp_longlink[i]);
   }

   free(fatlink);
   free(longlink);

   delete in;
   delete out;
   delete ref;
   delete tmp;

   if (cpuFat) delete cpuFat;
   if (cpuLong) delete cpuLong;

   endQuda();
 }


   void
 display_test_info()
 {
   printfQuda("running the following test:\n");

   printfQuda("prec    sloppy_prec    link_recon  sloppy_link_recon test_type  S_dimension T_dimension\n");
   printfQuda("%s   %s             %s            %s            %s         %d/%d/%d          %d \n",
       get_prec_str(prec),get_prec_str(prec_sloppy),
       get_recon_str(link_recon),
       get_recon_str(link_recon_sloppy), get_test_type(test_type), xdim, ydim, zdim, tdim);

   printfQuda("Grid partition info:     X  Y  Z  T\n");
   printfQuda("                         %d  %d  %d  %d\n",
       dimPartitioned(0),
       dimPartitioned(1),
       dimPartitioned(2),
       dimPartitioned(3));

   return ;

 }

   void
 usage_extra(char** argv )
 {
   printfQuda("Extra options:\n");
   printfQuda("    --test <0/1>                             # Test method\n");
   printfQuda("                                                0: Even even spinor CG inverter\n");
   printfQuda("                                                1: Odd odd spinor CG inverter\n");
   printfQuda("                                                3: Even even spinor multishift CG inverter\n");
   printfQuda("                                                4: Odd odd spinor multishift CG inverter\n");
   printfQuda("    --cpu_prec <double/single/half>          # Set CPU precision\n");

   return ;
 }
 int main(int argc, char** argv)
 {
   for (int i = 1; i < argc; i++) {

     if(process_command_line_option(argc, argv, &i) == 0){
       continue;
     }


     if( strcmp(argv[i], "--cpu_prec") == 0){
       if (i+1 >= argc){
         usage(argv);
       }
       cpu_prec= get_prec(argv[i+1]);
       i++;
       continue;
     }

     printf("ERROR: Invalid option:%s\n", argv[i]);
     usage(argv);
   }

   if (prec_sloppy == QUDA_INVALID_PRECISION){
     prec_sloppy = prec;
   }
   if (link_recon_sloppy == QUDA_RECONSTRUCT_INVALID){
     link_recon_sloppy = link_recon;
   }

   if(inv_type != QUDA_CG_INVERTER){
     if(test_type != 0 && test_type != 1) errorQuda("Preconditioning is currently not supported in multi-shift solver solvers");
   }


   // initialize QMP/MPI, QUDA comms grid and RNG (test_util.cpp)
   initComms(argc, argv, gridsize_from_cmdline);

   display_test_info();

   printfQuda("dslash_type = %d\n", dslash_type);

   int ret = invert_test();

   // finalize the communications layer
   finalizeComms();

   return ret;
 }
QudaInvertParam_s::maxiter_precondition
int maxiter_precondition
Definition: quda.h:292

gSize
static size_t gSize
Definition: hisq_stencil_test.cpp:48

QudaInvertParam_s::secs
double secs
Definition: quda.h:251

qdp_longlink
void * qdp_longlink[4]
Definition: staggered_invertmsrc_test.cpp:27

dimPartitioned
int dimPartitioned(int dim)
Definition: test_util.cpp:1776

QudaInvertParam_s::dirac_order
QudaDiracFieldOrder dirac_order
Definition: quda.h:219

QUDA_VERBOSE
Definition: enum_quda.h:265

QudaInvertParam_s::mass_normalization
QudaMassNormalization mass_normalization
Definition: quda.h:208

QudaInvertParam_s::tol_hq_offset
double tol_hq_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:182

QudaInvertParam_s::Nsteps
int Nsteps
Definition: quda.h:256

QudaGaugeParam_s::reconstruct_sloppy
QudaReconstructType reconstruct_sloppy
Definition: quda.h:53

QudaGaugeParam_s::anisotropy
double anisotropy
Definition: quda.h:38

QUDA_RECONSTRUCT_NO
Definition: enum_quda.h:67

quda::LatticeFieldParam::ghostExchange
QudaGhostExchange ghostExchange
Definition: lattice_field.h:76

gaugeParam
QudaGaugeParam gaugeParam
Definition: covdev_test.cpp:36

QUDA_GCR_INVERTER
Definition: enum_quda.h:104

quda::ColorSpinorParam::setPrecision
void setPrecision(QudaPrecision precision, QudaPrecision ghost_precision=QUDA_INVALID_PRECISION, bool force_native=false)
Definition: color_spinor_field.h:231

invert_test
int invert_test(void)
Definition: staggered_invertmsrc_test.cpp:183

invertMultiShiftQuda
void invertMultiShiftQuda(void **_hp_x, void *_hp_b, QudaInvertParam *param)
Definition: interface_quda.cpp:3579

endQuda
void endQuda(void)
Definition: interface_quda.cpp:1461

QudaInvertParam_s::solve_type
QudaSolveType solve_type
Definition: quda.h:205

QudaInvertParam_s::verbosity_precondition
QudaVerbosity verbosity_precondition
Definition: quda.h:286

out
cpuColorSpinorField * out
Definition: staggered_invertmsrc_test.cpp:49

QudaPrecision
enum QudaPrecision_s QudaPrecision

link_recon
QudaReconstructType link_recon
Definition: test_util.cpp:1605

QUDA_INVALID_PARITY
Definition: enum_quda.h:289

QudaGaugeParam_s::ga_pad
int ga_pad
Definition: quda.h:63

misc.h

QUDA_MATPC_ODD_ODD
Definition: enum_quda.h:211

xdim
int xdim
Definition: test_util.cpp:1615

dw_setDims
void dw_setDims(int *X, const int L5)
Definition: test_util.cpp:187

QudaGaugeParam_s::gauge_fix
QudaGaugeFixed gauge_fix
Definition: quda.h:61

QUDA_PRESERVE_SOURCE_YES
Definition: enum_quda.h:237

QUDA_MASS_NORMALIZATION
Definition: enum_quda.h:225

QudaInvertParam_s::inv_type_precondition
QudaInverterType inv_type_precondition
Definition: quda.h:270

quda::ColorSpinorParam::nColor
int nColor
Definition: color_spinor_field.h:85

QUDA_INVALID_PRECISION
Definition: enum_quda.h:63

QUDA_ASQTAD_DSLASH
Definition: enum_quda.h:93

QudaGaugeParam_s::type
QudaLinkType type
Definition: quda.h:42

staggered_dslash_reference.h

invertQuda
void invertQuda(void *h_x, void *h_b, QudaInvertParam *param)
Definition: interface_quda.cpp:2830

X2
static int X2
Definition: face_gauge.cpp:42

errorQuda
#define errorQuda(...)
Definition: util_quda.h:121

QudaInvertParam_s::tol
double tol
Definition: quda.h:121

QudaInvertParam_s::dslash_type
QudaDslashType dslash_type
Definition: quda.h:102

QUDA_GAUGE_FIXED_NO
Definition: enum_quda.h:77

QudaInvertParam_s::inv_type
QudaInverterType inv_type
Definition: quda.h:103

test_util.h

ghost_fatlink
void ** ghost_fatlink
Definition: staggered_eigensolve_test.cpp:40

QudaInvertParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:214

QUDA_ODD_PARITY
Definition: enum_quda.h:288

QUDA_SPACE_SPIN_COLOR_FIELD_ORDER
Definition: enum_quda.h:350

niter
int niter
Definition: test_util.cpp:1629

QUDA_HALF_PRECISION
Definition: enum_quda.h:60

quda::sqrt
__host__ __device__ ValueType sqrt(ValueType x)
Definition: complex_quda.h:120

loadGaugeQuda
void loadGaugeQuda(void *h_gauge, QudaGaugeParam *param)
Definition: interface_quda.cpp:729

device
int device
Definition: test_util.cpp:1602

QudaInvertParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:213

process_command_line_option
int process_command_line_option(int argc, char **argv, int *idx)
Definition: test_util.cpp:2019

mySpinorSiteSize
#define mySpinorSiteSize
Definition: staggered_invertmsrc_test.cpp:23

prec_sloppy
QudaPrecision prec_sloppy
Definition: test_util.cpp:1609

NUM_SRC
#define NUM_SRC

QudaInvertParam_s::dagger
QudaDagType dagger
Definition: quda.h:207

matdagmat_mg4dir
void matdagmat_mg4dir(cpuColorSpinorField *out, void **link, void **ghostLink, cpuColorSpinorField *in, int dagger_bit, int mu, QudaPrecision sPrecision, QudaPrecision gPrecision, cpuColorSpinorField *tmp, QudaParity parity)

finalizeComms
void finalizeComms()
Definition: test_util.cpp:128

reliable_delta
double reliable_delta
Definition: test_util.cpp:1658

QUDA_CG_INVERTER
Definition: enum_quda.h:102

in
cpuColorSpinorField * in
Definition: staggered_invertmsrc_test.cpp:48

QudaGaugeParam_s::gauge_order
QudaGaugeFieldOrder gauge_order
Definition: quda.h:43

QudaInvertParam_s::true_res
double true_res
Definition: quda.h:126

get_prec_str
const char * get_prec_str(QudaPrecision prec)
Definition: misc.cpp:701

quda::LatticeFieldParam::siteSubset
QudaSiteSubset siteSubset
Definition: lattice_field.h:71

get_test_type
const char * get_test_type(int t)
Definition: misc.cpp:796

qdp_fatlink
void * qdp_fatlink[4]
Definition: staggered_invertmsrc_test.cpp:26

setDims
void setDims(int *)
Definition: test_util.cpp:151

QudaInvertParam_s::input_location
QudaFieldLocation input_location
Definition: quda.h:99

QudaInvertParam_s::true_res_hq_offset
double true_res_hq_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:191

QudaInvertParam_s::reliable_delta
double reliable_delta
Definition: quda.h:129

tmp
cpuColorSpinorField * tmp
Definition: staggered_invertmsrc_test.cpp:51

QudaInvertParam_s::pipeline
int pipeline
Definition: quda.h:167

gridsize_from_cmdline
int gridsize_from_cmdline[]
Definition: test_util.cpp:49

Nsrc
int Nsrc
Definition: test_util.cpp:1627

QudaInvertParam_s::use_init_guess
QudaUseInitGuess use_init_guess
Definition: quda.h:231

QudaInvertParam_s::solution_type
QudaSolutionType solution_type
Definition: quda.h:204

cpu_prec
QudaPrecision cpu_prec
Definition: staggered_invertmsrc_test.cpp:44

quda::LatticeFieldParam::x
int x[QUDA_MAX_DIM]
Definition: lattice_field.h:67

QUDA_SILENT
Definition: enum_quda.h:263

quda::GaugeFieldParam
Definition: gauge_field.h:10

display_test_info
void display_test_info()
Definition: staggered_invertmsrc_test.cpp:546

QudaGaugeParam_s::scale
double scale
Definition: quda.h:40

initQuda
void initQuda(int device)
Definition: interface_quda.cpp:679

QUDA_EVEN_ODD_SITE_ORDER
Definition: enum_quda.h:340

tdim
int tdim
Definition: test_util.cpp:1618

QudaInvertParam_s::output_location
QudaFieldLocation output_location
Definition: quda.h:100

QUDA_USE_INIT_GUESS_YES
Definition: enum_quda.h:429

inv_param
QudaInvertParam inv_param
Definition: covdev_test.cpp:37

ghost_longlink
void ** ghost_longlink
Definition: staggered_eigensolve_test.cpp:40

QudaGaugeParam_s
Definition: quda.h:32

quda::ColorSpinorParam::fieldOrder
QudaFieldOrder fieldOrder
Definition: color_spinor_field.h:93

QudaInvertParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:215

QudaInvertParam_s::verbosity
QudaVerbosity verbosity
Definition: quda.h:244

setSpinorSiteSize
void setSpinorSiteSize(int n)
Definition: test_util.cpp:211

csParam
ColorSpinorParam csParam
Definition: pack_test.cpp:24

QudaInvertParam_s::tol_offset
double tol_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:179

QUDA_MILC_GAUGE_ORDER
Definition: enum_quda.h:44

QudaInvertParam_s::true_res_offset
double true_res_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:185

newQudaInvertParam
QudaInvertParam newQudaInvertParam(void)

QudaInvertParam_s::gflops
double gflops
Definition: quda.h:250

get_recon_str
const char * get_recon_str(QudaReconstructType recon)
Definition: misc.cpp:768

quda::cpuGaugeField
Definition: gauge_field.h:580

main
int main(int argc, char **argv)
Definition: staggered_invertmsrc_test.cpp:580

QudaGaugeParam_s::cuda_prec_precondition
QudaPrecision cuda_prec_precondition
Definition: quda.h:58

QudaInvertParam_s::tol_hq
double tol_hq
Definition: quda.h:123

quda::ColorSpinorParam::gammaBasis
QudaGammaBasis gammaBasis
Definition: color_spinor_field.h:94

test_type
int test_type
Definition: test_util.cpp:1636

blas_reference.h

ref
cpuColorSpinorField * ref
Definition: staggered_invertmsrc_test.cpp:50

QudaInvertParam_s::true_res_hq
double true_res_hq
Definition: quda.h:127

matdagmat
void matdagmat(void *out, void **link, void *in, int dagger_bit, int mu, QudaPrecision sPrecision, QudaPrecision gPrecision, void *tmp, QudaParity parity)
Definition: covdev_reference.cpp:163

QUDA_PARITY_SITE_SUBSET
Definition: enum_quda.h:332

QudaInvertParam_s::gamma_basis
QudaGammaBasis gamma_basis
Definition: quda.h:221

QUDA_PCG_INVERTER
Definition: enum_quda.h:109

prec
QudaPrecision prec
Definition: test_util.cpp:1608

QudaGaugeParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:52

link_recon_sloppy
QudaReconstructType link_recon_sloppy
Definition: test_util.cpp:1606

quda::GaugeField::Ghost
const void ** Ghost() const
Definition: gauge_field.h:323

QudaInvertParam_s::tol_precondition
double tol_precondition
Definition: quda.h:289

quda::blas::HeavyQuarkResidualNorm
double3 HeavyQuarkResidualNorm(ColorSpinorField &x, ColorSpinorField &r)
Definition: reduce_quda.cu:809

dslash_util.h

QudaInvertParam_s::offset
double offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:176

QudaInvertParam_s::use_sloppy_partial_accumulator
int use_sloppy_partial_accumulator
Definition: quda.h:132

QudaParity
enum QudaParity_s QudaParity

inv_type
QudaInverterType inv_type
Definition: test_util.cpp:1640

QudaGaugeParam_s::reconstruct
QudaReconstructType reconstruct
Definition: quda.h:50

QudaGaugeParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:49

QUDA_ASQTAD_LONG_LINKS
Definition: enum_quda.h:31

QudaGaugeParam_s::X
int X[4]
Definition: quda.h:36

QudaInvertParam_s::mass
double mass
Definition: quda.h:105

QUDA_HEAVY_QUARK_RESIDUAL
Definition: enum_quda.h:189

QudaInvertParam_s::gcrNkrylov
int gcrNkrylov
Definition: quda.h:259

usage
void usage(char **argv)
Definition: test_util.cpp:1783

X3
static int X3
Definition: face_gauge.cpp:42

QudaInvertParam_s::maxiter
int maxiter
Definition: quda.h:128

QUDA_SD_INVERTER
Definition: enum_quda.h:107

V
int V
Definition: test_util.cpp:27

norm_2
double norm_2(void *v, int len, QudaPrecision precision)
Definition: blas_reference.cpp:48

quda::LatticeFieldParam::nDim
int nDim
Definition: lattice_field.h:64

X1
static int X1
Definition: face_gauge.cpp:42

QudaInvertParam_s::sp_pad
int sp_pad
Definition: quda.h:246

ydim
int ydim
Definition: test_util.cpp:1616

cpuFat
cpuGaugeField * cpuFat
Definition: staggered_invertmsrc_test.cpp:53

blas_quda.h

construct_fat_long_gauge_field
void construct_fat_long_gauge_field(void **fatlink, void **longlink, int type, QudaPrecision precision, QudaGaugeParam *param, QudaDslashType dslash_type)
Definition: test_util.cpp:1062

quda::ColorSpinorParam
Definition: color_spinor_field.h:80

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:62

end
static void end()
Definition: staggered_invertmsrc_test.cpp:523

QudaResidualType_s
QudaResidualType_s
Definition: enum_quda.h:186

set_params
static void set_params(QudaGaugeParam *gaugeParam, QudaInvertParam *inv_param, int X1, int X2, int X3, int X4, QudaPrecision cpu_prec, QudaPrecision prec, QudaPrecision prec_sloppy, QudaReconstructType link_recon, QudaReconstructType link_recon_sloppy, double mass, double tol, int maxiter, double reliable_delta, double tadpole_coeff)
Definition: staggered_invertmsrc_test.cpp:89

QudaGaugeParam_s::tadpole_coeff
double tadpole_coeff
Definition: quda.h:39

mass
double mass
Definition: staggered_invertmsrc_test.cpp:71

QudaInvertParam_s::cuda_prec_precondition
QudaPrecision cuda_prec_precondition
Definition: quda.h:217

QudaInvertParam_s::iter
int iter
Definition: quda.h:249

QUDA_STAGGERED_DSLASH
Definition: enum_quda.h:92

QudaInvertParam_s::num_src
int num_src
Definition: quda.h:171

QudaInvertParam_s::tol_restart
double tol_restart
Definition: quda.h:122

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:61

quda::ColorSpinorParam::nSpin
int nSpin
Definition: color_spinor_field.h:86

QudaReconstructType
enum QudaReconstructType_s QudaReconstructType

quda.h
Main header file for the QUDA library.

invertMultiSrcQuda
void invertMultiSrcQuda(void **_hp_x, void **_hp_b, QudaInvertParam *param)
Definition: interface_quda.cpp:3234

dslash_type
QudaDslashType dslash_type
Definition: test_util.cpp:1621

quda::s
__shared__ float s[]

tol_hq
double tol_hq
Definition: test_util.cpp:1657

QUDA_DEGRAND_ROSSI_GAMMA_BASIS
Definition: enum_quda.h:367

tol
double tol
Definition: test_util.cpp:1656

cpuLong
cpuGaugeField * cpuLong
Definition: staggered_invertmsrc_test.cpp:54

QudaInvertParam_s::Ls
int Ls
Definition: quda.h:109

printfQuda
#define printfQuda(...)
Definition: util_quda.h:115

QUDA_DAG_NO
Definition: enum_quda.h:218

QudaGaugeParam_s::t_boundary
QudaTboundary t_boundary
Definition: quda.h:45

QUDA_NORMOP_SOLVE
Definition: enum_quda.h:162

quda::ColorSpinorParam::siteOrder
QudaSiteOrder siteOrder
Definition: color_spinor_field.h:91

QUDA_DIRAC_ORDER
Definition: enum_quda.h:243

usage_extra
void usage_extra(char **argv)
Definition: staggered_invertmsrc_test.cpp:568

QudaDslashType
enum QudaDslashType_s QudaDslashType

QUDA_ANTI_PERIODIC_T
Definition: enum_quda.h:53

longlink
void * longlink
Definition: staggered_invertmsrc_test.cpp:30

quda::blas::mxpy
void mxpy(ColorSpinorField &x, ColorSpinorField &y)
Definition: blas_quda.h:34

QudaInvertParam_s::residual_type
QudaResidualType residual_type
Definition: quda.h:320

QUDA_EVEN_PARITY
Definition: enum_quda.h:287

QudaInvertParam_s::num_offset
int num_offset
Definition: quda.h:169

fatlink
void * fatlink
Definition: staggered_invertmsrc_test.cpp:29

NUM_OFFSETS
#define NUM_OFFSETS

QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:360

MAX
#define MAX(a, b)
Definition: staggered_invertmsrc_test.cpp:22

quda::ColorSpinorParam::create
QudaFieldCreate create
Definition: color_spinor_field.h:95

initComms
void initComms(int argc, char **argv, int *const commDims)
Definition: test_util.cpp:88

QUDA_NORMOP_PC_SOLVE
Definition: enum_quda.h:164

QUDA_GHOST_EXCHANGE_PAD
Definition: enum_quda.h:483

QUDA_MATPCDAG_MATPC_SOLUTION
Definition: enum_quda.h:155

QUDA_MATPC_EVEN_EVEN
Definition: enum_quda.h:210

QUDA_SU3_LINKS
Definition: enum_quda.h:23

zdim
int zdim
Definition: test_util.cpp:1617

parity
QudaParity parity
Definition: covdev_test.cpp:54

QudaInvertParam_s
Definition: quda.h:97

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:325

QUDA_ASQTAD_FAT_LINKS
Definition: enum_quda.h:30

gauge_field.h

QudaInvertParam_s::matpc_type
QudaMatPCType matpc_type
Definition: quda.h:206

QudaInverterType
enum QudaInverterType_s QudaInverterType

get_prec
QudaPrecision get_prec(QIO_Reader *infile)
Definition: qio_field.cpp:69

QUDA_L2_RELATIVE_RESIDUAL
Definition: enum_quda.h:187

quda::cpuColorSpinorField
Definition: color_spinor_field.h:865

QudaGaugeParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:47

quda::ColorSpinorField::V
void * V()
Definition: color_spinor_field.h:424

constructSpinorField
void constructSpinorField(Float *res)
Definition: staggered_invertmsrc_test.cpp:76

X4
static int X4
Definition: face_gauge.cpp:42

gaugeSiteSize
#define gaugeSiteSize
Definition: face_gauge.cpp:34

newQudaGaugeParam
QudaGaugeParam newQudaGaugeParam(void)

QUDA_RECONSTRUCT_INVALID
Definition: enum_quda.h:73

QudaInvertParam_s::preserve_source
QudaPreserveSource preserve_source
Definition: quda.h:211

quda::LatticeFieldParam::pad
int pad
Definition: lattice_field.h:69

Vh
int Vh
Definition: test_util.cpp:28