quda-ref/v1.0.0/staggered__invert__test_8cpp_source.html

 #include <iostream>
 #include <stdio.h>
 #include <stdlib.h>
 #include <string.h>

 #include <quda.h>
 #include <quda_internal.h>
 #include <dirac_quda.h>
 #include <dslash_quda.h>
 #include <invert_quda.h>
 #include <util_quda.h>
 #include <blas_quda.h>

 #include <misc.h>
 #include <test_util.h>
 #include <dslash_util.h>
 #include <staggered_dslash_reference.h>
 #include <staggered_gauge_utils.h>
 #include <llfat_reference.h>
 #include <gauge_field.h>
 #include <unitarization_links.h>
 #include <blas_reference.h>
 #include <random_quda.h>

 #if defined(QMP_COMMS)
 #include <qmp.h>
 #elif defined(MPI_COMMS)
 #include <mpi.h>
 #endif

 #include <qio_field.h>

 #define MAX(a,b) ((a)>(b)?(a):(b))

 // In a typical application, quda.h is the only QUDA header required.
 #include <quda.h>

 #define mySpinorSiteSize 6

 extern void usage(char** argv);

 void** ghost_fatlink, **ghost_longlink;

 extern int device;

 QudaPrecision cpu_prec = QUDA_DOUBLE_PRECISION;
 size_t gSize = sizeof(double);

 extern double reliable_delta;
 extern bool alternative_reliable;
 extern int test_type;
 extern int xdim;
 extern int ydim;
 extern int zdim;
 extern int tdim;
 extern int gridsize_from_cmdline[];
 extern QudaReconstructType link_recon;
 extern QudaPrecision prec;
 extern QudaReconstructType link_recon_sloppy;
 extern QudaPrecision prec_sloppy;
 extern QudaPrecision prec_refinement_sloppy;
 extern QudaInverterType inv_type;
 extern double mass; // the mass of the Dirac operator
 extern double kappa;
 extern int laplace3D;
 extern double tol;    // tolerance for inverter
 extern double tol_hq; // heavy-quark tolerance for inverter
 extern char latfile[];
 extern int Nsrc; // number of spinors to apply to simultaneously
 extern int niter;
 extern int gcrNkrylov;
 extern int pipeline;                      // length of pipeline for fused operations in GCR or BiCGstab-l
 extern int solution_accumulator_pipeline; // length of pipeline for fused solution update from the direction vectors
 extern QudaCABasis ca_basis; // basis for CA-CG solves
 extern double ca_lambda_min; // minimum eigenvalue for scaling Chebyshev CA-CG solves
 extern double ca_lambda_max; // maximum eigenvalue for scaling Chebyshev CA-CG solves

 // Dirac operator type
 extern QudaDslashType dslash_type;
 extern QudaMatPCType matpc_type; // preconditioning type
 extern QudaSolutionType solution_type; // solution type
 extern QudaSolveType solve_type;

 extern bool compute_fatlong; // build the true fat/long links or use random numbers
 extern double tadpole_factor;
 // relativistic correction for naik term
 extern double eps_naik;
 // Number of naiks. If eps_naik is 0.0, we only need
 // to construct one naik.
 static int n_naiks = 1;

 // For loading the gauge fields
 int argc_copy;
 char** argv_copy;

 int X[4];

 cpuColorSpinorField *in;
 cpuColorSpinorField *out;
 cpuColorSpinorField *ref;
 cpuColorSpinorField *tmp;

 static void end();

 void setGaugeParam(QudaGaugeParam &gauge_param)
 {
   gauge_param.X[0] = xdim;
   gauge_param.X[1] = ydim;
   gauge_param.X[2] = zdim;
   gauge_param.X[3] = tdim;

   gauge_param.cpu_prec = cpu_prec;
   gauge_param.cuda_prec = prec;
   gauge_param.reconstruct = link_recon;
   gauge_param.reconstruct_sloppy = link_recon_sloppy;
   gauge_param.cuda_prec_sloppy = prec_sloppy;
   gauge_param.cuda_prec_refinement_sloppy = prec_refinement_sloppy;

   gauge_param.anisotropy = 1.0;

   // For HISQ, this must always be set to 1.0, since the tadpole
   // correction is baked into the coefficients for the first fattening.
   // The tadpole doesn't mean anything for the second fattening
   // since the input fields are unitarized.
   gauge_param.tadpole_coeff = 1.0;

   if (dslash_type == QUDA_ASQTAD_DSLASH) {
     gauge_param.scale = -1.0 / 24.0;
     if (eps_naik != 0) { gauge_param.scale *= (1.0 + eps_naik); }
   } else {
     gauge_param.scale = 1.0;
   }
   gauge_param.gauge_order = QUDA_MILC_GAUGE_ORDER;
   gauge_param.t_boundary = QUDA_ANTI_PERIODIC_T;
   gauge_param.staggered_phase_type = QUDA_STAGGERED_PHASE_MILC;
   gauge_param.gauge_fix = QUDA_GAUGE_FIXED_NO;
   gauge_param.type = QUDA_WILSON_LINKS;

   gauge_param.ga_pad = 0;

 #ifdef MULTI_GPU
   int x_face_size = gauge_param.X[1] * gauge_param.X[2] * gauge_param.X[3] / 2;
   int y_face_size = gauge_param.X[0] * gauge_param.X[2] * gauge_param.X[3] / 2;
   int z_face_size = gauge_param.X[0] * gauge_param.X[1] * gauge_param.X[3] / 2;
   int t_face_size = gauge_param.X[0] * gauge_param.X[1] * gauge_param.X[2] / 2;
   int pad_size =MAX(x_face_size, y_face_size);
   pad_size = MAX(pad_size, z_face_size);
   pad_size = MAX(pad_size, t_face_size);
   gauge_param.ga_pad = pad_size;
 #endif
 }

 void setInvertParam(QudaInvertParam &inv_param)
 {
   // Solver params
   inv_param.verbosity = QUDA_VERBOSE;
   inv_param.mass = mass;
   inv_param.kappa = kappa = 1.0 / (8.0 + mass); // for Laplace operator
   inv_param.laplace3D = laplace3D;              // for Laplace operator

   // outer solver parameters
   inv_param.inv_type = inv_type;
   inv_param.tol = tol;
   inv_param.tol_restart = 1e-3; // now theoretical background for this parameter...
   inv_param.maxiter = niter;
   inv_param.reliable_delta = reliable_delta;
   inv_param.use_alternative_reliable = alternative_reliable;
   inv_param.use_sloppy_partial_accumulator = false;
   inv_param.solution_accumulator_pipeline = solution_accumulator_pipeline;
   inv_param.pipeline = pipeline;

   inv_param.Ls = Nsrc;

   if (tol_hq == 0 && tol == 0) {
     errorQuda("qudaInvert: requesting zero residual\n");
     exit(1);
   }
   // require both L2 relative and heavy quark residual to determine convergence
   inv_param.residual_type = static_cast<QudaResidualType_s>(0);
   inv_param.residual_type = (tol != 0) ?
     static_cast<QudaResidualType_s>(inv_param.residual_type | QUDA_L2_RELATIVE_RESIDUAL) :
     inv_param.residual_type;
   inv_param.residual_type = (tol_hq != 0) ?
     static_cast<QudaResidualType_s>(inv_param.residual_type | QUDA_HEAVY_QUARK_RESIDUAL) :
     inv_param.residual_type;
   inv_param.heavy_quark_check = (inv_param.residual_type & QUDA_HEAVY_QUARK_RESIDUAL ? 5 : 0);

   inv_param.tol_hq = tol_hq; // specify a tolerance for the residual for heavy quark residual

   inv_param.Nsteps = 2;

   // domain decomposition preconditioner parameters
   inv_param.inv_type_precondition = QUDA_SD_INVERTER;
   inv_param.tol_precondition = 1e-1;
   inv_param.maxiter_precondition = 10;
   inv_param.verbosity_precondition = QUDA_SILENT;
   inv_param.cuda_prec_precondition = inv_param.cuda_prec_sloppy;

   // Specify Krylov sub-size for GCR, BICGSTAB(L), basis size for CA-CG, CA-GCR
   inv_param.gcrNkrylov = gcrNkrylov;

   // Specify basis for CA-CG, lambda min/max for Chebyshev basis
   //   lambda_max < lambda_max . use power iters to generate
   inv_param.ca_basis = ca_basis;
   inv_param.ca_lambda_min = ca_lambda_min;
   inv_param.ca_lambda_max = ca_lambda_max;

   inv_param.solution_type = solution_type;
   inv_param.solve_type = solve_type;
   inv_param.matpc_type = matpc_type;
   inv_param.dagger = QUDA_DAG_NO;
   inv_param.mass_normalization = QUDA_MASS_NORMALIZATION;

   inv_param.cpu_prec = cpu_prec;
   inv_param.cuda_prec = prec;
   inv_param.cuda_prec_sloppy = prec_sloppy;
   inv_param.cuda_prec_refinement_sloppy = prec_refinement_sloppy;
   inv_param.preserve_source = QUDA_PRESERVE_SOURCE_YES;
   inv_param.gamma_basis = QUDA_DEGRAND_ROSSI_GAMMA_BASIS; // this is meaningless, but must be thus set
   inv_param.dirac_order = QUDA_DIRAC_ORDER;

   inv_param.dslash_type = dslash_type;

   inv_param.input_location = QUDA_CPU_FIELD_LOCATION;
   inv_param.output_location = QUDA_CPU_FIELD_LOCATION;

   int tmpint = MAX(X[1] * X[2] * X[3], X[0] * X[2] * X[3]);
   tmpint = MAX(tmpint, X[0] * X[1] * X[3]);
   tmpint = MAX(tmpint, X[0] * X[1] * X[2]);

   inv_param.sp_pad = tmpint;
 }

 int invert_test()
 {

   // Ensure that the default is improved staggered
   if (dslash_type != QUDA_ASQTAD_DSLASH && dslash_type != QUDA_STAGGERED_DSLASH && dslash_type != QUDA_LAPLACE_DSLASH)
     dslash_type = QUDA_ASQTAD_DSLASH;

   QudaGaugeParam gauge_param = newQudaGaugeParam();
   setGaugeParam(gauge_param);
   QudaInvertParam inv_param = newQudaInvertParam();
   setInvertParam(inv_param);

   // this must be before the FaceBuffer is created (this is because it allocates pinned memory - FIXME)
   initQuda(device);

   setDims(gauge_param.X);
   dw_setDims(gauge_param.X, Nsrc); // so we can use 5-d indexing from dwf
   setSpinorSiteSize(6);

   size_t gSize = (gauge_param.cpu_prec == QUDA_DOUBLE_PRECISION) ? sizeof(double) : sizeof(float);

   void* qdp_inlink[4] = {nullptr,nullptr,nullptr,nullptr};
   void* qdp_fatlink[4] = {nullptr,nullptr,nullptr,nullptr};
   void* qdp_longlink[4] = {nullptr,nullptr,nullptr,nullptr};
   void* milc_fatlink = nullptr;
   void* milc_longlink = nullptr;

   for (int dir = 0; dir < 4; dir++) {
     qdp_inlink[dir] = malloc(V*gaugeSiteSize*gSize);
     qdp_fatlink[dir] = malloc(V*gaugeSiteSize*gSize);
     qdp_longlink[dir] = malloc(V*gaugeSiteSize*gSize);
   }
   milc_fatlink = malloc(4*V*gaugeSiteSize*gSize);
   milc_longlink = malloc(4 * V * gaugeSiteSize * gSize);

   // for load, etc
   gauge_param.reconstruct = QUDA_RECONSTRUCT_NO;

   // load a field WITHOUT PHASES
   if (strcmp(latfile, "")) {
     read_gauge_field(latfile, qdp_inlink, gauge_param.cpu_prec, gauge_param.X, argc_copy, argv_copy);
     if (dslash_type != QUDA_LAPLACE_DSLASH) {
       applyGaugeFieldScaling_long(qdp_inlink, Vh, &gauge_param, QUDA_STAGGERED_DSLASH, gauge_param.cpu_prec);
     }
   } else {
     if (dslash_type == QUDA_LAPLACE_DSLASH) {
       construct_gauge_field(qdp_inlink, 1, gauge_param.cpu_prec, &gauge_param);
     } else {
       construct_fat_long_gauge_field(qdp_inlink, qdp_longlink, 1, gauge_param.cpu_prec, &gauge_param,
                                      compute_fatlong ? QUDA_STAGGERED_DSLASH : dslash_type);
     }
   }

   // Compute plaquette. Routine is aware that the gauge fields already have the phases on them.
   double plaq[3];
   computeStaggeredPlaquetteQDPOrder(qdp_inlink, plaq, gauge_param, dslash_type);

   printfQuda("Computed plaquette is %e (spatial = %e, temporal = %e)\n", plaq[0], plaq[1], plaq[2]);

   // QUDA_STAGGERED_DSLASH follows the same codepath whether or not you
   // "compute" the fat/long links or not.
   if (dslash_type == QUDA_STAGGERED_DSLASH || dslash_type == QUDA_LAPLACE_DSLASH) {
     for (int dir = 0; dir < 4; dir++) {
       memcpy(qdp_fatlink[dir], qdp_inlink[dir], V * gaugeSiteSize * gSize);
       memset(qdp_longlink[dir],0,V*gaugeSiteSize*gSize);
     }
   } else { // QUDA_ASQTAD_DSLASH

     if (compute_fatlong) {
       computeFatLongGPU(qdp_fatlink, qdp_longlink, qdp_inlink, gauge_param, gSize, n_naiks, eps_naik);
     } else {
       for (int dir = 0; dir < 4; dir++) {
         memcpy(qdp_fatlink[dir],qdp_inlink[dir], V*gaugeSiteSize*gSize);
       }
     }

     // Compute fat link plaquette
     computeStaggeredPlaquetteQDPOrder(qdp_fatlink, plaq, gauge_param, dslash_type);

     printfQuda("Computed fat link plaquette is %e (spatial = %e, temporal = %e)\n", plaq[0], plaq[1], plaq[2]);
   }

   // Alright, we've created all the void** links.
   // Create the void* pointers
   reorderQDPtoMILC(milc_fatlink, qdp_fatlink, V, gaugeSiteSize, gauge_param.cpu_prec, gauge_param.cpu_prec);
   reorderQDPtoMILC(milc_longlink, qdp_longlink, V, gaugeSiteSize, gauge_param.cpu_prec, gauge_param.cpu_prec);

   ColorSpinorParam csParam;
   csParam.nColor=3;
   csParam.nSpin = 1;
   csParam.nDim = 5;
   for (int d = 0; d < 4; d++) csParam.x[d] = gauge_param.X[d];
   bool pc = (inv_param.solution_type == QUDA_MATPC_SOLUTION || inv_param.solution_type == QUDA_MATPCDAG_MATPC_SOLUTION);
   if (pc) csParam.x[0] /= 2;
   csParam.x[4] = Nsrc;

   csParam.setPrecision(inv_param.cpu_prec);
   csParam.pad = 0;
   csParam.siteSubset = pc ? QUDA_PARITY_SITE_SUBSET : QUDA_FULL_SITE_SUBSET;
   csParam.siteOrder = QUDA_EVEN_ODD_SITE_ORDER;
   csParam.fieldOrder = QUDA_SPACE_SPIN_COLOR_FIELD_ORDER;
   csParam.gammaBasis = inv_param.gamma_basis;
   csParam.create = QUDA_ZERO_FIELD_CREATE;
   in = new cpuColorSpinorField(csParam);
   out = new cpuColorSpinorField(csParam);
   ref = new cpuColorSpinorField(csParam);
   tmp = new cpuColorSpinorField(csParam);

   // Construct source
   auto *rng = new quda::RNG(quda::LatticeFieldParam(gauge_param), 1234);
   rng->Init();

   construct_spinor_source(in->V(), 1, 3, inv_param.cpu_prec, csParam.x, *rng);

   rng->Release();
   delete rng;

 #ifdef MULTI_GPU
   int tmp_value = MAX(ydim*zdim*tdim/2, xdim*zdim*tdim/2);
   tmp_value = MAX(tmp_value, xdim * ydim * tdim / 2);
   tmp_value = MAX(tmp_value, xdim * ydim * zdim / 2);

   int fat_pad = tmp_value;
   int link_pad =  3*tmp_value;

   // FIXME: currently assume staggered is SU(3)
   gauge_param.type = (dslash_type == QUDA_STAGGERED_DSLASH || dslash_type == QUDA_LAPLACE_DSLASH) ?
     QUDA_SU3_LINKS :
     QUDA_ASQTAD_FAT_LINKS;
   gauge_param.reconstruct = QUDA_RECONSTRUCT_NO;
   GaugeFieldParam cpuFatParam(milc_fatlink, gauge_param);
   cpuFatParam.ghostExchange = QUDA_GHOST_EXCHANGE_PAD;
   cpuGaugeField *cpuFat = new cpuGaugeField(cpuFatParam);
   ghost_fatlink = (void**)cpuFat->Ghost();

   gauge_param.type = QUDA_ASQTAD_LONG_LINKS;
   GaugeFieldParam cpuLongParam(milc_longlink, gauge_param);
   cpuLongParam.ghostExchange = QUDA_GHOST_EXCHANGE_PAD;
   cpuGaugeField *cpuLong = new cpuGaugeField(cpuLongParam);
   ghost_longlink = (void**)cpuLong->Ghost();

 #else
   int fat_pad = 0;
   int link_pad = 0;
 #endif

   gauge_param.type = (dslash_type == QUDA_STAGGERED_DSLASH || dslash_type == QUDA_LAPLACE_DSLASH) ?
     QUDA_SU3_LINKS :
     QUDA_ASQTAD_FAT_LINKS;
   gauge_param.ga_pad = fat_pad;
   if (dslash_type == QUDA_STAGGERED_DSLASH || dslash_type == QUDA_LAPLACE_DSLASH) {
     gauge_param.reconstruct = link_recon;
     gauge_param.reconstruct_sloppy = link_recon_sloppy;
   } else {
     gauge_param.reconstruct = gauge_param.reconstruct_sloppy = QUDA_RECONSTRUCT_NO;
   }
   gauge_param.cuda_prec_precondition = gauge_param.cuda_prec_sloppy;
   gauge_param.reconstruct_precondition = gauge_param.reconstruct_sloppy;
   loadGaugeQuda(milc_fatlink, &gauge_param);

   if (dslash_type == QUDA_ASQTAD_DSLASH) {
     gauge_param.type = QUDA_ASQTAD_LONG_LINKS;
     gauge_param.ga_pad = link_pad;
     gauge_param.staggered_phase_type = QUDA_STAGGERED_PHASE_NO;
     gauge_param.reconstruct = link_recon;
     gauge_param.reconstruct_sloppy = link_recon_sloppy;
     gauge_param.cuda_prec_precondition = gauge_param.cuda_prec_sloppy;
     gauge_param.reconstruct_precondition = gauge_param.reconstruct_sloppy;
     loadGaugeQuda(milc_longlink, &gauge_param);
   }

   double time0 = -((double)clock()); // Start the timer

   double nrm2=0;
   double src2=0;
   int ret = 0;

   int len = 0;
   if (solution_type == QUDA_MAT_SOLUTION || solution_type == QUDA_MATDAG_MAT_SOLUTION) {
     len = V*Nsrc;
   } else {
     len = Vh*Nsrc;
   }

   switch (test_type) {
   case 0: // full parity solution
   case 1: // solving prec system, reconstructing
   case 2:

     invertQuda(out->V(), in->V(), &inv_param);
     time0 += clock(); // stop the timer
     time0 /= CLOCKS_PER_SEC;

     // In QUDA, the full staggered operator has the sign convention
     //{{m, -D_eo},{-D_oe,m}}, while the CPU verify function does not
     // have the minus sign. Passing in QUDA_DAG_YES solves this
     // discrepancy
     staggered_dslash(reinterpret_cast<cpuColorSpinorField *>(&ref->Even()), qdp_fatlink, qdp_longlink, ghost_fatlink,
                      ghost_longlink, reinterpret_cast<cpuColorSpinorField *>(&out->Odd()), QUDA_EVEN_PARITY,
                      QUDA_DAG_YES, inv_param.cpu_prec, gauge_param.cpu_prec, dslash_type);
     staggered_dslash(reinterpret_cast<cpuColorSpinorField *>(&ref->Odd()), qdp_fatlink, qdp_longlink, ghost_fatlink,
                      ghost_longlink, reinterpret_cast<cpuColorSpinorField *>(&out->Even()), QUDA_ODD_PARITY,
                      QUDA_DAG_YES, inv_param.cpu_prec, gauge_param.cpu_prec, dslash_type);

     if (dslash_type == QUDA_LAPLACE_DSLASH) {
       xpay(out->V(), kappa, ref->V(), ref->Length(), gauge_param.cpu_prec);
       ax(0.5 / kappa, ref->V(), ref->Length(), gauge_param.cpu_prec);
     } else {
       axpy(2 * mass, out->V(), ref->V(), ref->Length(), gauge_param.cpu_prec);
     }

     // Reference debugging code: print the first component
     // of the even and odd partities within a solution vector.
     /*
     printfQuda("\nLength: %lu\n", ref->Length());

     // for verification
     printfQuda("\n\nEven:\n");
     printfQuda("CUDA: %f\n", ((double*)(in->Even().V()))[0]);
     printfQuda("Soln: %f\n", ((double*)(out->Even().V()))[0]);
     printfQuda("CPU:  %f\n", ((double*)(ref->Even().V()))[0]);

     printfQuda("\n\nOdd:\n");
     printfQuda("CUDA: %f\n", ((double*)(in->Odd().V()))[0]);
     printfQuda("Soln: %f\n", ((double*)(out->Odd().V()))[0]);
     printfQuda("CPU:  %f\n", ((double*)(ref->Odd().V()))[0]);
     printfQuda("\n\n");
     */

     mxpy(in->V(), ref->V(), len * mySpinorSiteSize, inv_param.cpu_prec);
     nrm2 = norm_2(ref->V(), len * mySpinorSiteSize, inv_param.cpu_prec);
     src2 = norm_2(in->V(), len * mySpinorSiteSize, inv_param.cpu_prec);

     break;

   case 3: // even
   case 4:

     invertQuda(out->V(), in->V(), &inv_param);

     time0 += clock();
     time0 /= CLOCKS_PER_SEC;

     matdagmat(ref, qdp_fatlink, qdp_longlink, ghost_fatlink, ghost_longlink, out, mass, 0, inv_param.cpu_prec,
               gauge_param.cpu_prec, tmp, test_type == 3 ? QUDA_EVEN_PARITY : QUDA_ODD_PARITY, dslash_type);

     if (inv_param.cpu_prec == QUDA_SINGLE_PRECISION) {
       printfQuda("%f %f\n", ((float *)in->V())[12], ((float *)ref->V())[12]);
     } else {
       printfQuda("%f %f\n", ((double *)in->V())[12], ((double *)ref->V())[12]);
     }

     mxpy(in->V(), ref->V(), len * mySpinorSiteSize, inv_param.cpu_prec);
     nrm2 = norm_2(ref->V(), len * mySpinorSiteSize, inv_param.cpu_prec);
     src2 = norm_2(in->V(), len * mySpinorSiteSize, inv_param.cpu_prec);

     break;

   case 5: // multi mass CG, even
   case 6:

 #define NUM_OFFSETS 12

   {
         double masses[NUM_OFFSETS] ={0.06, 0.061, 0.064, 0.070, 0.077, 0.081, 0.1, 0.11, 0.12, 0.13, 0.14, 0.205};
         inv_param.num_offset = NUM_OFFSETS;
         // these can be set independently
         for (int i = 0; i < inv_param.num_offset; i++) {
           inv_param.tol_offset[i] = inv_param.tol;
           inv_param.tol_hq_offset[i] = inv_param.tol_hq;
         }
         void* outArray[NUM_OFFSETS];

         cpuColorSpinorField* spinorOutArray[NUM_OFFSETS];
         spinorOutArray[0] = out;
         for (int i = 1; i < inv_param.num_offset; i++) { spinorOutArray[i] = new cpuColorSpinorField(csParam); }

         for (int i = 0; i < inv_param.num_offset; i++) {
           outArray[i] = spinorOutArray[i]->V();
           inv_param.offset[i] = 4*masses[i]*masses[i];
         }

         invertMultiShiftQuda(outArray, in->V(), &inv_param);

         cudaDeviceSynchronize();
         time0 += clock(); // stop the timer
         time0 /= CLOCKS_PER_SEC;

         printfQuda("done: total time = %g secs, compute time = %g, %i iter / %g secs = %g gflops\n", time0,
             inv_param.secs, inv_param.iter, inv_param.secs, inv_param.gflops / inv_param.secs);

         printfQuda("checking the solution\n");
         QudaParity parity = QUDA_INVALID_PARITY;
         if (inv_param.solve_type == QUDA_NORMOP_SOLVE) {
           //parity = QUDA_EVENODD_PARITY;
           errorQuda("full parity not supported\n");
         } else if (inv_param.matpc_type == QUDA_MATPC_EVEN_EVEN) {
           parity = QUDA_EVEN_PARITY;
         } else if (inv_param.matpc_type == QUDA_MATPC_ODD_ODD) {
           parity = QUDA_ODD_PARITY;
         } else {
           errorQuda("ERROR: invalid spinor parity \n");
         }
         for(int i=0;i < inv_param.num_offset;i++){
           printfQuda("%dth solution: mass=%f, ", i, masses[i]);
           matdagmat(ref, qdp_fatlink, qdp_longlink, ghost_fatlink, ghost_longlink, spinorOutArray[i], masses[i], 0,
                     inv_param.cpu_prec, gauge_param.cpu_prec, tmp, parity, dslash_type);

           mxpy(in->V(), ref->V(), len*mySpinorSiteSize, inv_param.cpu_prec);
           double nrm2 = norm_2(ref->V(), len*mySpinorSiteSize, inv_param.cpu_prec);
           double src2 = norm_2(in->V(), len*mySpinorSiteSize, inv_param.cpu_prec);
           double hqr = sqrt(blas::HeavyQuarkResidualNorm(*spinorOutArray[i], *ref).z);
           double l2r = sqrt(nrm2/src2);

           printfQuda("Shift %d residuals: (L2 relative) tol %g, QUDA = %g, host = %g; (heavy-quark) tol %g, QUDA = %g, "
                      "host = %g\n",
               i, inv_param.tol_offset[i], inv_param.true_res_offset[i], l2r, inv_param.tol_hq_offset[i],
               inv_param.true_res_hq_offset[i], hqr);

           //emperical, if the cpu residue is more than 1 order the target accuracy, the it fails to converge
           if (sqrt(nrm2/src2) > 10*inv_param.tol_offset[i]){
             ret |=1;
           }
         }

         for(int i=1; i < inv_param.num_offset;i++) delete spinorOutArray[i];
   } break;

     default:
       errorQuda("Unsupported test type");

     } // switch

   if (test_type <=4){

     double hqr = sqrt(blas::HeavyQuarkResidualNorm(*out, *ref).z);
     double l2r = sqrt(nrm2/src2);

     printfQuda("Residuals: (L2 relative) tol %g, QUDA = %g, host = %g; (heavy-quark) tol %g, QUDA = %g, host = %g\n",
                inv_param.tol, inv_param.true_res, l2r, inv_param.tol_hq, inv_param.true_res_hq, hqr);

     printfQuda("done: total time = %g secs, compute time = %g secs, %i iter / %g secs = %g gflops, \n", time0,
         inv_param.secs, inv_param.iter, inv_param.secs, inv_param.gflops / inv_param.secs);
   }

   // Clean up gauge fields, at least
   for (int dir = 0; dir < 4; dir++) {
     if (qdp_inlink[dir] != nullptr) { free(qdp_inlink[dir]); qdp_inlink[dir] = nullptr; }
     if (qdp_fatlink[dir] != nullptr) { free(qdp_fatlink[dir]); qdp_fatlink[dir] = nullptr; }
     if (qdp_longlink[dir] != nullptr) { free(qdp_longlink[dir]); qdp_longlink[dir] = nullptr; }
   }
   if (milc_fatlink != nullptr) { free(milc_fatlink); milc_fatlink = nullptr; }
   if (milc_longlink != nullptr) { free(milc_longlink); milc_longlink = nullptr; }

 #ifdef MULTI_GPU
   if (cpuFat != nullptr) { delete cpuFat; cpuFat = nullptr; }
   if (cpuLong != nullptr) { delete cpuLong; cpuLong = nullptr; }
 #endif

   end();
   return ret;
 }

 static void end(void)
 {
   delete in;
   delete out;
   delete ref;
   delete tmp;

   endQuda();
 }

 void display_test_info()
 {
   printfQuda("running the following test:\n");

   printfQuda("prec    sloppy_prec    link_recon  sloppy_link_recon test_type  S_dimension T_dimension\n");
   printfQuda("%s   %s             %s            %s            %s         %d/%d/%d          %d \n", get_prec_str(prec),
       get_prec_str(prec_sloppy), get_recon_str(link_recon), get_recon_str(link_recon_sloppy),
       get_staggered_test_type(test_type), xdim, ydim, zdim, tdim);

   printfQuda("Grid partition info:     X  Y  Z  T\n");
   printfQuda("                         %d  %d  %d  %d\n", dimPartitioned(0), dimPartitioned(1), dimPartitioned(2),
       dimPartitioned(3));

   return ;

 }

   void
 usage_extra(char** argv )
 {
   printfQuda("Extra options:\n");
   printfQuda("    --test <0/1/2/3/4/5/6>                      # Test method\n");
   printfQuda("                                                0: Full parity inverter\n");
   printfQuda("                                                1: Even even spinor CG inverter, reconstruct to full parity\n");
   printfQuda("                                                2: Odd odd spinor CG inverter, reconstruct to full parity\n");
   printfQuda("                                                3: Even even spinor CG inverter\n");
   printfQuda("                                                4: Odd odd spinor CG inverter\n");
   printfQuda("                                                5: Even even spinor multishift CG inverter\n");
   printfQuda("                                                6: Odd odd spinor multishift CG inverter\n");
   printfQuda("    --cpu-prec <double/single/half>             # Set CPU precision\n");

   return ;
 }
 int main(int argc, char **argv)
 {

   // Set a default
   solve_type = QUDA_INVALID_SOLVE;

   for (int i = 1; i < argc; i++) {

     if (process_command_line_option(argc, argv, &i) == 0) { continue; }

     if (strcmp(argv[i], "--cpu-prec") == 0) {
       if (i+1 >= argc){
         usage(argv);
       }
       cpu_prec= get_prec(argv[i+1]);
       i++;
       continue;
     }

     printf("ERROR: Invalid option:%s\n", argv[i]);
     usage(argv);
   }

   // initialize QMP/MPI, QUDA comms grid and RNG (test_util.cpp)
   initComms(argc, argv, gridsize_from_cmdline);

   if (test_type < 0 || test_type > 6) {
     errorQuda("Test type %d is outside the valid range.\n", test_type);
   }

   // Ensure a reasonable default
   // ensure that the default is improved staggered
   if (dslash_type != QUDA_STAGGERED_DSLASH && dslash_type != QUDA_ASQTAD_DSLASH && dslash_type != QUDA_LAPLACE_DSLASH) {
     warningQuda("The dslash_type %d isn't staggered, asqtad, or laplace. Defaulting to asqtad.\n", dslash_type);
     dslash_type = QUDA_ASQTAD_DSLASH;
   }

   if (dslash_type == QUDA_LAPLACE_DSLASH) {
     if (test_type != 0) {
       errorQuda("Test type %d is not supported for the Laplace operator.\n", test_type);
     }

     solve_type = QUDA_DIRECT_SOLVE;
     solution_type = QUDA_MAT_SOLUTION;
     matpc_type = QUDA_MATPC_EVEN_EVEN; // doesn't matter

   } else {

     if (test_type == 0 && (inv_type == QUDA_CG_INVERTER || inv_type == QUDA_PCG_INVERTER) &&
         solve_type != QUDA_NORMOP_SOLVE && solve_type != QUDA_DIRECT_PC_SOLVE) {
       warningQuda("The full spinor staggered operator (test 0) can't be inverted with (P)CG. Switching to BiCGstab.\n");
       inv_type = QUDA_BICGSTAB_INVERTER;
     }

     if (solve_type == QUDA_INVALID_SOLVE) {
       if (test_type == 0) {
         solve_type = QUDA_DIRECT_SOLVE;
       } else {
         solve_type = QUDA_DIRECT_PC_SOLVE;
       }
     }

     if (test_type == 1 || test_type == 3 || test_type == 5) {
       matpc_type = QUDA_MATPC_EVEN_EVEN;
     } else if (test_type == 2 || test_type == 4 || test_type == 6) {
       matpc_type = QUDA_MATPC_ODD_ODD;
     } else if (test_type == 0) {
       matpc_type = QUDA_MATPC_EVEN_EVEN; // it doesn't matter
     }

     if (test_type == 0 || test_type == 1 || test_type == 2) {
       solution_type = QUDA_MAT_SOLUTION;
     } else {
       solution_type = QUDA_MATPC_SOLUTION;
     }
   }

   if (prec_sloppy == QUDA_INVALID_PRECISION){
     prec_sloppy = prec;
   }

   if (prec_refinement_sloppy == QUDA_INVALID_PRECISION){
     prec_refinement_sloppy = prec_sloppy;
   }
   if (link_recon_sloppy == QUDA_RECONSTRUCT_INVALID){
     link_recon_sloppy = link_recon;
   }

   if(inv_type != QUDA_CG_INVERTER && (test_type == 5 || test_type == 6)) {
     errorQuda("Preconditioning is currently not supported in multi-shift solver solvers");
   }


   // Set n_naiks to 2 if eps_naik != 0.0
   if (dslash_type == QUDA_ASQTAD_DSLASH) {
     if (eps_naik != 0.0) {
       if (compute_fatlong) {
         n_naiks = 2;
         printfQuda("Note: epsilon-naik != 0, testing epsilon correction links.\n");
       } else {
         eps_naik = 0.0;
         printfQuda("Not computing fat-long, ignoring epsilon correction.\n");
       }
     } else {
       printfQuda("Note: epsilon-naik = 0, testing original HISQ links.\n");
     }
   }

   display_test_info();

   printfQuda("dslash_type = %d\n", dslash_type);

   argc_copy = argc;
   argv_copy = argv;

   int ret = invert_test();

   // finalize the communications layer
   finalizeComms();

   return ret;
 }
QudaInvertParam_s::maxiter_precondition
int maxiter_precondition
Definition: quda.h:292

QudaInvertParam_s::laplace3D
int laplace3D
Definition: quda.h:119

zdim
int zdim
Definition: test_util.cpp:1617

invert_quda.h

QudaInvertParam_s::secs
double secs
Definition: quda.h:251

qdp_longlink
void * qdp_longlink[4]
Definition: staggered_invertmsrc_test.cpp:27

argv_copy
char ** argv_copy
Definition: staggered_invert_test.cpp:94

dimPartitioned
int dimPartitioned(int dim)
Definition: test_util.cpp:1776

quda::blas::ax
void ax(double a, ColorSpinorField &x)
Definition: blas_quda.cu:508

QudaInvertParam_s::dirac_order
QudaDiracFieldOrder dirac_order
Definition: quda.h:219

applyGaugeFieldScaling_long
void applyGaugeFieldScaling_long(Float **gauge, int Vh, QudaGaugeParam *param, QudaDslashType dslash_type)
Definition: test_util.cpp:747

QUDA_VERBOSE
Definition: enum_quda.h:265

QudaInvertParam_s::mass_normalization
QudaMassNormalization mass_normalization
Definition: quda.h:208

QudaInvertParam_s::tol_hq_offset
double tol_hq_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:182

QudaInvertParam_s::Nsteps
int Nsteps
Definition: quda.h:256

niter
int niter
Definition: test_util.cpp:1629

gSize
size_t gSize
Definition: staggered_invert_test.cpp:47

QudaGaugeParam_s::reconstruct_sloppy
QudaReconstructType reconstruct_sloppy
Definition: quda.h:53

QudaGaugeParam_s::anisotropy
double anisotropy
Definition: quda.h:38

QUDA_RECONSTRUCT_NO
Definition: enum_quda.h:67

quda::LatticeFieldParam::ghostExchange
QudaGhostExchange ghostExchange
Definition: lattice_field.h:76

quda::ColorSpinorParam::setPrecision
void setPrecision(QudaPrecision precision, QudaPrecision ghost_precision=QUDA_INVALID_PRECISION, bool force_native=false)
Definition: color_spinor_field.h:231

QUDA_MAT_SOLUTION
Definition: enum_quda.h:151

invertMultiShiftQuda
void invertMultiShiftQuda(void **_hp_x, void *_hp_b, QudaInvertParam *param)
Definition: interface_quda.cpp:3579

ca_basis
QudaCABasis ca_basis
Definition: test_util.cpp:1631

endQuda
void endQuda(void)
Definition: interface_quda.cpp:1461

construct_gauge_field
void construct_gauge_field(void **gauge, int type, QudaPrecision precision, QudaGaugeParam *param)
Definition: test_util.cpp:1047

QudaInvertParam_s::ca_basis
QudaCABasis ca_basis
Definition: quda.h:298

staggered_gauge_utils.h

QudaInvertParam_s::solve_type
QudaSolveType solve_type
Definition: quda.h:205

QudaInvertParam_s::verbosity_precondition
QudaVerbosity verbosity_precondition
Definition: quda.h:286

llfat_reference.h

QudaPrecision
enum QudaPrecision_s QudaPrecision

QUDA_INVALID_PARITY
Definition: enum_quda.h:289

QudaGaugeParam_s::ga_pad
int ga_pad
Definition: quda.h:63

misc.h

QUDA_MATPC_ODD_ODD
Definition: enum_quda.h:211

dw_setDims
void dw_setDims(int *X, const int L5)
Definition: test_util.cpp:187

prec_sloppy
QudaPrecision prec_sloppy
Definition: test_util.cpp:1609

QudaGaugeParam_s::gauge_fix
QudaGaugeFixed gauge_fix
Definition: quda.h:61

QUDA_PRESERVE_SOURCE_YES
Definition: enum_quda.h:237

solve_type
QudaSolveType solve_type
Definition: test_util.cpp:1663

QUDA_MASS_NORMALIZATION
Definition: enum_quda.h:225

QudaInvertParam_s::inv_type_precondition
QudaInverterType inv_type_precondition
Definition: quda.h:270

quda::ColorSpinorParam::nColor
int nColor
Definition: color_spinor_field.h:85

QUDA_INVALID_PRECISION
Definition: enum_quda.h:63

QUDA_ASQTAD_DSLASH
Definition: enum_quda.h:93

QudaGaugeParam_s::type
QudaLinkType type
Definition: quda.h:42

ghost_fatlink
void ** ghost_fatlink
Definition: staggered_invert_test.cpp:42

QudaInvertParam_s::kappa
double kappa
Definition: quda.h:106

quda::LatticeFieldParam
Definition: lattice_field.h:47

staggered_dslash_reference.h

invertQuda
void invertQuda(void *h_x, void *h_b, QudaInvertParam *param)
Definition: interface_quda.cpp:2830

usage_extra
void usage_extra(char **argv)
Definition: staggered_invert_test.cpp:625

errorQuda
#define errorQuda(...)
Definition: util_quda.h:121

ca_lambda_min
double ca_lambda_min
Definition: test_util.cpp:1632

QudaInvertParam_s::tol
double tol
Definition: quda.h:121

QudaInvertParam_s::dslash_type
QudaDslashType dslash_type
Definition: quda.h:102

QUDA_GAUGE_FIXED_NO
Definition: enum_quda.h:77

QudaGaugeParam_s::reconstruct_precondition
QudaReconstructType reconstruct_precondition
Definition: quda.h:59

QudaInvertParam_s::inv_type
QudaInverterType inv_type
Definition: quda.h:103

test_util.h

QudaInvertParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:214

ydim
int ydim
Definition: test_util.cpp:1616

link_recon_sloppy
QudaReconstructType link_recon_sloppy
Definition: test_util.cpp:1606

QUDA_ODD_PARITY
Definition: enum_quda.h:288

QUDA_SPACE_SPIN_COLOR_FIELD_ORDER
Definition: enum_quda.h:350

QudaSolveType
enum QudaSolveType_s QudaSolveType

quda::sqrt
__host__ __device__ ValueType sqrt(ValueType x)
Definition: complex_quda.h:120

loadGaugeQuda
void loadGaugeQuda(void *h_gauge, QudaGaugeParam *param)
Definition: interface_quda.cpp:729

QUDA_WILSON_LINKS
Definition: enum_quda.h:29

argc_copy
int argc_copy
Definition: staggered_invert_test.cpp:93

device
int device
Definition: test_util.cpp:1602

QudaInvertParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:213

process_command_line_option
int process_command_line_option(int argc, char **argv, int *idx)
Definition: test_util.cpp:2019

QUDA_FULL_SITE_SUBSET
Definition: enum_quda.h:333

quda::ColorSpinorField::Even
const ColorSpinorField & Even() const
Definition: color_spinor_field.cpp:608

quda::ColorSpinorField::Odd
const ColorSpinorField & Odd() const
Definition: color_spinor_field.cpp:616

QudaGaugeParam_s::staggered_phase_type
QudaStaggeredPhase staggered_phase_type
Definition: quda.h:71

QUDA_DIRECT_SOLVE
Definition: enum_quda.h:161

solution_accumulator_pipeline
int solution_accumulator_pipeline
Definition: test_util.cpp:1635

QudaInvertParam_s::dagger
QudaDagType dagger
Definition: quda.h:207

matpc_type
QudaMatPCType matpc_type
Definition: test_util.cpp:1662

finalizeComms
void finalizeComms()
Definition: test_util.cpp:128

pipeline
int pipeline
Definition: test_util.cpp:1634

gauge_param
QudaGaugeParam gauge_param
Definition: dslash_ctest.cpp:36

QudaInvertParam_s::cuda_prec_refinement_sloppy
QudaPrecision cuda_prec_refinement_sloppy
Definition: quda.h:216

QUDA_CG_INVERTER
Definition: enum_quda.h:102

link_recon
QudaReconstructType link_recon
Definition: test_util.cpp:1605

invert_test
int invert_test()
Definition: staggered_invert_test.cpp:234

QudaGaugeParam_s::gauge_order
QudaGaugeFieldOrder gauge_order
Definition: quda.h:43

QudaInvertParam_s::true_res
double true_res
Definition: quda.h:126

util_quda.h

get_staggered_test_type
const char * get_staggered_test_type(int t)
Definition: misc.cpp:827

test_type
int test_type
Definition: test_util.cpp:1636

tadpole_factor
double tadpole_factor
Definition: test_util.cpp:1651

get_prec_str
const char * get_prec_str(QudaPrecision prec)
Definition: misc.cpp:701

tdim
int tdim
Definition: test_util.cpp:1618

construct_spinor_source
void construct_spinor_source(void *v, int nSpin, int nColor, QudaPrecision precision, const int *const x, quda::RNG &rng)
Definition: test_util.cpp:1342

inv_type
QudaInverterType inv_type
Definition: test_util.cpp:1640

QudaInvertParam_s::ca_lambda_max
double ca_lambda_max
Definition: quda.h:304

QUDA_DAG_YES
Definition: enum_quda.h:219

n_naiks
static int n_naiks
Definition: staggered_invert_test.cpp:90

tol
double tol
Definition: test_util.cpp:1656

quda::LatticeFieldParam::siteSubset
QudaSiteSubset siteSubset
Definition: lattice_field.h:71

compute_fatlong
bool compute_fatlong
Definition: test_util.cpp:1655

qdp_fatlink
void * qdp_fatlink[4]
Definition: staggered_invertmsrc_test.cpp:26

setDims
void setDims(int *)
Definition: test_util.cpp:151

QudaInvertParam_s::input_location
QudaFieldLocation input_location
Definition: quda.h:99

QudaInvertParam_s::true_res_hq_offset
double true_res_hq_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:191

quda::blas::xpay
void xpay(ColorSpinorField &x, double a, ColorSpinorField &y)
Definition: blas_quda.h:37

QudaInvertParam_s::reliable_delta
double reliable_delta
Definition: quda.h:129

dirac_quda.h

QudaInvertParam_s::pipeline
int pipeline
Definition: quda.h:167

QudaInvertParam_s::solution_accumulator_pipeline
int solution_accumulator_pipeline
Definition: quda.h:142

QudaInvertParam_s::ca_lambda_min
double ca_lambda_min
Definition: quda.h:301

prec_refinement_sloppy
QudaPrecision prec_refinement_sloppy
Definition: test_util.cpp:1610

QudaInvertParam_s::solution_type
QudaSolutionType solution_type
Definition: quda.h:204

QudaInvertParam_s::use_alternative_reliable
int use_alternative_reliable
Definition: quda.h:131

QUDA_MATPC_SOLUTION
Definition: enum_quda.h:153

quda::LatticeFieldParam::x
int x[QUDA_MAX_DIM]
Definition: lattice_field.h:67

QUDA_SILENT
Definition: enum_quda.h:263

quda::GaugeFieldParam
Definition: gauge_field.h:10

computeStaggeredPlaquetteQDPOrder
void computeStaggeredPlaquetteQDPOrder(void **qdp_link, double plaq[3], const QudaGaugeParam &gauge_param_in, const QudaDslashType dslash_type)
Definition: staggered_gauge_utils.cpp:283

QudaGaugeParam_s::scale
double scale
Definition: quda.h:40

initQuda
void initQuda(int device)
Definition: interface_quda.cpp:679

prec
QudaPrecision prec
Definition: test_util.cpp:1608

QUDA_EVEN_ODD_SITE_ORDER
Definition: enum_quda.h:340

QudaInvertParam_s::output_location
QudaFieldLocation output_location
Definition: quda.h:100

cpu_prec
QudaPrecision cpu_prec
Definition: staggered_invert_test.cpp:46

inv_param
QudaInvertParam inv_param
Definition: covdev_test.cpp:37

QudaGaugeParam_s
Definition: quda.h:32

quda::ColorSpinorParam::fieldOrder
QudaFieldOrder fieldOrder
Definition: color_spinor_field.h:93

QudaInvertParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:215

reorderQDPtoMILC
void reorderQDPtoMILC(Out *milc_out, In **qdp_in, int V, int siteSize)
Definition: llfat_reference.cpp:856

QudaInvertParam_s::verbosity
QudaVerbosity verbosity
Definition: quda.h:244

setSpinorSiteSize
void setSpinorSiteSize(int n)
Definition: test_util.cpp:211

csParam
ColorSpinorParam csParam
Definition: pack_test.cpp:24

QudaInvertParam_s::tol_offset
double tol_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:179

QUDA_MILC_GAUGE_ORDER
Definition: enum_quda.h:44

QudaInvertParam_s::true_res_offset
double true_res_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:185

quda::blas::axpy
void axpy(double a, ColorSpinorField &x, ColorSpinorField &y)
Definition: blas_quda.h:35

in
cpuColorSpinorField * in
Definition: staggered_invert_test.cpp:98

newQudaInvertParam
QudaInvertParam newQudaInvertParam(void)

QudaInvertParam_s::gflops
double gflops
Definition: quda.h:250

get_recon_str
const char * get_recon_str(QudaReconstructType recon)
Definition: misc.cpp:768

tmp
cpuColorSpinorField * tmp
Definition: staggered_invert_test.cpp:101

quda::cpuGaugeField
Definition: gauge_field.h:580

QudaGaugeParam_s::cuda_prec_precondition
QudaPrecision cuda_prec_precondition
Definition: quda.h:58

mySpinorSiteSize
#define mySpinorSiteSize
Definition: staggered_invert_test.cpp:38

quda::RNG
Class declaration to initialize and hold CURAND RNG states.
Definition: random_quda.h:23

QudaInvertParam_s::tol_hq
double tol_hq
Definition: quda.h:123

QudaMatPCType
enum QudaMatPCType_s QudaMatPCType

quda::ColorSpinorParam::gammaBasis
QudaGammaBasis gammaBasis
Definition: color_spinor_field.h:94

xdim
int xdim
Definition: test_util.cpp:1615

blas_reference.h

warningQuda
#define warningQuda(...)
Definition: util_quda.h:133

QudaInvertParam_s::true_res_hq
double true_res_hq
Definition: quda.h:127

QudaSolutionType
enum QudaSolutionType_s QudaSolutionType

matdagmat
void matdagmat(void *out, void **link, void *in, int dagger_bit, int mu, QudaPrecision sPrecision, QudaPrecision gPrecision, void *tmp, QudaParity parity)
Definition: covdev_reference.cpp:163

QUDA_PARITY_SITE_SUBSET
Definition: enum_quda.h:332

QudaInvertParam_s::gamma_basis
QudaGammaBasis gamma_basis
Definition: quda.h:221

staggered_dslash
void staggered_dslash(cpuColorSpinorField *out, void **fatlink, void **longlink, void **ghost_fatlink, void **ghost_longlink, cpuColorSpinorField *in, int oddBit, int daggerBit, QudaPrecision sPrecision, QudaPrecision gPrecision, QudaDslashType dslash_type)
Definition: staggered_dslash_reference.cpp:132

QUDA_PCG_INVERTER
Definition: enum_quda.h:109

QudaGaugeParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:52

quda::GaugeField::Ghost
const void ** Ghost() const
Definition: gauge_field.h:323

QudaInvertParam_s::tol_precondition
double tol_precondition
Definition: quda.h:289

quda::blas::HeavyQuarkResidualNorm
double3 HeavyQuarkResidualNorm(ColorSpinorField &x, ColorSpinorField &r)
Definition: reduce_quda.cu:809

dslash_util.h

QudaInvertParam_s::offset
double offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:176

QudaInvertParam_s::use_sloppy_partial_accumulator
int use_sloppy_partial_accumulator
Definition: quda.h:132

QUDA_LAPLACE_DSLASH
Definition: enum_quda.h:96

QudaInvertParam_s::heavy_quark_check
int heavy_quark_check
Definition: quda.h:165

QudaParity
enum QudaParity_s QudaParity

reliable_delta
double reliable_delta
Definition: test_util.cpp:1658

QudaGaugeParam_s::reconstruct
QudaReconstructType reconstruct
Definition: quda.h:50

QudaGaugeParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:49

QUDA_ASQTAD_LONG_LINKS
Definition: enum_quda.h:31

QudaGaugeParam_s::X
int X[4]
Definition: quda.h:36

latfile
char latfile[]
Definition: test_util.cpp:1623

QudaInvertParam_s::mass
double mass
Definition: quda.h:105

QUDA_HEAVY_QUARK_RESIDUAL
Definition: enum_quda.h:189

ghost_longlink
void ** ghost_longlink
Definition: staggered_invert_test.cpp:42

QudaInvertParam_s::gcrNkrylov
int gcrNkrylov
Definition: quda.h:259

QudaInvertParam_s::maxiter
int maxiter
Definition: quda.h:128

tol_hq
double tol_hq
Definition: test_util.cpp:1657

NUM_OFFSETS
#define NUM_OFFSETS

QUDA_BICGSTAB_INVERTER
Definition: enum_quda.h:103

QUDA_SD_INVERTER
Definition: enum_quda.h:107

mass
double mass
Definition: test_util.cpp:1646

QudaGaugeParam_s::cuda_prec_refinement_sloppy
QudaPrecision cuda_prec_refinement_sloppy
Definition: quda.h:55

V
int V
Definition: test_util.cpp:27

norm_2
double norm_2(void *v, int len, QudaPrecision precision)
Definition: blas_reference.cpp:48

quda::LatticeFieldParam::nDim
int nDim
Definition: lattice_field.h:64

eps_naik
double eps_naik
Definition: test_util.cpp:1652

QudaInvertParam_s::sp_pad
int sp_pad
Definition: quda.h:246

computeFatLongGPU
void computeFatLongGPU(void **qdp_fatlink, void **qdp_longlink, void **qdp_inlink, QudaGaugeParam &gauge_param, size_t gSize, int n_naiks, double eps_naik)
Definition: staggered_gauge_utils.cpp:162

memset
void * memset(void *s, int c, size_t n)

main
int main(int argc, char **argv)
Definition: staggered_invert_test.cpp:640

cpuLong
cpuGaugeField * cpuLong
Definition: staggered_dslash_ctest.cpp:51

blas_quda.h

construct_fat_long_gauge_field
void construct_fat_long_gauge_field(void **fatlink, void **longlink, int type, QudaPrecision precision, QudaGaugeParam *param, QudaDslashType dslash_type)
Definition: test_util.cpp:1062

laplace3D
int laplace3D
Definition: test_util.cpp:1622

ca_lambda_max
double ca_lambda_max
Definition: test_util.cpp:1633

quda::ColorSpinorParam
Definition: color_spinor_field.h:80

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:62

display_test_info
void display_test_info()
Definition: staggered_invert_test.cpp:607

unitarization_links.h

QudaResidualType_s
QudaResidualType_s
Definition: enum_quda.h:186

dslash_type
QudaDslashType dslash_type
Definition: test_util.cpp:1621

QudaGaugeParam_s::tadpole_coeff
double tadpole_coeff
Definition: quda.h:39

out
cpuColorSpinorField * out
Definition: staggered_invert_test.cpp:99

QudaInvertParam_s::cuda_prec_precondition
QudaPrecision cuda_prec_precondition
Definition: quda.h:217

ref
cpuColorSpinorField * ref
Definition: staggered_invert_test.cpp:100

QudaInvertParam_s::iter
int iter
Definition: quda.h:249

QUDA_STAGGERED_DSLASH
Definition: enum_quda.h:92

alternative_reliable
bool alternative_reliable
Definition: test_util.cpp:1659

QudaInvertParam_s::tol_restart
double tol_restart
Definition: quda.h:122

setGaugeParam
void setGaugeParam(QudaGaugeParam &gauge_param)
Definition: staggered_invert_test.cpp:105

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:61

quda::ColorSpinorParam::nSpin
int nSpin
Definition: color_spinor_field.h:86

QudaReconstructType
enum QudaReconstructType_s QudaReconstructType

quda.h
Main header file for the QUDA library.

MAX
#define MAX(a, b)
Definition: staggered_invert_test.cpp:33

QudaCABasis
enum QudaCABasis_s QudaCABasis

qdp_inlink
void * qdp_inlink[4]
Definition: staggered_dslash_ctest.cpp:45

QUDA_DEGRAND_ROSSI_GAMMA_BASIS
Definition: enum_quda.h:367

dslash_quda.h

kappa
double kappa
Definition: test_util.cpp:1647

cpuFat
cpuGaugeField * cpuFat
Definition: staggered_dslash_ctest.cpp:50

QudaInvertParam_s::Ls
int Ls
Definition: quda.h:109

printfQuda
#define printfQuda(...)
Definition: util_quda.h:115

QUDA_DAG_NO
Definition: enum_quda.h:218

QudaGaugeParam_s::t_boundary
QudaTboundary t_boundary
Definition: quda.h:45

QUDA_NORMOP_SOLVE
Definition: enum_quda.h:162

quda::ColorSpinorParam::siteOrder
QudaSiteOrder siteOrder
Definition: color_spinor_field.h:91

QUDA_STAGGERED_PHASE_MILC
Definition: enum_quda.h:490

qio_field.h

QUDA_DIRAC_ORDER
Definition: enum_quda.h:243

QudaDslashType
enum QudaDslashType_s QudaDslashType

QUDA_ANTI_PERIODIC_T
Definition: enum_quda.h:53

setInvertParam
void setInvertParam(QudaInvertParam &inv_param)
Definition: staggered_invert_test.cpp:153

quda::ColorSpinorField::Length
size_t Length() const
Definition: color_spinor_field.h:413

X
int X[4]
Definition: staggered_invert_test.cpp:96

QUDA_DIRECT_PC_SOLVE
Definition: enum_quda.h:163

quda::blas::mxpy
void mxpy(ColorSpinorField &x, ColorSpinorField &y)
Definition: blas_quda.h:34

QudaInvertParam_s::residual_type
QudaResidualType residual_type
Definition: quda.h:320

gridsize_from_cmdline
int gridsize_from_cmdline[]
Definition: test_util.cpp:49

QUDA_EVEN_PARITY
Definition: enum_quda.h:287

QudaInvertParam_s::num_offset
int num_offset
Definition: quda.h:169

QUDA_MATDAG_MAT_SOLUTION
Definition: enum_quda.h:152

QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:360

random_quda.h

Nsrc
int Nsrc
Definition: test_util.cpp:1627

quda::ColorSpinorParam::create
QudaFieldCreate create
Definition: color_spinor_field.h:95

gcrNkrylov
int gcrNkrylov
Definition: test_util.cpp:1630

initComms
void initComms(int argc, char **argv, int *const commDims)
Definition: test_util.cpp:88

QUDA_GHOST_EXCHANGE_PAD
Definition: enum_quda.h:483

read_gauge_field
void read_gauge_field(const char *filename, void *gauge[], QudaPrecision prec, const int *X, int argc, char *argv[])
Definition: qio_field.h:14

QUDA_MATPCDAG_MATPC_SOLUTION
Definition: enum_quda.h:155

QUDA_MATPC_EVEN_EVEN
Definition: enum_quda.h:210

QUDA_SU3_LINKS
Definition: enum_quda.h:23

parity
QudaParity parity
Definition: covdev_test.cpp:54

QudaInvertParam_s
Definition: quda.h:97

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:325

solution_type
QudaSolutionType solution_type
Definition: test_util.cpp:1664

QUDA_ASQTAD_FAT_LINKS
Definition: enum_quda.h:30

gauge_field.h

QudaInvertParam_s::matpc_type
QudaMatPCType matpc_type
Definition: quda.h:206

usage
void usage(char **argv)
Definition: test_util.cpp:1783

QUDA_STAGGERED_PHASE_NO
Definition: enum_quda.h:489

QudaInverterType
enum QudaInverterType_s QudaInverterType

get_prec
QudaPrecision get_prec(QIO_Reader *infile)
Definition: qio_field.cpp:69

QUDA_L2_RELATIVE_RESIDUAL
Definition: enum_quda.h:187

end
static void end()
Definition: staggered_invert_test.cpp:597

quda::cpuColorSpinorField
Definition: color_spinor_field.h:865

QudaGaugeParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:47

quda::ColorSpinorField::V
void * V()
Definition: color_spinor_field.h:424

QUDA_INVALID_SOLVE
Definition: enum_quda.h:169

gaugeSiteSize
#define gaugeSiteSize
Definition: face_gauge.cpp:34

newQudaGaugeParam
QudaGaugeParam newQudaGaugeParam(void)

QUDA_RECONSTRUCT_INVALID
Definition: enum_quda.h:73

QudaInvertParam_s::preserve_source
QudaPreserveSource preserve_source
Definition: quda.h:211

quda_internal.h

quda::LatticeFieldParam::pad
int pad
Definition: lattice_field.h:69

Vh
int Vh
Definition: test_util.cpp:28