quda-ref/v1.0.0/invert__test_8cpp_source.html

 #include <stdlib.h>
 #include <stdio.h>
 #include <time.h>
 #include <math.h>
 #include <string.h>
 #include <limits>

 #include <util_quda.h>
 #include <random_quda.h>
 #include <test_util.h>
 #include <dslash_util.h>
 #include <blas_reference.h>
 #include <wilson_dslash_reference.h>
 #include <domain_wall_dslash_reference.h>
 #include "misc.h"

 #include <qio_field.h>

 #define MAX(a,b) ((a)>(b)?(a):(b))

 // In a typical application, quda.h is the only QUDA header required.
 #include <quda.h>

 // Wilson, clover-improved Wilson, twisted mass, and domain wall are supported.
 extern QudaDslashType dslash_type;

 // Twisted mass flavor type
 extern QudaTwistFlavorType twist_flavor;

 extern int device;
 extern int xdim;
 extern int ydim;
 extern int zdim;
 extern int tdim;
 extern int Lsdim;
 extern int gridsize_from_cmdline[];
 extern QudaPrecision prec;
 extern QudaPrecision  prec_sloppy;
 extern QudaPrecision  prec_precondition;
 extern QudaPrecision  prec_refinement_sloppy;
 extern QudaReconstructType link_recon;
 extern QudaReconstructType link_recon_sloppy;
 extern QudaReconstructType link_recon_precondition;
 extern QudaInverterType  inv_type;
 extern double reliable_delta; // reliable update parameter
 extern bool alternative_reliable;
 extern QudaInverterType  precon_type;
 extern int multishift; // whether to test multi-shift or standard solver
 extern double mass; // mass of Dirac operator
 extern double kappa; // kappa of Dirac operator
 extern double mu;
 extern double epsilon;
 extern double anisotropy; // temporal anisotropy
 extern double tol; // tolerance for inverter
 extern double tol_hq; // heavy-quark tolerance for inverter
 extern QudaMassNormalization normalization; // mass normalization of Dirac operators
 extern QudaMatPCType matpc_type; // preconditioning type
 extern QudaSolutionType solution_type; // the solution we desire
 extern QudaSolveType solve_type;       // the solve type we want to find the solution

 extern double clover_coeff;
 extern bool compute_clover;

 extern QudaVerbosity verbosity;
 extern QudaVerbosity mg_verbosity[QUDA_MAX_MG_LEVEL]; // use this for preconditioner verbosity

 extern int Nsrc; // number of spinors to apply to simultaneously
 extern int niter; // max solver iterations
 extern int gcrNkrylov; // number of inner iterations for GCR, or l for BiCGstab-l
 extern QudaCABasis ca_basis; // basis for CA-CG solves
 extern double ca_lambda_min; // minimum eigenvalue for scaling Chebyshev CA-CG solves
 extern double ca_lambda_max; // maximum eigenvalue for scaling Chebyshev CA-CG solves
 extern int pipeline; // length of pipeline for fused operations in GCR or BiCGstab-l
 extern int solution_accumulator_pipeline; // length of pipeline for fused solution update from the direction vectors
 extern char latfile[];
 extern bool unit_gauge;

 extern void usage(char** );


 void
 display_test_info()
 {
   printfQuda("running the following test:\n");

   printfQuda("prec    prec_sloppy   multishift  matpc_type  recon  recon_sloppy S_dimension T_dimension Ls_dimension   dslash_type  normalization\n");
   printfQuda("%6s   %6s          %d     %12s     %2s     %2s         %3d/%3d/%3d     %3d         %2d       %14s  %8s\n",
        get_prec_str(prec),get_prec_str(prec_sloppy), multishift, get_matpc_str(matpc_type),
        get_recon_str(link_recon),
        get_recon_str(link_recon_sloppy),
        xdim, ydim, zdim, tdim, Lsdim,
        get_dslash_str(dslash_type),
        get_mass_normalization_str(normalization));

   printfQuda("Grid partition info:     X  Y  Z  T\n");
   printfQuda("                         %d  %d  %d  %d\n",
        dimPartitioned(0),
        dimPartitioned(1),
        dimPartitioned(2),
        dimPartitioned(3));

   return ;

 }

 int main(int argc, char **argv)
 {

   mg_verbosity[0] = QUDA_SILENT; // set default preconditioner verbosity

   if (multishift) solution_type = QUDA_MATPCDAG_MATPC_SOLUTION; // set a correct default for the multi-shift solver

   for (int i = 1; i < argc; i++){
     if(process_command_line_option(argc, argv, &i) == 0){
       continue;
     }
     printfQuda("ERROR: Invalid option:%s\n", argv[i]);
     usage(argv);
   }

   if (prec_sloppy == QUDA_INVALID_PRECISION) prec_sloppy = prec;
   if (prec_refinement_sloppy == QUDA_INVALID_PRECISION) prec_refinement_sloppy = prec_sloppy;
   if (prec_precondition == QUDA_INVALID_PRECISION) prec_precondition = prec_sloppy;
   if (link_recon_sloppy == QUDA_RECONSTRUCT_INVALID) link_recon_sloppy = link_recon;
   if (link_recon_precondition == QUDA_RECONSTRUCT_INVALID) link_recon_precondition = link_recon_sloppy;

   // initialize QMP/MPI, QUDA comms grid and RNG (test_util.cpp)
   initComms(argc, argv, gridsize_from_cmdline);

   display_test_info();

   // *** QUDA parameters begin here.

   if (dslash_type != QUDA_WILSON_DSLASH &&
       dslash_type != QUDA_CLOVER_WILSON_DSLASH &&
       dslash_type != QUDA_TWISTED_MASS_DSLASH &&
       dslash_type != QUDA_DOMAIN_WALL_4D_DSLASH &&
       dslash_type != QUDA_MOBIUS_DWF_DSLASH &&
       dslash_type != QUDA_TWISTED_CLOVER_DSLASH &&
       dslash_type != QUDA_DOMAIN_WALL_DSLASH) {
     printfQuda("dslash_type %d not supported\n", dslash_type);
     exit(0);
   }

   QudaPrecision cpu_prec = QUDA_DOUBLE_PRECISION;
   QudaPrecision cuda_prec = prec;
   QudaPrecision cuda_prec_sloppy = prec_sloppy;
   QudaPrecision cuda_prec_refinement_sloppy = prec_refinement_sloppy;
   QudaPrecision cuda_prec_precondition = prec_precondition;

   QudaGaugeParam gauge_param = newQudaGaugeParam();
   QudaInvertParam inv_param = newQudaInvertParam();

   double kappa5;

   gauge_param.X[0] = xdim;
   gauge_param.X[1] = ydim;
   gauge_param.X[2] = zdim;
   gauge_param.X[3] = tdim;
   inv_param.Ls = 1;

   gauge_param.anisotropy = anisotropy;
   gauge_param.type = QUDA_WILSON_LINKS;
   gauge_param.gauge_order = QUDA_QDP_GAUGE_ORDER;
   gauge_param.t_boundary = QUDA_PERIODIC_T;

   gauge_param.cpu_prec = cpu_prec;
   gauge_param.cuda_prec = cuda_prec;
   gauge_param.reconstruct = link_recon;
   gauge_param.cuda_prec_sloppy = cuda_prec_sloppy;
   gauge_param.reconstruct_sloppy = link_recon_sloppy;
   gauge_param.cuda_prec_precondition = cuda_prec_precondition;
   gauge_param.reconstruct_precondition = link_recon_precondition;
   gauge_param.reconstruct_refinement_sloppy = link_recon_sloppy;
   gauge_param.cuda_prec_refinement_sloppy = cuda_prec_refinement_sloppy;

   gauge_param.gauge_fix = QUDA_GAUGE_FIXED_NO;

   inv_param.dslash_type = dslash_type;

   if (kappa == -1.0) {
     inv_param.mass = mass;
     inv_param.kappa = 1.0 / (2.0 * (1 + 3/gauge_param.anisotropy + mass));
   } else {
     inv_param.kappa = kappa;
     inv_param.mass = 0.5/kappa - (1 + 3/gauge_param.anisotropy);
   }
   inv_param.mu = mu;

   if (dslash_type == QUDA_TWISTED_MASS_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     inv_param.epsilon = epsilon;
     inv_param.twist_flavor = twist_flavor;
     inv_param.Ls = (inv_param.twist_flavor == QUDA_TWIST_NONDEG_DOUBLET) ? 2 : 1;
   } else if (dslash_type == QUDA_DOMAIN_WALL_DSLASH ||
              dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH ||
        dslash_type == QUDA_MOBIUS_DWF_DSLASH) {
     inv_param.m5 = -1.8;
     kappa5 = 0.5/(5 + inv_param.m5);
     inv_param.Ls = Lsdim;
     for(int k = 0; k < Lsdim; k++) // for mobius only
     {
       // b5[k], c[k] values are chosen for arbitrary values,
       // but the difference of them are same as 1.0
       inv_param.b_5[k] = 1.452;
       inv_param.c_5[k] = 0.452;
     }
   }

   // offsets used only by multi-shift solver
   inv_param.num_offset = 12;
   double offset[12] = {0.01, 0.02, 0.03, 0.04, 0.05, 0.06, 0.07, 0.08, 0.09, 0.1, 0.11, 0.12};
   for (int i=0; i<inv_param.num_offset; i++) inv_param.offset[i] = offset[i];

   inv_param.inv_type = inv_type;
   inv_param.solution_type = solution_type;
   inv_param.solve_type = solve_type;
   inv_param.matpc_type = matpc_type;

   inv_param.dagger = QUDA_DAG_NO;
   inv_param.mass_normalization = normalization;
   inv_param.solver_normalization = QUDA_DEFAULT_NORMALIZATION;


   inv_param.pipeline = pipeline;

   inv_param.Nsteps = 2;
   inv_param.gcrNkrylov = gcrNkrylov;
   inv_param.ca_basis = ca_basis;
   inv_param.ca_lambda_min = ca_lambda_min;
   inv_param.ca_lambda_max = ca_lambda_max;
   inv_param.tol = tol;
   inv_param.tol_restart = 1e-3; //now theoretical background for this parameter...
   if(tol_hq == 0 && tol == 0){
     errorQuda("qudaInvert: requesting zero residual\n");
     exit(1);
   }
   // require both L2 relative and heavy quark residual to determine convergence
   inv_param.residual_type = static_cast<QudaResidualType_s>(0);
   inv_param.residual_type = (tol != 0) ? static_cast<QudaResidualType_s> ( inv_param.residual_type | QUDA_L2_RELATIVE_RESIDUAL) : inv_param.residual_type;
   inv_param.residual_type = (tol_hq != 0) ? static_cast<QudaResidualType_s> (inv_param.residual_type | QUDA_HEAVY_QUARK_RESIDUAL) : inv_param.residual_type;

   inv_param.tol_hq = tol_hq; // specify a tolerance for the residual for heavy quark residual

   // these can be set individually
   for (int i=0; i<inv_param.num_offset; i++) {
     inv_param.tol_offset[i] = inv_param.tol;
     inv_param.tol_hq_offset[i] = inv_param.tol_hq;
   }
   inv_param.maxiter = niter;
   inv_param.reliable_delta = reliable_delta;
   inv_param.use_alternative_reliable = alternative_reliable;
   inv_param.use_sloppy_partial_accumulator = 0;
   inv_param.solution_accumulator_pipeline = solution_accumulator_pipeline;
   inv_param.max_res_increase = 1;

   // domain decomposition preconditioner parameters
   inv_param.inv_type_precondition = precon_type;

   inv_param.schwarz_type = QUDA_ADDITIVE_SCHWARZ;
   inv_param.precondition_cycle = 1;
   inv_param.tol_precondition = 1e-1;
   inv_param.maxiter_precondition = 10;
   inv_param.verbosity_precondition = mg_verbosity[0];
   inv_param.cuda_prec_precondition = cuda_prec_precondition;
   inv_param.omega = 1.0;

   inv_param.cpu_prec = cpu_prec;
   inv_param.cuda_prec = cuda_prec;
   inv_param.cuda_prec_sloppy = cuda_prec_sloppy;
   inv_param.cuda_prec_refinement_sloppy = cuda_prec_refinement_sloppy;
   inv_param.preserve_source = QUDA_PRESERVE_SOURCE_YES;
   inv_param.gamma_basis = QUDA_DEGRAND_ROSSI_GAMMA_BASIS;
   inv_param.dirac_order = QUDA_DIRAC_ORDER;

   inv_param.input_location = QUDA_CPU_FIELD_LOCATION;
   inv_param.output_location = QUDA_CPU_FIELD_LOCATION;

   gauge_param.ga_pad = 0; // 24*24*24/2;
   inv_param.sp_pad = 0; // 24*24*24/2;
   inv_param.cl_pad = 0; // 24*24*24/2;

   // For multi-GPU, ga_pad must be large enough to store a time-slice
 #ifdef MULTI_GPU
   int x_face_size = gauge_param.X[1]*gauge_param.X[2]*gauge_param.X[3]/2;
   int y_face_size = gauge_param.X[0]*gauge_param.X[2]*gauge_param.X[3]/2;
   int z_face_size = gauge_param.X[0]*gauge_param.X[1]*gauge_param.X[3]/2;
   int t_face_size = gauge_param.X[0]*gauge_param.X[1]*gauge_param.X[2]/2;
   int pad_size =MAX(x_face_size, y_face_size);
   pad_size = MAX(pad_size, z_face_size);
   pad_size = MAX(pad_size, t_face_size);
   gauge_param.ga_pad = pad_size;
 #endif

   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     inv_param.clover_cpu_prec = cpu_prec;
     inv_param.clover_cuda_prec = cuda_prec;
     inv_param.clover_cuda_prec_sloppy = cuda_prec_sloppy;
     inv_param.clover_cuda_prec_precondition = cuda_prec_precondition;
     inv_param.clover_cuda_prec_refinement_sloppy = cuda_prec_sloppy;
     inv_param.clover_order = QUDA_PACKED_CLOVER_ORDER;
     inv_param.clover_coeff = clover_coeff;
   }

   inv_param.verbosity = verbosity;

   // *** Everything between here and the call to initQuda() is
   // *** application-specific.

   // set parameters for the reference Dslash, and prepare fields to be loaded
   if (dslash_type == QUDA_DOMAIN_WALL_DSLASH ||
       dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH ||
       dslash_type == QUDA_MOBIUS_DWF_DSLASH) {
     dw_setDims(gauge_param.X, inv_param.Ls);
   } else {
     setDims(gauge_param.X);
   }

   setSpinorSiteSize(24);

   size_t gSize = (gauge_param.cpu_prec == QUDA_DOUBLE_PRECISION) ? sizeof(double) : sizeof(float);
   size_t sSize = (inv_param.cpu_prec == QUDA_DOUBLE_PRECISION) ? sizeof(double) : sizeof(float);

   void *gauge[4], *clover=0, *clover_inv=0;

   for (int dir = 0; dir < 4; dir++) {
     gauge[dir] = malloc(V*gaugeSiteSize*gSize);
   }

   if (strcmp(latfile,"")) {  // load in the command line supplied gauge field
     read_gauge_field(latfile, gauge, gauge_param.cpu_prec, gauge_param.X, argc, argv);
     construct_gauge_field(gauge, 2, gauge_param.cpu_prec, &gauge_param);
   } else { // else generate an SU(3) field
     if (unit_gauge) {
       // unit SU(3) field
       construct_gauge_field(gauge, 0, gauge_param.cpu_prec, &gauge_param);
     } else {
       // random SU(3) field
       construct_gauge_field(gauge, 1, gauge_param.cpu_prec, &gauge_param);
     }
   }

   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     double norm = 0.01; // clover components are random numbers in the range (-norm, norm)
     double diag = 1.0; // constant added to the diagonal

     size_t cSize = inv_param.clover_cpu_prec;
     clover = malloc(V*cloverSiteSize*cSize);
     clover_inv = malloc(V*cloverSiteSize*cSize);
     if (!compute_clover) construct_clover_field(clover, norm, diag, inv_param.clover_cpu_prec);

     inv_param.compute_clover = compute_clover;
     if (compute_clover) inv_param.return_clover = 1;
     inv_param.compute_clover_inverse = 1;
     inv_param.return_clover_inverse = 1;
   }

   void *spinorIn = malloc(V*spinorSiteSize*sSize*inv_param.Ls);
   void *spinorCheck = malloc(V*spinorSiteSize*sSize*inv_param.Ls);

   void *spinorOut = NULL, **spinorOutMulti = NULL;
   if (multishift) {
     spinorOutMulti = (void**)malloc(inv_param.num_offset*sizeof(void *));
     for (int i=0; i<inv_param.num_offset; i++) {
       spinorOutMulti[i] = malloc(V*spinorSiteSize*sSize*inv_param.Ls);
     }
   } else {
     spinorOut = malloc(V*spinorSiteSize*sSize*inv_param.Ls);
   }

   // initialize the QUDA library
   initQuda(device);

   // load the gauge field
   loadGaugeQuda((void*)gauge, &gauge_param);

   double plaq[3];
   plaqQuda(plaq);
   printfQuda("Computed plaquette is %e (spatial = %e, temporal = %e)\n", plaq[0], plaq[1], plaq[2]);

   // load the clover term, if desired
   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH)
     loadCloverQuda(clover, clover_inv, &inv_param);

   double *time = new double[Nsrc];
   double *gflops = new double[Nsrc];
   auto *rng = new quda::RNG(quda::LatticeFieldParam(gauge_param), 1234);
   rng->Init();

   for (int i = 0; i < Nsrc; i++) {

     construct_spinor_source(spinorIn, 4, 3, inv_param.cpu_prec, gauge_param.X, *rng);

     if (multishift) {
       invertMultiShiftQuda(spinorOutMulti, spinorIn, &inv_param);
     } else {
       invertQuda(spinorOut, spinorIn, &inv_param);
     }

     time[i] = inv_param.secs;
     gflops[i] = inv_param.gflops / inv_param.secs;
     printfQuda("Done: %i iter / %g secs = %g Gflops\n\n", inv_param.iter, inv_param.secs,
                inv_param.gflops / inv_param.secs);
   }

   rng->Release();
   delete rng;

   auto mean_time = 0.0;
   auto mean_time2 = 0.0;
   auto mean_gflops = 0.0;
   auto mean_gflops2 = 0.0;
   for (int i = 0; i < Nsrc; i++) {
     mean_time += time[i];
     mean_time2 += time[i] * time[i];
     mean_gflops += gflops[i];
     mean_gflops2 += gflops[i] * gflops[i];
   }

   mean_time /= Nsrc;
   mean_time2 /= Nsrc;
   auto stddev_time = Nsrc > 1 ? sqrt((Nsrc / ((double)Nsrc - 1.0)) * (mean_time2 - mean_time * mean_time)) : std::numeric_limits<double>::infinity();
   mean_gflops /= Nsrc;
   mean_gflops2 /= Nsrc;
   auto stddev_gflops = Nsrc > 1 ? sqrt((Nsrc / ((double)Nsrc - 1.0)) * (mean_gflops2 - mean_gflops * mean_gflops)) : std::numeric_limits<double>::infinity();
   printfQuda("%d solves, with mean solve time %g (stddev = %g), mean GFLOPS %g (stddev = %g)\n", Nsrc, mean_time,
              stddev_time, mean_gflops, stddev_gflops);

   delete[] time;
   delete[] gflops;

   if (multishift) {
     if (inv_param.mass_normalization == QUDA_MASS_NORMALIZATION) {
       errorQuda("Mass normalization not supported for multi-shift solver in invert_test");
     }

     void *spinorTmp = malloc(V*spinorSiteSize*sSize*inv_param.Ls);

     printfQuda("Host residuum checks: \n");
     for(int i=0; i < inv_param.num_offset; i++) {
       ax(0, spinorCheck, V*spinorSiteSize, inv_param.cpu_prec);

       if (dslash_type == QUDA_TWISTED_MASS_DSLASH) {
   if (inv_param.twist_flavor != QUDA_TWIST_SINGLET) {
           int tm_offset = Vh*spinorSiteSize;
     void *out0 = spinorCheck;
     void *out1 = (char*)out0 + tm_offset*cpu_prec;

     void *tmp0 = spinorTmp;
     void *tmp1 = (char*)tmp0 + tm_offset*cpu_prec;

     void *in0  = spinorOutMulti[i];
     void *in1  = (char*)in0 + tm_offset*cpu_prec;

     tm_ndeg_matpc(tmp0, tmp1, gauge, in0, in1, inv_param.kappa, inv_param.mu, inv_param.epsilon, inv_param.matpc_type, 0, inv_param.cpu_prec, gauge_param);
     tm_ndeg_matpc(out0, out1, gauge, tmp0, tmp1, inv_param.kappa, inv_param.mu, inv_param.epsilon, inv_param.matpc_type, 1, inv_param.cpu_prec, gauge_param);
   } else {
     tm_matpc(spinorTmp, gauge, spinorOutMulti[i], inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
        inv_param.matpc_type, 0, inv_param.cpu_prec, gauge_param);
     tm_matpc(spinorCheck, gauge, spinorTmp, inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
        inv_param.matpc_type, 1, inv_param.cpu_prec, gauge_param);
   }
       } else if (dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
   if (inv_param.twist_flavor != QUDA_TWIST_SINGLET)
     errorQuda("Twisted mass solution type not supported");
   tmc_matpc(spinorTmp, gauge, spinorOutMulti[i], clover, clover_inv, inv_param.kappa, inv_param.mu,
       inv_param.twist_flavor, inv_param.matpc_type, 0, inv_param.cpu_prec, gauge_param);
         tmc_matpc(spinorCheck, gauge, spinorTmp, clover, clover_inv, inv_param.kappa, inv_param.mu,
       inv_param.twist_flavor, inv_param.matpc_type, 1, inv_param.cpu_prec, gauge_param);
       } else if (dslash_type == QUDA_WILSON_DSLASH) {
         wil_matpc(spinorTmp, gauge, spinorOutMulti[i], inv_param.kappa, inv_param.matpc_type, 0,
                   inv_param.cpu_prec, gauge_param);
         wil_matpc(spinorCheck, gauge, spinorTmp, inv_param.kappa, inv_param.matpc_type, 1,
                   inv_param.cpu_prec, gauge_param);
       } else if (dslash_type == QUDA_CLOVER_WILSON_DSLASH) {
         clover_matpc(spinorTmp, gauge, clover, clover_inv, spinorOutMulti[i], inv_param.kappa, inv_param.matpc_type, 0,
          inv_param.cpu_prec, gauge_param);
         clover_matpc(spinorCheck, gauge, clover, clover_inv, spinorTmp, inv_param.kappa, inv_param.matpc_type, 1,
          inv_param.cpu_prec, gauge_param);
       } else {
         printfQuda("Domain wall not supported for multi-shift\n");
         exit(-1);
       }

       axpy(inv_param.offset[i], spinorOutMulti[i], spinorCheck, Vh*spinorSiteSize, inv_param.cpu_prec);
       mxpy(spinorIn, spinorCheck, Vh*spinorSiteSize, inv_param.cpu_prec);
       double nrm2 = norm_2(spinorCheck, Vh*spinorSiteSize, inv_param.cpu_prec);
       double src2 = norm_2(spinorIn, Vh*spinorSiteSize, inv_param.cpu_prec);
       double l2r = sqrt(nrm2 / src2);

       printfQuda("Shift %d residuals: (L2 relative) tol %g, QUDA = %g, host = %g; (heavy-quark) tol %g, QUDA = %g\n",
      i, inv_param.tol_offset[i], inv_param.true_res_offset[i], l2r,
      inv_param.tol_hq_offset[i], inv_param.true_res_hq_offset[i]);
     }
     free(spinorTmp);

   } else {

     if (inv_param.solution_type == QUDA_MAT_SOLUTION) {

       if (dslash_type == QUDA_TWISTED_MASS_DSLASH) {
   if(inv_param.twist_flavor == QUDA_TWIST_SINGLET) {
     tm_mat(spinorCheck, gauge, spinorOut, inv_param.kappa, inv_param.mu, inv_param.twist_flavor, 0, inv_param.cpu_prec, gauge_param);
   } else {
           int tm_offset = V*spinorSiteSize;
     void *evenOut = spinorCheck;
     void *oddOut  = (char*)evenOut + tm_offset*cpu_prec;

     void *evenIn  = spinorOut;
     void *oddIn   = (char*)evenIn + tm_offset*cpu_prec;

     tm_ndeg_mat(evenOut, oddOut, gauge, evenIn, oddIn, inv_param.kappa, inv_param.mu, inv_param.epsilon, 0, inv_param.cpu_prec, gauge_param);
   }
       } else if (dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
   tmc_mat(spinorCheck, gauge, clover, spinorOut, inv_param.kappa, inv_param.mu, inv_param.twist_flavor, 0,
     inv_param.cpu_prec, gauge_param);
       } else if (dslash_type == QUDA_WILSON_DSLASH) {
         wil_mat(spinorCheck, gauge, spinorOut, inv_param.kappa, 0, inv_param.cpu_prec, gauge_param);
       } else if (dslash_type == QUDA_CLOVER_WILSON_DSLASH) {
         clover_mat(spinorCheck, gauge, clover, spinorOut, inv_param.kappa, 0, inv_param.cpu_prec, gauge_param);
       } else if (dslash_type == QUDA_DOMAIN_WALL_DSLASH) {
         dw_mat(spinorCheck, gauge, spinorOut, kappa5, inv_param.dagger, inv_param.cpu_prec, gauge_param, inv_param.mass);
       } else if (dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH) {
         dw_4d_mat(spinorCheck, gauge, spinorOut, kappa5, inv_param.dagger, inv_param.cpu_prec, gauge_param, inv_param.mass);
       } else if (dslash_type == QUDA_MOBIUS_DWF_DSLASH) {
         double _Complex *kappa_b = (double _Complex *)malloc(Lsdim * sizeof(double _Complex));
         double _Complex *kappa_c = (double _Complex *)malloc(Lsdim * sizeof(double _Complex));
         for(int xs = 0 ; xs < Lsdim ; xs++)
         {
           kappa_b[xs] = 1.0/(2*(inv_param.b_5[xs]*(4.0 + inv_param.m5) + 1.0));
           kappa_c[xs] = 1.0/(2*(inv_param.c_5[xs]*(4.0 + inv_param.m5) - 1.0));
         }
   mdw_mat(spinorCheck, gauge, spinorOut, kappa_b, kappa_c, inv_param.dagger, inv_param.cpu_prec, gauge_param, inv_param.mass, inv_param.b_5, inv_param.c_5);
   free(kappa_b);
   free(kappa_c);
       } else {
         errorQuda("Unsupported dslash_type");
       }
       if (inv_param.mass_normalization == QUDA_MASS_NORMALIZATION) {
         if (dslash_type == QUDA_DOMAIN_WALL_DSLASH ||
             dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH ||
             dslash_type == QUDA_MOBIUS_DWF_DSLASH) {
           ax(0.5/kappa5, spinorCheck, V*spinorSiteSize*inv_param.Ls, inv_param.cpu_prec);
         } else if (dslash_type == QUDA_TWISTED_MASS_DSLASH && twist_flavor == QUDA_TWIST_NONDEG_DOUBLET) {
           ax(0.5/inv_param.kappa, spinorCheck, 2*V*spinorSiteSize, inv_param.cpu_prec);
   } else {
           ax(0.5/inv_param.kappa, spinorCheck, V*spinorSiteSize, inv_param.cpu_prec);
         }
       }

     } else if(inv_param.solution_type == QUDA_MATPC_SOLUTION) {

       if (dslash_type == QUDA_TWISTED_MASS_DSLASH) {
   if (inv_param.twist_flavor != QUDA_TWIST_SINGLET) {
           int tm_offset = Vh*spinorSiteSize;
     void *out0 = spinorCheck;
     void *out1 = (char*)out0 + tm_offset*cpu_prec;

     void *in0  = spinorOut;
     void *in1  = (char*)in0 + tm_offset*cpu_prec;

     tm_ndeg_matpc(out0, out1, gauge, in0, in1, inv_param.kappa, inv_param.mu, inv_param.epsilon, inv_param.matpc_type, 0, inv_param.cpu_prec, gauge_param);
   } else {
     tm_matpc(spinorCheck, gauge, spinorOut, inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
        inv_param.matpc_type, 0, inv_param.cpu_prec, gauge_param);
   }
       } else if (dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
   if (inv_param.twist_flavor != QUDA_TWIST_SINGLET)
     errorQuda("Twisted mass solution type not supported");
         tmc_matpc(spinorCheck, gauge, spinorOut, clover, clover_inv, inv_param.kappa, inv_param.mu,
       inv_param.twist_flavor, inv_param.matpc_type, 0, inv_param.cpu_prec, gauge_param);
       } else if (dslash_type == QUDA_WILSON_DSLASH) {
         wil_matpc(spinorCheck, gauge, spinorOut, inv_param.kappa, inv_param.matpc_type, 0,
                   inv_param.cpu_prec, gauge_param);
       } else if (dslash_type == QUDA_CLOVER_WILSON_DSLASH) {
         clover_matpc(spinorCheck, gauge, clover, clover_inv, spinorOut, inv_param.kappa, inv_param.matpc_type, 0,
          inv_param.cpu_prec, gauge_param);
       } else if (dslash_type == QUDA_DOMAIN_WALL_DSLASH) {
         dw_matpc(spinorCheck, gauge, spinorOut, kappa5, inv_param.matpc_type, 0, inv_param.cpu_prec, gauge_param, inv_param.mass);
       } else if (dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH) {
         dw_4d_matpc(spinorCheck, gauge, spinorOut, kappa5, inv_param.matpc_type, 0, inv_param.cpu_prec, gauge_param, inv_param.mass);
       } else if (dslash_type == QUDA_MOBIUS_DWF_DSLASH) {
         double _Complex *kappa_b = (double _Complex *)malloc(Lsdim * sizeof(double _Complex));
         double _Complex *kappa_c = (double _Complex *)malloc(Lsdim * sizeof(double _Complex));
         for(int xs = 0 ; xs < Lsdim ; xs++)
         {
           kappa_b[xs] = 1.0/(2*(inv_param.b_5[xs]*(4.0 + inv_param.m5) + 1.0));
           kappa_c[xs] = 1.0/(2*(inv_param.c_5[xs]*(4.0 + inv_param.m5) - 1.0));
         }
         mdw_matpc(spinorCheck, gauge, spinorOut, kappa_b, kappa_c, inv_param.matpc_type, 0, inv_param.cpu_prec, gauge_param, inv_param.mass, inv_param.b_5, inv_param.c_5);
         free(kappa_b);
         free(kappa_c);
       } else {
         errorQuda("Unsupported dslash_type");
       }

       if (inv_param.mass_normalization == QUDA_MASS_NORMALIZATION) {
         if (dslash_type == QUDA_DOMAIN_WALL_DSLASH ||
             dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH ||
             dslash_type == QUDA_MOBIUS_DWF_DSLASH) {
           ax(0.25/(kappa5*kappa5), spinorCheck, V*spinorSiteSize*inv_param.Ls, inv_param.cpu_prec);
         } else {
           ax(0.25/(inv_param.kappa*inv_param.kappa), spinorCheck, Vh*spinorSiteSize, inv_param.cpu_prec);

   }
       }

     } else if (inv_param.solution_type == QUDA_MATPCDAG_MATPC_SOLUTION) {

       void *spinorTmp = malloc(V*spinorSiteSize*sSize*inv_param.Ls);

       ax(0, spinorCheck, V*spinorSiteSize, inv_param.cpu_prec);

       if (dslash_type == QUDA_TWISTED_MASS_DSLASH) {
   if (inv_param.twist_flavor != QUDA_TWIST_SINGLET) {
           int tm_offset = Vh*spinorSiteSize;
     void *out0 = spinorCheck;
     void *out1 = (char*)out0 + tm_offset*cpu_prec;

     void *tmp0 = spinorTmp;
     void *tmp1 = (char*)tmp0 + tm_offset*cpu_prec;

     void *in0  = spinorOut;
     void *in1  = (char*)in0 + tm_offset*cpu_prec;

     tm_ndeg_matpc(tmp0, tmp1, gauge, in0, in1, inv_param.kappa, inv_param.mu, inv_param.epsilon, inv_param.matpc_type, 0, inv_param.cpu_prec, gauge_param);
     tm_ndeg_matpc(out0, out1, gauge, tmp0, tmp1, inv_param.kappa, inv_param.mu, inv_param.epsilon, inv_param.matpc_type, 1, inv_param.cpu_prec, gauge_param);
   } else {
     tm_matpc(spinorTmp, gauge, spinorOut, inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
        inv_param.matpc_type, 0, inv_param.cpu_prec, gauge_param);
     tm_matpc(spinorCheck, gauge, spinorTmp, inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
        inv_param.matpc_type, 1, inv_param.cpu_prec, gauge_param);
   }
       } else if (dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
   if (inv_param.twist_flavor != QUDA_TWIST_SINGLET)
     errorQuda("Twisted mass solution type not supported");
         tmc_matpc(spinorTmp, gauge, spinorOut, clover, clover_inv, inv_param.kappa, inv_param.mu,
       inv_param.twist_flavor, inv_param.matpc_type, 0, inv_param.cpu_prec, gauge_param);
         tmc_matpc(spinorCheck, gauge, spinorTmp, clover, clover_inv, inv_param.kappa, inv_param.mu,
       inv_param.twist_flavor, inv_param.matpc_type, 1, inv_param.cpu_prec, gauge_param);
       } else if (dslash_type == QUDA_WILSON_DSLASH) {
         wil_matpc(spinorTmp, gauge, spinorOut, inv_param.kappa, inv_param.matpc_type, 0,
                   inv_param.cpu_prec, gauge_param);
         wil_matpc(spinorCheck, gauge, spinorTmp, inv_param.kappa, inv_param.matpc_type, 1,
                   inv_param.cpu_prec, gauge_param);
       } else if (dslash_type == QUDA_CLOVER_WILSON_DSLASH) {
         clover_matpc(spinorTmp, gauge, clover, clover_inv, spinorOut, inv_param.kappa,
          inv_param.matpc_type, 0, inv_param.cpu_prec, gauge_param);
         clover_matpc(spinorCheck, gauge, clover, clover_inv, spinorTmp, inv_param.kappa,
          inv_param.matpc_type, 1, inv_param.cpu_prec, gauge_param);
       } else if (dslash_type == QUDA_DOMAIN_WALL_DSLASH) {
         dw_matpc(spinorTmp, gauge, spinorOut, kappa5, inv_param.matpc_type, 0, inv_param.cpu_prec, gauge_param, inv_param.mass);
         dw_matpc(spinorCheck, gauge, spinorTmp, kappa5, inv_param.matpc_type, 1, inv_param.cpu_prec, gauge_param, inv_param.mass);
       } else if (dslash_type == QUDA_DOMAIN_WALL_4D_DSLASH) {
         dw_4d_matpc(spinorTmp, gauge, spinorOut, kappa5, inv_param.matpc_type, 0, inv_param.cpu_prec, gauge_param, inv_param.mass);
         dw_4d_matpc(spinorCheck, gauge, spinorTmp, kappa5, inv_param.matpc_type, 1, inv_param.cpu_prec, gauge_param, inv_param.mass);
       } else if (dslash_type == QUDA_MOBIUS_DWF_DSLASH) {
         double _Complex *kappa_b = (double _Complex *)malloc(Lsdim * sizeof(double _Complex));
         double _Complex *kappa_c = (double _Complex *)malloc(Lsdim * sizeof(double _Complex));
         for(int xs = 0 ; xs < Lsdim ; xs++)
         {
           kappa_b[xs] = 1.0/(2*(inv_param.b_5[xs]*(4.0 + inv_param.m5) + 1.0));
           kappa_c[xs] = 1.0/(2*(inv_param.c_5[xs]*(4.0 + inv_param.m5) - 1.0));
         }
         mdw_matpc(spinorTmp, gauge, spinorOut, kappa_b, kappa_c, inv_param.matpc_type, 0, inv_param.cpu_prec, gauge_param, inv_param.mass, inv_param.b_5, inv_param.c_5);
         mdw_matpc(spinorCheck, gauge, spinorTmp, kappa_b, kappa_c, inv_param.matpc_type, 1, inv_param.cpu_prec, gauge_param, inv_param.mass, inv_param.b_5, inv_param.c_5);
         free(kappa_b);
         free(kappa_c);
       } else {
         errorQuda("Unsupported dslash_type");
       }

       if (inv_param.mass_normalization == QUDA_MASS_NORMALIZATION) {
   errorQuda("Mass normalization not implemented");
       }

       free(spinorTmp);
     }


     int vol = inv_param.solution_type == QUDA_MAT_SOLUTION ? V : Vh;
     mxpy(spinorIn, spinorCheck, vol*spinorSiteSize*inv_param.Ls, inv_param.cpu_prec);
     double nrm2 = norm_2(spinorCheck, vol*spinorSiteSize*inv_param.Ls, inv_param.cpu_prec);
     double src2 = norm_2(spinorIn, vol*spinorSiteSize*inv_param.Ls, inv_param.cpu_prec);
     double l2r = sqrt(nrm2 / src2);

     printfQuda("Residuals: (L2 relative) tol %g, QUDA = %g, host = %g; (heavy-quark) tol %g, QUDA = %g\n",
          inv_param.tol, inv_param.true_res, l2r, inv_param.tol_hq, inv_param.true_res_hq);

   }

   freeGaugeQuda();
   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) freeCloverQuda();

   // finalize the QUDA library
   endQuda();

   finalizeComms();

   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     if (clover) free(clover);
     if (clover_inv) free(clover_inv);
   }

   for (int dir = 0; dir<4; dir++) free(gauge[dir]);

   return 0;
 }
epsilon
double epsilon
Definition: test_util.cpp:1649

QudaInvertParam_s::maxiter_precondition
int maxiter_precondition
Definition: quda.h:292

device
int device
Definition: test_util.cpp:1602

gSize
static size_t gSize
Definition: hisq_stencil_test.cpp:48

QudaInvertParam_s::secs
double secs
Definition: quda.h:251

dimPartitioned
int dimPartitioned(int dim)
Definition: test_util.cpp:1776

quda::blas::ax
void ax(double a, ColorSpinorField &x)
Definition: blas_quda.cu:508

QudaInvertParam_s::dirac_order
QudaDiracFieldOrder dirac_order
Definition: quda.h:219

QudaInvertParam_s::mass_normalization
QudaMassNormalization mass_normalization
Definition: quda.h:208

QudaInvertParam_s::tol_hq_offset
double tol_hq_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:182

QudaMassNormalization
enum QudaMassNormalization_s QudaMassNormalization

QudaInvertParam_s::Nsteps
int Nsteps
Definition: quda.h:256

anisotropy
double anisotropy
Definition: test_util.cpp:1650

QudaGaugeParam_s::reconstruct_sloppy
QudaReconstructType reconstruct_sloppy
Definition: quda.h:53

QudaGaugeParam_s::anisotropy
double anisotropy
Definition: quda.h:38

freeCloverQuda
void freeCloverQuda(void)
Definition: interface_quda.cpp:1440

twist_flavor
QudaTwistFlavorType twist_flavor
Definition: test_util.cpp:1660

mdw_matpc
void mdw_matpc(void *out, void **gauge, void *in, double _Complex *kappa_b, double _Complex *kappa_c, QudaMatPCType matpc_type, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, double _Complex *b5, double _Complex *c5)
Definition: domain_wall_dslash_reference.cpp:906

tmp1
cudaColorSpinorField * tmp1
Definition: dslash_ctest.cpp:40

QUDA_MAT_SOLUTION
Definition: enum_quda.h:151

dw_4d_matpc
void dw_4d_matpc(void *out, void **gauge, void *in, double kappa, QudaMatPCType matpc_type, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:865

invertMultiShiftQuda
void invertMultiShiftQuda(void **_hp_x, void *_hp_b, QudaInvertParam *param)
Definition: interface_quda.cpp:3579

ca_lambda_max
double ca_lambda_max
Definition: test_util.cpp:1633

QUDA_PACKED_CLOVER_ORDER
Definition: enum_quda.h:256

endQuda
void endQuda(void)
Definition: interface_quda.cpp:1461

construct_gauge_field
void construct_gauge_field(void **gauge, int type, QudaPrecision precision, QudaGaugeParam *param)
Definition: test_util.cpp:1047

QudaInvertParam_s::ca_basis
QudaCABasis ca_basis
Definition: quda.h:298

QudaInvertParam_s::solve_type
QudaSolveType solve_type
Definition: quda.h:205

QudaInvertParam_s::verbosity_precondition
QudaVerbosity verbosity_precondition
Definition: quda.h:286

QudaPrecision
enum QudaPrecision_s QudaPrecision

QudaGaugeParam_s::ga_pad
int ga_pad
Definition: quda.h:63

QudaInvertParam_s::c_5
double_complex c_5[QUDA_MAX_DWF_LS]
Definition: quda.h:112

multishift
int multishift
Definition: test_util.cpp:1642

misc.h

mdw_mat
void mdw_mat(void *out, void **gauge, void *in, double _Complex *kappa_b, double _Complex *kappa_c, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm, double _Complex *b5, double _Complex *c5)
Definition: domain_wall_dslash_reference.cpp:797

main
int main(int argc, char **argv)
Definition: invert_test.cpp:107

dw_setDims
void dw_setDims(int *X, const int L5)
Definition: test_util.cpp:187

QudaInvertParam_s::mu
double mu
Definition: quda.h:114

QudaGaugeParam_s::gauge_fix
QudaGaugeFixed gauge_fix
Definition: quda.h:61

QUDA_PRESERVE_SOURCE_YES
Definition: enum_quda.h:237

QudaInvertParam_s::schwarz_type
QudaSchwarzType schwarz_type
Definition: quda.h:310

quda::norm
__host__ __device__ ValueType norm(const complex< ValueType > &z)
Returns the magnitude of z squared.
Definition: complex_quda.h:1092

tm_mat
void tm_mat(void *out, void **gauge, void *in, double kappa, double mu, QudaTwistFlavorType flavor, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:309

QUDA_MASS_NORMALIZATION
Definition: enum_quda.h:225

QudaInvertParam_s::inv_type_precondition
QudaInverterType inv_type_precondition
Definition: quda.h:270

QUDA_INVALID_PRECISION
Definition: enum_quda.h:63

Lsdim
int Lsdim
Definition: test_util.cpp:1619

QudaGaugeParam_s::type
QudaLinkType type
Definition: quda.h:42

QudaInvertParam_s::kappa
double kappa
Definition: quda.h:106

quda::LatticeFieldParam
Definition: lattice_field.h:47

invertQuda
void invertQuda(void *h_x, void *h_b, QudaInvertParam *param)
Definition: interface_quda.cpp:2830

errorQuda
#define errorQuda(...)
Definition: util_quda.h:121

QudaInvertParam_s::tol
double tol
Definition: quda.h:121

prec
QudaPrecision prec
Definition: test_util.cpp:1608

usage
void usage(char **)
Definition: test_util.cpp:1783

QudaInvertParam_s::dslash_type
QudaDslashType dslash_type
Definition: quda.h:102

QUDA_GAUGE_FIXED_NO
Definition: enum_quda.h:77

QudaGaugeParam_s::reconstruct_precondition
QudaReconstructType reconstruct_precondition
Definition: quda.h:59

QudaInvertParam_s::inv_type
QudaInverterType inv_type
Definition: quda.h:103

test_util.h

QudaInvertParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:214

cloverSiteSize
#define cloverSiteSize
Definition: test_util.h:9

QudaInvertParam_s::return_clover_inverse
int return_clover_inverse
Definition: quda.h:242

QudaSolveType
enum QudaSolveType_s QudaSolveType

QUDA_QDP_GAUGE_ORDER
Definition: enum_quda.h:41

quda::sqrt
__host__ __device__ ValueType sqrt(ValueType x)
Definition: complex_quda.h:120

loadGaugeQuda
void loadGaugeQuda(void *h_gauge, QudaGaugeParam *param)
Definition: interface_quda.cpp:729

mg_verbosity
QudaVerbosity mg_verbosity[QUDA_MAX_MG_LEVEL]
Definition: test_util.cpp:1675

QUDA_WILSON_LINKS
Definition: enum_quda.h:29

compute_clover
bool compute_clover
Definition: test_util.cpp:1654

QudaInvertParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:213

cuda_prec
QudaPrecision & cuda_prec
Definition: contract_test.cpp:67

process_command_line_option
int process_command_line_option(int argc, char **argv, int *idx)
Definition: test_util.cpp:2019

tol_hq
double tol_hq
Definition: test_util.cpp:1657

link_recon_precondition
QudaReconstructType link_recon_precondition
Definition: test_util.cpp:1607

tm_ndeg_mat
void tm_ndeg_mat(void *evenOut, void *oddOut, void **gauge, void *evenIn, void *oddIn, double kappa, double mu, double epsilon, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:554

plaqQuda
void plaqQuda(double plaq[3])
Definition: interface_quda.cpp:5419

clover_matpc
void clover_matpc(void *out, void **gauge, void *clover, void *clover_inv, void *in, double kappa, QudaMatPCType matpc_type, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: clover_reference.cpp:92

QudaInvertParam_s::dagger
QudaDagType dagger
Definition: quda.h:207

cuda_prec_refinement_sloppy
QudaPrecision & cuda_prec_refinement_sloppy
Definition: deflated_invert_test.cpp:125

get_matpc_str
const char * get_matpc_str(QudaMatPCType type)
Definition: misc.cpp:1121

finalizeComms
void finalizeComms()
Definition: test_util.cpp:128

QUDA_TWIST_SINGLET
Definition: enum_quda.h:399

reliable_delta
double reliable_delta
Definition: test_util.cpp:1658

gauge_param
QudaGaugeParam gauge_param
Definition: dslash_ctest.cpp:36

QudaInvertParam_s::cuda_prec_refinement_sloppy
QudaPrecision cuda_prec_refinement_sloppy
Definition: quda.h:216

clover_coeff
double clover_coeff
Definition: test_util.cpp:1653

QudaInvertParam_s::clover_cuda_prec_refinement_sloppy
QudaPrecision clover_cuda_prec_refinement_sloppy
Definition: quda.h:227

QudaGaugeParam_s::gauge_order
QudaGaugeFieldOrder gauge_order
Definition: quda.h:43

dw_mat
void dw_mat(void *out, void **gauge, void *in, double kappa, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:766

QudaInvertParam_s::true_res
double true_res
Definition: quda.h:126

tmc_mat
void tmc_mat(void *out, void **gauge, void *clover, void *in, double kappa, double mu, QudaTwistFlavorType flavor, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: clover_reference.cpp:257

link_recon
QudaReconstructType link_recon
Definition: test_util.cpp:1605

util_quda.h

tm_matpc
void tm_matpc(void *outEven, void **gauge, void *inEven, double kappa, double mu, QudaTwistFlavorType flavor, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:356

QUDA_TWIST_NONDEG_DOUBLET
Definition: enum_quda.h:400

get_prec_str
const char * get_prec_str(QudaPrecision prec)
Definition: misc.cpp:701

loadCloverQuda
void loadCloverQuda(void *h_clover, void *h_clovinv, QudaInvertParam *inv_param)
Definition: interface_quda.cpp:985

QudaInvertParam_s::return_clover
int return_clover
Definition: quda.h:241

construct_spinor_source
void construct_spinor_source(void *v, int nSpin, int nColor, QudaPrecision precision, const int *const x, quda::RNG &rng)
Definition: test_util.cpp:1342

display_test_info
void display_test_info()
Definition: invert_test.cpp:83

QudaInvertParam_s::ca_lambda_max
double ca_lambda_max
Definition: quda.h:304

spinorSiteSize
#define spinorSiteSize
Definition: interface_quda.cpp:55

QUDA_DEFAULT_NORMALIZATION
Definition: enum_quda.h:231

cuda_prec_precondition
QudaPrecision & cuda_prec_precondition
Definition: contract_test.cpp:69

alternative_reliable
bool alternative_reliable
Definition: test_util.cpp:1659

QudaInvertParam_s::clover_cuda_prec_sloppy
QudaPrecision clover_cuda_prec_sloppy
Definition: quda.h:226

setDims
void setDims(int *)
Definition: test_util.cpp:151

QudaInvertParam_s::input_location
QudaFieldLocation input_location
Definition: quda.h:99

freeGaugeQuda
void freeGaugeQuda(void)
Definition: interface_quda.cpp:1259

QudaInvertParam_s::true_res_hq_offset
double true_res_hq_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:191

QudaInvertParam_s::reliable_delta
double reliable_delta
Definition: quda.h:129

QudaInvertParam_s::pipeline
int pipeline
Definition: quda.h:167

QudaInvertParam_s::solution_accumulator_pipeline
int solution_accumulator_pipeline
Definition: quda.h:142

mu
double mu
Definition: test_util.cpp:1648

pipeline
int pipeline
Definition: test_util.cpp:1634

QudaInvertParam_s::ca_lambda_min
double ca_lambda_min
Definition: quda.h:301

QudaInvertParam_s::b_5
double_complex b_5[QUDA_MAX_DWF_LS]
Definition: quda.h:111

QudaInvertParam_s::solution_type
QudaSolutionType solution_type
Definition: quda.h:204

QudaInvertParam_s::use_alternative_reliable
int use_alternative_reliable
Definition: quda.h:131

QUDA_MATPC_SOLUTION
Definition: enum_quda.h:153

QudaInvertParam_s::solver_normalization
QudaSolverNormalization solver_normalization
Definition: quda.h:209

QudaInvertParam_s::clover_cuda_prec
QudaPrecision clover_cuda_prec
Definition: quda.h:225

QudaInvertParam_s::precondition_cycle
int precondition_cycle
Definition: quda.h:307

cuda_prec_sloppy
QudaPrecision & cuda_prec_sloppy
Definition: contract_test.cpp:68

QUDA_SILENT
Definition: enum_quda.h:263

initQuda
void initQuda(int device)
Definition: interface_quda.cpp:679

dw_matpc
void dw_matpc(void *out, void **gauge, void *in, double kappa, QudaMatPCType matpc_type, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:845

solution_type
QudaSolutionType solution_type
Definition: test_util.cpp:1664

QudaInvertParam_s::output_location
QudaFieldLocation output_location
Definition: quda.h:100

prec_refinement_sloppy
QudaPrecision prec_refinement_sloppy
Definition: test_util.cpp:1610

QudaInvertParam_s::clover_cuda_prec_precondition
QudaPrecision clover_cuda_prec_precondition
Definition: quda.h:228

inv_param
QudaInvertParam inv_param
Definition: covdev_test.cpp:37

QudaInvertParam_s::m5
double m5
Definition: quda.h:108

QudaGaugeParam_s
Definition: quda.h:32

QudaInvertParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:215

normalization
QudaMassNormalization normalization
Definition: test_util.cpp:1661

QudaInvertParam_s::verbosity
QudaVerbosity verbosity
Definition: quda.h:244

setSpinorSiteSize
void setSpinorSiteSize(int n)
Definition: test_util.cpp:211

QUDA_ADDITIVE_SCHWARZ
Definition: enum_quda.h:181

get_mass_normalization_str
const char * get_mass_normalization_str(QudaMassNormalization type)
Definition: misc.cpp:1077

solution_accumulator_pipeline
int solution_accumulator_pipeline
Definition: test_util.cpp:1635

QudaInvertParam_s::tol_offset
double tol_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:179

QudaInvertParam_s::true_res_offset
double true_res_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:185

quda::blas::axpy
void axpy(double a, ColorSpinorField &x, ColorSpinorField &y)
Definition: blas_quda.h:35

newQudaInvertParam
QudaInvertParam newQudaInvertParam(void)

QudaInvertParam_s::gflops
double gflops
Definition: quda.h:250

get_recon_str
const char * get_recon_str(QudaReconstructType recon)
Definition: misc.cpp:768

matpc_type
QudaMatPCType matpc_type
Definition: test_util.cpp:1662

QudaGaugeParam_s::cuda_prec_precondition
QudaPrecision cuda_prec_precondition
Definition: quda.h:58

QudaInvertParam_s::clover_order
QudaCloverFieldOrder clover_order
Definition: quda.h:230

quda::RNG
Class declaration to initialize and hold CURAND RNG states.
Definition: random_quda.h:23

dw_4d_mat
void dw_4d_mat(void *out, void **gauge, void *in, double kappa, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:780

QudaInvertParam_s::tol_hq
double tol_hq
Definition: quda.h:123

QudaMatPCType
enum QudaMatPCType_s QudaMatPCType

spinorOut
cpuColorSpinorField * spinorOut
Definition: covdev_test.cpp:41

QUDA_PERIODIC_T
Definition: enum_quda.h:54

QUDA_CLOVER_WILSON_DSLASH
Definition: enum_quda.h:88

blas_reference.h

QudaInvertParam_s::true_res_hq
double true_res_hq
Definition: quda.h:127

QudaSolutionType
enum QudaSolutionType_s QudaSolutionType

QudaInvertParam_s::gamma_basis
QudaGammaBasis gamma_basis
Definition: quda.h:221

QudaGaugeParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:52

get_dslash_str
const char * get_dslash_str(QudaDslashType type)
Definition: misc.cpp:910

QudaInvertParam_s::tol_precondition
double tol_precondition
Definition: quda.h:289

dslash_util.h

clover_mat
void clover_mat(void *out, void **gauge, void *clover, void *in, double kappa, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: clover_reference.cpp:149

QudaInvertParam_s::offset
double offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:176

QudaInvertParam_s::use_sloppy_partial_accumulator
int use_sloppy_partial_accumulator
Definition: quda.h:132

tm_ndeg_matpc
void tm_ndeg_matpc(void *outEven1, void *outEven2, void **gauge, void *inEven1, void *inEven2, double kappa, double mu, double epsilon, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:484

QudaGaugeParam_s::reconstruct
QudaReconstructType reconstruct
Definition: quda.h:50

QudaGaugeParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:49

QudaGaugeParam_s::X
int X[4]
Definition: quda.h:36

tol
double tol
Definition: test_util.cpp:1656

QudaInvertParam_s::mass
double mass
Definition: quda.h:105

QUDA_HEAVY_QUARK_RESIDUAL
Definition: enum_quda.h:189

QudaInvertParam_s::gcrNkrylov
int gcrNkrylov
Definition: quda.h:259

QudaInvertParam_s::maxiter
int maxiter
Definition: quda.h:128

QudaGaugeParam_s::cuda_prec_refinement_sloppy
QudaPrecision cuda_prec_refinement_sloppy
Definition: quda.h:55

V
int V
Definition: test_util.cpp:27

QUDA_TWISTED_CLOVER_DSLASH
Definition: enum_quda.h:95

norm_2
double norm_2(void *v, int len, QudaPrecision precision)
Definition: blas_reference.cpp:48

QudaInvertParam_s::sp_pad
int sp_pad
Definition: quda.h:246

QudaInvertParam_s::compute_clover_inverse
int compute_clover_inverse
Definition: quda.h:240

QUDA_WILSON_DSLASH
Definition: enum_quda.h:87

unit_gauge
bool unit_gauge
Definition: test_util.cpp:1624

construct_clover_field
void construct_clover_field(void *clover, double norm, double diag, QudaPrecision precision)
Definition: test_util.cpp:1167

QudaInvertParam_s::max_res_increase
int max_res_increase
Definition: quda.h:147

ca_lambda_min
double ca_lambda_min
Definition: test_util.cpp:1632

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:62

QudaResidualType_s
QudaResidualType_s
Definition: enum_quda.h:186

xdim
int xdim
Definition: test_util.cpp:1615

solve_type
QudaSolveType solve_type
Definition: test_util.cpp:1663

wil_mat
void wil_mat(void *out, void **gauge, void *in, double kappa, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:294

inv_type
QudaInverterType inv_type
Definition: test_util.cpp:1640

QudaInvertParam_s::cuda_prec_precondition
QudaPrecision cuda_prec_precondition
Definition: quda.h:217

QUDA_TWISTED_MASS_DSLASH
Definition: enum_quda.h:94

QudaInvertParam_s::iter
int iter
Definition: quda.h:249

QudaInvertParam_s::tol_restart
double tol_restart
Definition: quda.h:122

zdim
int zdim
Definition: test_util.cpp:1617

tdim
int tdim
Definition: test_util.cpp:1618

QudaReconstructType
enum QudaReconstructType_s QudaReconstructType

quda.h
Main header file for the QUDA library.

latfile
char latfile[]
Definition: test_util.cpp:1623

QudaCABasis
enum QudaCABasis_s QudaCABasis

QUDA_MAX_MG_LEVEL
#define QUDA_MAX_MG_LEVEL
Maximum number of multi-grid levels. This number may be increased if needed.
Definition: quda_constants.h:56

ca_basis
QudaCABasis ca_basis
Definition: test_util.cpp:1631

QUDA_DEGRAND_ROSSI_GAMMA_BASIS
Definition: enum_quda.h:367

tmc_matpc
void tmc_matpc(void *out, void **gauge, void *in, void *clover, void *cInv, double kappa, double mu, QudaTwistFlavorType flavor, QudaMatPCType matpc_type, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: clover_reference.cpp:284

QudaInvertParam_s::Ls
int Ls
Definition: quda.h:109

printfQuda
#define printfQuda(...)
Definition: util_quda.h:115

QUDA_DAG_NO
Definition: enum_quda.h:218

QudaGaugeParam_s::t_boundary
QudaTboundary t_boundary
Definition: quda.h:45

QudaInvertParam_s::twist_flavor
QudaTwistFlavorType twist_flavor
Definition: quda.h:117

qio_field.h

MAX
#define MAX(a, b)
Definition: invert_test.cpp:19

QUDA_DIRAC_ORDER
Definition: enum_quda.h:243

verbosity
QudaVerbosity verbosity
Definition: test_util.cpp:1614

QudaDslashType
enum QudaDslashType_s QudaDslashType

domain_wall_dslash_reference.h

niter
int niter
Definition: test_util.cpp:1629

QudaInvertParam_s::cl_pad
int cl_pad
Definition: quda.h:247

quda::blas::mxpy
void mxpy(ColorSpinorField &x, ColorSpinorField &y)
Definition: blas_quda.h:34

QudaInvertParam_s::residual_type
QudaResidualType residual_type
Definition: quda.h:320

wil_matpc
void wil_matpc(void *outEven, void **gauge, void *inEven, double kappa, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:332

QudaInvertParam_s::num_offset
int num_offset
Definition: quda.h:169

Nsrc
int Nsrc
Definition: test_util.cpp:1627

QudaVerbosity
enum QudaVerbosity_s QudaVerbosity

cpu_prec
QudaPrecision & cpu_prec
Definition: contract_test.cpp:66

dslash_type
QudaDslashType dslash_type
Definition: test_util.cpp:1621

QudaInvertParam_s::compute_clover
int compute_clover
Definition: quda.h:239

link_recon_sloppy
QudaReconstructType link_recon_sloppy
Definition: test_util.cpp:1606

wilson_dslash_reference.h

QudaInvertParam_s::epsilon
double epsilon
Definition: quda.h:115

ydim
int ydim
Definition: test_util.cpp:1616

spinorTmp
cpuColorSpinorField * spinorTmp
Definition: dslash_ctest.cpp:39

random_quda.h

QUDA_DOMAIN_WALL_DSLASH
Definition: enum_quda.h:89

QudaInvertParam_s::omega
double omega
Definition: quda.h:295

mass
double mass
Definition: test_util.cpp:1646

prec_sloppy
QudaPrecision prec_sloppy
Definition: test_util.cpp:1609

precon_type
QudaInverterType precon_type
Definition: test_util.cpp:1641

initComms
void initComms(int argc, char **argv, int *const commDims)
Definition: test_util.cpp:88

read_gauge_field
void read_gauge_field(const char *filename, void *gauge[], QudaPrecision prec, const int *X, int argc, char *argv[])
Definition: qio_field.h:14

QUDA_MATPCDAG_MATPC_SOLUTION
Definition: enum_quda.h:155

gcrNkrylov
int gcrNkrylov
Definition: test_util.cpp:1630

gridsize_from_cmdline
int gridsize_from_cmdline[]
Definition: test_util.cpp:49

QudaInvertParam_s::clover_cpu_prec
QudaPrecision clover_cpu_prec
Definition: quda.h:224

QudaInvertParam_s
Definition: quda.h:97

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:325

QudaInvertParam_s::matpc_type
QudaMatPCType matpc_type
Definition: quda.h:206

QUDA_DOMAIN_WALL_4D_DSLASH
Definition: enum_quda.h:90

prec_precondition
QudaPrecision prec_precondition
Definition: test_util.cpp:1611

QudaInverterType
enum QudaInverterType_s QudaInverterType

kappa
double kappa
Definition: test_util.cpp:1647

QUDA_L2_RELATIVE_RESIDUAL
Definition: enum_quda.h:187

kappa5
double kappa5
Definition: dslash_ctest.cpp:31

QudaGaugeParam_s::reconstruct_refinement_sloppy
QudaReconstructType reconstruct_refinement_sloppy
Definition: quda.h:56

QudaGaugeParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:47

gaugeSiteSize
#define gaugeSiteSize
Definition: face_gauge.cpp:34

newQudaGaugeParam
QudaGaugeParam newQudaGaugeParam(void)

QUDA_RECONSTRUCT_INVALID
Definition: enum_quda.h:73

QudaInvertParam_s::preserve_source
QudaPreserveSource preserve_source
Definition: quda.h:211

QudaInvertParam_s::clover_coeff
double clover_coeff
Definition: quda.h:233

Vh
int Vh
Definition: test_util.cpp:28

QUDA_MOBIUS_DWF_DSLASH
Definition: enum_quda.h:91

QudaTwistFlavorType
enum QudaTwistFlavorType_s QudaTwistFlavorType