v0.9.0/doc/deflated__invert__test_8cpp_source.html

 #include <stdlib.h>
 #include <stdio.h>
 #include <time.h>
 #include <math.h>
 #include <string.h>
 #include <algorithm>

 #include <util_quda.h>
 #include <test_util.h>
 #include <dslash_util.h>
 #include <blas_reference.h>
 #include <wilson_dslash_reference.h>
 #include <domain_wall_dslash_reference.h>
 #include "misc.h"

 #if defined(QMP_COMMS)
 #include <qmp.h>
 #elif defined(MPI_COMMS)
 #include <mpi.h>
 #endif

 #include <qio_field.h>

 // In a typical application, quda.h is the only QUDA header required.
 #include <quda.h>

 // Wilson, clover-improved Wilson, twisted mass, and domain wall are supported.
 extern QudaDslashType dslash_type;
 //extern bool tune;
 extern int device;
 extern int xdim;
 extern int ydim;
 extern int zdim;
 extern int tdim;
 extern int Lsdim;
 extern int gridsize_from_cmdline[];
 extern QudaReconstructType link_recon;
 extern QudaPrecision  prec;
 extern QudaPrecision  prec_sloppy;
 extern QudaPrecision  prec_precondition;
 extern QudaPrecision  prec_ritz;
 extern QudaReconstructType link_recon_sloppy;
 extern QudaReconstructType link_recon_precondition;
 extern double mass;
 extern double mu;
 extern double anisotropy;
 extern double tol; // tolerance for inverter
 extern double tol_hq; // heavy-quark tolerance for inverter
 extern char latfile[];
 extern int Nsrc; // number of spinors to apply to simultaneously
 extern int niter;
 extern int nvec[];

 extern QudaInverterType inv_type;
 extern QudaInverterType precon_type;

 extern QudaMatPCType matpc_type;
 extern QudaSolveType solve_type;

 extern char vec_infile[];
 extern char vec_outfile[];

 //Twisted mass flavor type
 extern QudaTwistFlavorType twist_flavor;

 extern void usage(char** );

 extern double clover_coeff;
 extern bool compute_clover;

 extern int nev;
 extern int max_search_dim;
 extern int deflation_grid;
 extern double tol_restart;

 extern int eigcg_max_restarts;
 extern int max_restart_num;
 extern double inc_tol;
 extern double eigenval_tol;

 extern QudaExtLibType   solver_ext_lib;
 extern QudaExtLibType   deflation_ext_lib;

 extern QudaFieldLocation location_ritz;
 extern QudaMemoryType    mem_type_ritz;

 namespace quda {
   extern void setTransferGPU(bool);
 }

 void
 display_test_info()
 {
   printfQuda("running the following test:\n");

   printfQuda("prec    sloppy_prec    link_recon  sloppy_link_recon S_dimension T_dimension Ls_dimension\n");
   printfQuda("%s   %s             %s            %s            %d/%d/%d          %d         %d\n",
        get_prec_str(prec),get_prec_str(prec_sloppy),
        get_recon_str(link_recon),
        get_recon_str(link_recon_sloppy),  xdim, ydim, zdim, tdim, Lsdim);

   printfQuda("Deflation parameters\n");
 //  printfQuda(" - number of levels %d\n", mg_levels);
   printfQuda(" - number of eigenvectors %d\n", nvec[0]);

   printfQuda("Grid partition info:     X  Y  Z  T\n");
   printfQuda("                         %d  %d  %d  %d\n",
        dimPartitioned(0),
        dimPartitioned(1),
        dimPartitioned(2),
        dimPartitioned(3));

   return ;

 }

 QudaPrecision &cpu_prec = prec;
 QudaPrecision &cuda_prec = prec;
 QudaPrecision &cuda_prec_sloppy = prec_sloppy;
 QudaPrecision &cuda_prec_precondition = prec_precondition;
 QudaPrecision &cuda_prec_ritz = prec_ritz;

 void setGaugeParam(QudaGaugeParam &gauge_param) {
   gauge_param.X[0] = xdim;
   gauge_param.X[1] = ydim;
   gauge_param.X[2] = zdim;
   gauge_param.X[3] = tdim;

   gauge_param.anisotropy = anisotropy;
   gauge_param.type = QUDA_WILSON_LINKS;
   gauge_param.gauge_order = QUDA_QDP_GAUGE_ORDER;
   gauge_param.t_boundary = QUDA_PERIODIC_T;

   gauge_param.cpu_prec = cpu_prec;

   gauge_param.cuda_prec = cuda_prec;
   gauge_param.reconstruct = link_recon;

   gauge_param.cuda_prec_sloppy = cuda_prec_sloppy;
   gauge_param.reconstruct_sloppy = link_recon_sloppy;

   gauge_param.cuda_prec_precondition = cuda_prec_precondition;
   gauge_param.reconstruct_precondition = link_recon_precondition;

   gauge_param.gauge_fix = QUDA_GAUGE_FIXED_NO;

   gauge_param.ga_pad = 0;
   // For multi-GPU, ga_pad must be large enough to store a time-slice
 #ifdef MULTI_GPU
   int x_face_size = gauge_param.X[1]*gauge_param.X[2]*gauge_param.X[3]/2;
   int y_face_size = gauge_param.X[0]*gauge_param.X[2]*gauge_param.X[3]/2;
   int z_face_size = gauge_param.X[0]*gauge_param.X[1]*gauge_param.X[3]/2;
   int t_face_size = gauge_param.X[0]*gauge_param.X[1]*gauge_param.X[2]/2;
   int pad_size =std::max(x_face_size, y_face_size);
   pad_size = std::max(pad_size, z_face_size);
   pad_size = std::max(pad_size, t_face_size);
   gauge_param.ga_pad = pad_size;
 #endif
 }


 void setInvertParam(QudaInvertParam &inv_param) {
   inv_param.Ls = 1;

   inv_param.sp_pad = 0;
   inv_param.cl_pad = 0;

   inv_param.cpu_prec = cpu_prec;
   inv_param.cuda_prec = cuda_prec;
   inv_param.cuda_prec_sloppy = cuda_prec_sloppy;

   inv_param.cuda_prec_precondition = cuda_prec_precondition;
   inv_param.preserve_source = QUDA_PRESERVE_SOURCE_NO;
   inv_param.gamma_basis = QUDA_DEGRAND_ROSSI_GAMMA_BASIS;
   inv_param.dirac_order = QUDA_DIRAC_ORDER;

   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     inv_param.clover_cpu_prec = cpu_prec;
     inv_param.clover_cuda_prec = cuda_prec;
     inv_param.clover_cuda_prec_sloppy = cuda_prec_sloppy;
     inv_param.clover_cuda_prec_precondition = cuda_prec_precondition;
     inv_param.clover_order = QUDA_PACKED_CLOVER_ORDER;
   }

   inv_param.input_location = QUDA_CPU_FIELD_LOCATION;
   inv_param.output_location = QUDA_CPU_FIELD_LOCATION;

 //  inv_param.tune = tune ? QUDA_TUNE_YES : QUDA_TUNE_NO;

   inv_param.dslash_type = dslash_type;

   //Free field!
   inv_param.mass = mass;
   inv_param.kappa = 1.0 / (2.0 * (1 + 3/anisotropy + mass));

   if (dslash_type == QUDA_TWISTED_MASS_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     inv_param.mu = mu;
     inv_param.twist_flavor = twist_flavor;
     inv_param.Ls = (inv_param.twist_flavor == QUDA_TWIST_NONDEG_DOUBLET) ? 2 : 1;

     if (twist_flavor == QUDA_TWIST_NONDEG_DOUBLET) {
       printfQuda("Twisted-mass doublet non supported (yet)\n");
       exit(0);
     }
   }

   inv_param.clover_coeff = clover_coeff;

   inv_param.dagger = QUDA_DAG_NO;
   inv_param.mass_normalization = QUDA_KAPPA_NORMALIZATION;

   // do we want full solution or single-parity solution
   inv_param.solution_type = QUDA_MAT_SOLUTION;

   // do we want to use an even-odd preconditioned solve or not
   inv_param.solve_type = solve_type;
   inv_param.matpc_type = matpc_type;


   // set default solver type to incremental eigcg is not set at command line
   if (inv_type != QUDA_EIGCG_INVERTER && inv_type != QUDA_INC_EIGCG_INVERTER && inv_type != QUDA_GMRESDR_INVERTER)
     inv_type = QUDA_INC_EIGCG_INVERTER;

   inv_param.inv_type = inv_type;
   inv_param.tol      = tol;
   inv_param.tol_hq   = tol_hq; // specify a tolerance for the residual for heavy quark residual

   inv_param.rhs_idx  = 0;

   inv_param.nev = nev;
   inv_param.max_search_dim = max_search_dim;
   inv_param.deflation_grid = deflation_grid;
   inv_param.tol_restart = tol_restart;
   inv_param.eigcg_max_restarts = eigcg_max_restarts;
   inv_param.max_restart_num = max_restart_num;
   inv_param.inc_tol = inc_tol;
   inv_param.eigenval_tol = eigenval_tol;


   if(inv_param.inv_type == QUDA_EIGCG_INVERTER || inv_param.inv_type == QUDA_INC_EIGCG_INVERTER ){
     inv_param.solve_type = QUDA_NORMOP_PC_SOLVE;
   }else if(inv_param.inv_type == QUDA_GMRESDR_INVERTER) {
     inv_param.solve_type = QUDA_DIRECT_PC_SOLVE;
     inv_param.tol_restart = 0.0;//restart is not requested...
   }

   inv_param.cuda_prec_ritz = cuda_prec_ritz;
   inv_param.verbosity = QUDA_VERBOSE;
   inv_param.verbosity_precondition = QUDA_SILENT;

   inv_param.inv_type_precondition = precon_type;
   inv_param.gcrNkrylov = 6;

   // require both L2 relative and heavy quark residual to determine convergence
   inv_param.residual_type = static_cast<QudaResidualType>(QUDA_L2_RELATIVE_RESIDUAL);
   // these can be set individually
   for (int i=0; i<inv_param.num_offset; i++) {
     inv_param.tol_offset[i] = inv_param.tol;
     inv_param.tol_hq_offset[i] = inv_param.tol_hq;
   }
   inv_param.maxiter = niter;
   inv_param.reliable_delta = 1e-1;

   // domain decomposition preconditioner parameters
   inv_param.schwarz_type = QUDA_ADDITIVE_SCHWARZ;
   inv_param.precondition_cycle = 1;
   inv_param.tol_precondition = 1e-2;
   inv_param.maxiter_precondition = 10;
   inv_param.omega = 1.0;

   inv_param.extlib_type = solver_ext_lib;
 }

 void setDeflationParam(QudaEigParam &df_param) {

   df_param.import_vectors = QUDA_BOOLEAN_NO;
   df_param.run_verify     = QUDA_BOOLEAN_NO;

   df_param.nk             = df_param.invert_param->nev;
   df_param.np             = df_param.invert_param->nev*df_param.invert_param->deflation_grid;
   df_param.extlib_type    = deflation_ext_lib;

   df_param.cuda_prec_ritz = prec_ritz;
   df_param.location       = location_ritz;
   df_param.mem_type_ritz  = mem_type_ritz;

   // set file i/o parameters
   strcpy(df_param.vec_infile, vec_infile);
   strcpy(df_param.vec_outfile, vec_outfile);
 }


 int main(int argc, char **argv)
 {

   for (int i = 1; i < argc; i++){
     if(process_command_line_option(argc, argv, &i) == 0){
       continue;
     }
     printf("ERROR: Invalid option:%s\n", argv[i]);
     usage(argv);
   }

   if (prec_sloppy == QUDA_INVALID_PRECISION) prec_sloppy = prec;
   if (prec_precondition == QUDA_INVALID_PRECISION) prec_precondition = prec_sloppy;
   if (link_recon_sloppy == QUDA_RECONSTRUCT_INVALID) link_recon_sloppy = link_recon;
   if (link_recon_precondition == QUDA_RECONSTRUCT_INVALID) link_recon_precondition = link_recon_sloppy;

   // initialize QMP/MPI, QUDA comms grid and RNG (test_util.cpp)
   initComms(argc, argv, gridsize_from_cmdline);

   // call srand() with a rank-dependent seed
   initRand();

   display_test_info();

   // *** QUDA parameters begin here.

   if (dslash_type != QUDA_WILSON_DSLASH &&
       dslash_type != QUDA_CLOVER_WILSON_DSLASH &&
       dslash_type != QUDA_TWISTED_MASS_DSLASH &&
       dslash_type != QUDA_TWISTED_CLOVER_DSLASH) {
     printfQuda("dslash_type %d not supported\n", dslash_type);
     exit(0);
   }

   QudaGaugeParam gauge_param = newQudaGaugeParam();
   setGaugeParam(gauge_param);


   QudaInvertParam inv_param = newQudaInvertParam();
   setInvertParam(inv_param);

   QudaEigParam  df_param = newQudaEigParam();
   df_param.invert_param = &inv_param;
   setDeflationParam(df_param);

   // *** Everything between here and the call to initQuda() is
   // *** application-specific.

   setDims(gauge_param.X);

   setSpinorSiteSize(24);

   size_t gSize = (gauge_param.cpu_prec == QUDA_DOUBLE_PRECISION) ? sizeof(double) : sizeof(float);
   size_t sSize = (inv_param.cpu_prec == QUDA_DOUBLE_PRECISION) ? sizeof(double) : sizeof(float);

   void *gauge[4], *clover=0, *clover_inv=0;

   for (int dir = 0; dir < 4; dir++) {
     gauge[dir] = malloc(V*gaugeSiteSize*gSize);
   }

   if (strcmp(latfile,"")) {  // load in the command line supplied gauge field
     read_gauge_field(latfile, gauge, gauge_param.cpu_prec, gauge_param.X, argc, argv);
     construct_gauge_field(gauge, 2, gauge_param.cpu_prec, &gauge_param);
   } else { // else generate a random SU(3) field
     //generate a random SU(3) field
     //construct_gauge_field(gauge, 1, gauge_param.cpu_prec, &gauge_param);
     //generate a unit SU(3) field
     construct_gauge_field(gauge, 0, gauge_param.cpu_prec, &gauge_param);

   }

   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     double norm = 0.1; // clover components are random numbers in the range (-norm, norm)
     double diag = 1.0; // constant added to the diagonal

     size_t cSize = inv_param.clover_cpu_prec;
     clover = malloc(V*cloverSiteSize*cSize);
     clover_inv = malloc(V*cloverSiteSize*cSize);
     if (!compute_clover) construct_clover_field(clover, norm, diag, inv_param.clover_cpu_prec);

     inv_param.compute_clover = compute_clover;
     if (compute_clover) inv_param.return_clover = 1;
     inv_param.compute_clover_inverse = 1;
     inv_param.return_clover_inverse = 1;
   }

   void *spinorIn = malloc(V*spinorSiteSize*sSize*inv_param.Ls);
   void *spinorCheck = malloc(V*spinorSiteSize*sSize*inv_param.Ls);

   void *spinorOut = NULL;
   spinorOut = malloc(V*spinorSiteSize*sSize*inv_param.Ls);

   // start the timer
   double time0 = -((double)clock());

   // initialize the QUDA library
   initQuda(device);

   // load the gauge field
   loadGaugeQuda((void*)gauge, &gauge_param);

   // this line ensure that if we need to construct the clover inverse (in either the smoother or the solver) we do so
   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) loadCloverQuda(clover, clover_inv, &inv_param);

   void *df_preconditioner  = newDeflationQuda(&df_param);
   inv_param.deflation_op   = df_preconditioner;

   for (int i=0; i<Nsrc; i++) {
     // create a point source at 0 (in each subvolume...  FIXME)
     memset(spinorIn, 0, inv_param.Ls*V*spinorSiteSize*sSize);
     memset(spinorCheck, 0, inv_param.Ls*V*spinorSiteSize*sSize);
     memset(spinorOut, 0, inv_param.Ls*V*spinorSiteSize*sSize);

     if (inv_param.cpu_prec == QUDA_SINGLE_PRECISION) {
       //((float*)spinorIn)[i] = 1.0;
       for (int i=0; i<inv_param.Ls*V*spinorSiteSize; i++) ((float*)spinorIn)[i] = rand() / (float)RAND_MAX;
     } else {
       //((double*)spinorIn)[i] = 1.0;
       for (int i=0; i<inv_param.Ls*V*spinorSiteSize; i++) ((double*)spinorIn)[i] = rand() / (double)RAND_MAX;
     }

     invertQuda(spinorOut, spinorIn, &inv_param);
     printfQuda("\nDone for %d rhs.\n", inv_param.rhs_idx);
   }

   destroyDeflationQuda(df_preconditioner);

   // stop the timer
   time0 += clock();
   time0 /= CLOCKS_PER_SEC;

   printfQuda("Device memory used:\n   Spinor: %f GiB\n    Gauge: %f GiB\n",
    inv_param.spinorGiB, gauge_param.gaugeGiB);
   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) printfQuda("   Clover: %f GiB\n", inv_param.cloverGiB);
   //printfQuda("\nDone: %i iter / %g secs = %g Gflops, total time = %g secs\n",
   //inv_param.iter, inv_param.secs, inv_param.gflops/inv_param.secs, time0);
   printfQuda("\nDone: %i iter / %g secs = %g Gflops, total time = %g secs\n",
    inv_param.iter, inv_param.secs, inv_param.gflops/inv_param.secs, 0.0);

   if (inv_param.solution_type == QUDA_MAT_SOLUTION) {

     if (dslash_type == QUDA_WILSON_DSLASH || dslash_type == QUDA_CLOVER_WILSON_DSLASH) {
       wil_mat(spinorCheck, gauge, spinorOut, inv_param.kappa, 0, inv_param.cpu_prec, gauge_param);
     } else {
       if (dslash_type == QUDA_TWISTED_MASS_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
         if(inv_param.twist_flavor == QUDA_TWIST_SINGLET) {
           tm_mat(spinorCheck, gauge, spinorOut, inv_param.kappa, inv_param.mu, inv_param.twist_flavor, 0, inv_param.cpu_prec, gauge_param);
         } else {
           printfQuda("Unsupported dslash_type\n");
           exit(-1);
         }
       }
     }
     if (inv_param.mass_normalization == QUDA_MASS_NORMALIZATION) {
       ax(0.5/inv_param.kappa, spinorCheck, V*spinorSiteSize, inv_param.cpu_prec);
     }

   } else if(inv_param.solution_type == QUDA_MATPC_SOLUTION) {

     if (dslash_type == QUDA_WILSON_DSLASH || dslash_type == QUDA_CLOVER_WILSON_DSLASH) {
       wil_matpc(spinorCheck, gauge, spinorOut, inv_param.kappa, inv_param.matpc_type, 0,
     inv_param.cpu_prec, gauge_param);
     } else {
       if (dslash_type == QUDA_TWISTED_MASS_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
         if (inv_param.twist_flavor == QUDA_TWIST_SINGLET) {
           tm_matpc(spinorCheck, gauge, spinorOut, inv_param.kappa, inv_param.mu, inv_param.twist_flavor,
                    inv_param.matpc_type, 0, inv_param.cpu_prec, gauge_param);
         } else {
           printfQuda("Unsupported dslash_type\n");
           exit(-1);
         }
       }
     }

     if (inv_param.mass_normalization == QUDA_MASS_NORMALIZATION) {
       ax(0.25/(inv_param.kappa*inv_param.kappa), spinorCheck, Vh*spinorSiteSize, inv_param.cpu_prec);
     }

   }

   int vol = inv_param.solution_type == QUDA_MAT_SOLUTION ? V : Vh;
   mxpy(spinorIn, spinorCheck, vol*spinorSiteSize*inv_param.Ls, inv_param.cpu_prec);
   double nrm2 = norm_2(spinorCheck, vol*spinorSiteSize*inv_param.Ls, inv_param.cpu_prec);
   double src2 = norm_2(spinorIn, vol*spinorSiteSize*inv_param.Ls, inv_param.cpu_prec);
   double l2r = sqrt(nrm2 / src2);

   printfQuda("Residuals: (L2 relative) tol %g, QUDA = %g, host = %g; (heavy-quark) tol %g, QUDA = %g\n",
        inv_param.tol, inv_param.true_res, l2r, inv_param.tol_hq, inv_param.true_res_hq);


   freeGaugeQuda();
   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) freeCloverQuda();

   // finalize the QUDA library
   endQuda();

   // finalize the communications layer
   finalizeComms();

   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH || dslash_type == QUDA_TWISTED_CLOVER_DSLASH) {
     if (clover) free(clover);
     if (clover_inv) free(clover_inv);
   }

   for (int dir = 0; dir<4; dir++) free(gauge[dir]);

   return 0;
 }
QudaInvertParam_s::maxiter_precondition
int maxiter_precondition
Definition: quda.h:267

niter
int niter
Definition: test_util.cpp:1630

link_recon
QudaReconstructType link_recon
Definition: test_util.cpp:1612

QudaInvertParam_s::secs
double secs
Definition: quda.h:228

dimPartitioned
int dimPartitioned(int dim)
Definition: test_util.cpp:1686

QudaInvertParam_s::dirac_order
QudaDiracFieldOrder dirac_order
Definition: quda.h:195

deflation_grid
int deflation_grid
Definition: test_util.cpp:1671

QUDA_VERBOSE
Definition: enum_quda.h:237

QudaInvertParam_s::mass_normalization
QudaMassNormalization mass_normalization
Definition: quda.h:185

QudaInvertParam_s::tol_hq_offset
double tol_hq_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:159

QudaGaugeParam_s::reconstruct_sloppy
QudaReconstructType reconstruct_sloppy
Definition: quda.h:46

QudaGaugeParam_s::anisotropy
double anisotropy
Definition: quda.h:31

freeCloverQuda
void freeCloverQuda(void)
Definition: interface_quda.cpp:1268

QudaEigParam_s::np
int np
Definition: quda.h:356

QUDA_MAT_SOLUTION
Definition: enum_quda.h:130

QUDA_PACKED_CLOVER_ORDER
Definition: enum_quda.h:228

endQuda
void endQuda(void)
Definition: interface_quda.cpp:1290

free
void free(void *)

construct_gauge_field
void construct_gauge_field(void **gauge, int type, QudaPrecision precision, QudaGaugeParam *param)
Definition: test_util.cpp:1054

mu
double mu
Definition: test_util.cpp:1643

QUDA_GMRESDR_INVERTER
Definition: enum_quda.h:112

QudaInvertParam_s::solve_type
QudaSolveType solve_type
Definition: quda.h:182

QudaInvertParam_s::verbosity_precondition
QudaVerbosity verbosity_precondition
Definition: quda.h:261

QudaPrecision
enum QudaPrecision_s QudaPrecision

tol_hq
double tol_hq
Definition: test_util.cpp:1648

QudaGaugeParam_s::ga_pad
int ga_pad
Definition: quda.h:53

destroyDeflationQuda
void destroyDeflationQuda(void *df_instance)
Definition: interface_quda.cpp:2514

misc.h

QudaInvertParam_s::extlib_type
QudaExtLibType extlib_type
Definition: quda.h:331

Lsdim
int Lsdim
Definition: test_util.cpp:1624

QudaInvertParam_s::mu
double mu
Definition: quda.h:105

solve_type
QudaSolveType solve_type
Definition: test_util.cpp:1653

QudaGaugeParam_s::gauge_fix
QudaGaugeFixed gauge_fix
Definition: quda.h:51

QudaInvertParam_s::schwarz_type
QudaSchwarzType schwarz_type
Definition: quda.h:276

quda::norm
__host__ __device__ ValueType norm(const complex< ValueType > &z)
Returns the magnitude of z squared.
Definition: complex_quda.h:896

eigenval_tol
double eigenval_tol
Definition: test_util.cpp:1677

tm_mat
void tm_mat(void *out, void **gauge, void *in, double kappa, double mu, QudaTwistFlavorType flavor, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:311

QudaResidualType
enum QudaResidualType_s QudaResidualType

tol_restart
double tol_restart
Definition: test_util.cpp:1672

QUDA_MASS_NORMALIZATION
Definition: enum_quda.h:197

QudaInvertParam_s::inv_type_precondition
QudaInverterType inv_type_precondition
Definition: quda.h:248

dslash_type
QudaDslashType dslash_type
Definition: test_util.cpp:1626

QUDA_INVALID_PRECISION
Definition: enum_quda.h:62

QudaGaugeParam_s::type
QudaLinkType type
Definition: quda.h:35

QudaInvertParam_s::kappa
double kappa
Definition: quda.h:97

QudaInvertParam_s::cuda_prec_ritz
QudaPrecision cuda_prec_ritz
Definition: quda.h:290

invertQuda
void invertQuda(void *h_x, void *h_b, QudaInvertParam *param)
Definition: interface_quda.cpp:2521

QudaInvertParam_s::tol
double tol
Definition: quda.h:110

QudaInvertParam_s::dslash_type
QudaDslashType dslash_type
Definition: quda.h:93

zdim
int zdim
Definition: test_util.cpp:1622

QUDA_GAUGE_FIXED_NO
Definition: enum_quda.h:76

QudaGaugeParam_s::reconstruct_precondition
QudaReconstructType reconstruct_precondition
Definition: quda.h:49

QudaInvertParam_s::inv_type
QudaInverterType inv_type
Definition: quda.h:94

test_util.h

QudaInvertParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:191

cloverSiteSize
#define cloverSiteSize
Definition: test_util.h:8

QudaInvertParam_s::return_clover_inverse
int return_clover_inverse
Definition: quda.h:217

setGaugeParam
void setGaugeParam(QudaGaugeParam &gauge_param)
Definition: deflated_invert_test.cpp:123

QudaSolveType
enum QudaSolveType_s QudaSolveType

QUDA_QDP_GAUGE_ORDER
Definition: enum_quda.h:41

loadGaugeQuda
void loadGaugeQuda(void *h_gauge, QudaGaugeParam *param)
Definition: interface_quda.cpp:602

deflation_ext_lib
QudaExtLibType deflation_ext_lib
Definition: test_util.cpp:1680

QUDA_WILSON_LINKS
Definition: enum_quda.h:29

QudaInvertParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:190

setDeflationParam
void setDeflationParam(QudaEigParam &df_param)
Definition: deflated_invert_test.cpp:275

prec
QudaPrecision prec
Definition: test_util.cpp:1615

process_command_line_option
int process_command_line_option(int argc, char **argv, int *idx)
Definition: test_util.cpp:1795

inc_tol
double inc_tol
Definition: test_util.cpp:1676

strcpy
char * strcpy(char *__dst, const char *__src)

QUDA_EIGCG_INVERTER
Definition: enum_quda.h:110

compute_clover
bool compute_clover
Definition: test_util.cpp:1646

ydim
int ydim
Definition: test_util.cpp:1621

QudaInvertParam_s::dagger
QudaDagType dagger
Definition: quda.h:184

finalizeComms
void finalizeComms()
Definition: test_util.cpp:107

quda::blas::ax
void ax(const double &a, ColorSpinorField &x)
Definition: blas_quda.cu:209

anisotropy
double anisotropy
Definition: test_util.cpp:1644

QUDA_TWIST_SINGLET
Definition: enum_quda.h:367

gauge_param
QudaGaugeParam gauge_param
Definition: dslash_ctest.cpp:36

QudaGaugeParam_s::gauge_order
QudaGaugeFieldOrder gauge_order
Definition: quda.h:36

QudaInvertParam_s::true_res
double true_res
Definition: quda.h:115

util_quda.h

tm_matpc
void tm_matpc(void *outEven, void **gauge, void *inEven, double kappa, double mu, QudaTwistFlavorType flavor, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:358

QUDA_TWIST_NONDEG_DOUBLET
Definition: enum_quda.h:368

get_prec_str
const char * get_prec_str(QudaPrecision prec)
Definition: misc.cpp:704

loadCloverQuda
void loadCloverQuda(void *h_clover, void *h_clovinv, QudaInvertParam *inv_param)
Definition: interface_quda.cpp:859

cuda_prec_precondition
QudaPrecision & cuda_prec_precondition
Definition: deflated_invert_test.cpp:120

QudaInvertParam_s::return_clover
int return_clover
Definition: quda.h:216

spinorSiteSize
#define spinorSiteSize
Definition: interface_quda.cpp:56

quda
Definition: blas_cublas.h:6

exit
void exit(int) __attribute__((noreturn))

QudaInvertParam_s::clover_cuda_prec_sloppy
QudaPrecision clover_cuda_prec_sloppy
Definition: quda.h:202

setDims
void setDims(int *)
Definition: test_util.cpp:130

QudaInvertParam_s::input_location
QudaFieldLocation input_location
Definition: quda.h:90

freeGaugeQuda
void freeGaugeQuda(void)
Definition: interface_quda.cpp:1090

inv_type
QudaInverterType inv_type
Definition: test_util.cpp:1638

QudaInvertParam_s::reliable_delta
double reliable_delta
Definition: quda.h:118

gSize
static size_t gSize
Definition: llfat_test.cpp:36

prec_sloppy
QudaPrecision prec_sloppy
Definition: test_util.cpp:1616

QudaEigParam_s::nk
int nk
Definition: quda.h:355

setInvertParam
void setInvertParam(QudaInvertParam &inv_param)
Definition: deflated_invert_test.cpp:162

QudaInvertParam_s::solution_type
QudaSolutionType solution_type
Definition: quda.h:181

return
else return(__swbuf(_c, _p))

QUDA_MATPC_SOLUTION
Definition: enum_quda.h:132

cuda_prec_ritz
QudaPrecision & cuda_prec_ritz
Definition: deflated_invert_test.cpp:121

QudaEigParam_s::mem_type_ritz
QudaMemoryType mem_type_ritz
Definition: quda.h:367

strcmp
int strcmp(const char *__s1, const char *__s2)

QudaInvertParam_s::clover_cuda_prec
QudaPrecision clover_cuda_prec
Definition: quda.h:201

QudaInvertParam_s::precondition_cycle
int precondition_cycle
Definition: quda.h:273

QUDA_SILENT
Definition: enum_quda.h:235

dslash_cuda_gen.clover
bool clover
Definition: dslash_cuda_gen.py:1224

QudaEigParam_s::invert_param
QudaInvertParam * invert_param
Definition: quda.h:346

initQuda
void initQuda(int device)
Definition: interface_quda.cpp:546

QudaInvertParam_s::spinorGiB
double spinorGiB
Definition: quda.h:225

tol
double tol
Definition: test_util.cpp:1647

QudaInvertParam_s::output_location
QudaFieldLocation output_location
Definition: quda.h:91

malloc
void * malloc(size_t __size) __attribute__((__warn_unused_result__)) __attribute__((alloc_size(1)))

QudaInvertParam_s::clover_cuda_prec_precondition
QudaPrecision clover_cuda_prec_precondition
Definition: quda.h:203

inv_param
QudaInvertParam inv_param
Definition: covdev_test.cpp:37

printf
int printf(const char *,...) __attribute__((__format__(__printf__

vec_infile
char vec_infile[]
Definition: test_util.cpp:1636

cuda_prec_sloppy
QudaPrecision & cuda_prec_sloppy
Definition: deflated_invert_test.cpp:119

QudaEigParam_s::run_verify
QudaBoolean run_verify
Definition: quda.h:373

quda::setTransferGPU
void setTransferGPU(bool)

QUDA_PRESERVE_SOURCE_NO
Definition: enum_quda.h:208

QudaGaugeParam_s
Definition: quda.h:25

newDeflationQuda
void * newDeflationQuda(QudaEigParam *param)
Definition: interface_quda.cpp:2500

QudaInvertParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:192

QudaInvertParam_s::verbosity
QudaVerbosity verbosity
Definition: quda.h:219

setSpinorSiteSize
void setSpinorSiteSize(int n)
Definition: test_util.cpp:192

QUDA_ADDITIVE_SCHWARZ
Definition: enum_quda.h:160

QudaInvertParam_s::tol_offset
double tol_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:156

newQudaInvertParam
QudaInvertParam newQudaInvertParam(void)

QudaInvertParam_s::gflops
double gflops
Definition: quda.h:227

QudaInvertParam_s::eigcg_max_restarts
int eigcg_max_restarts
Definition: quda.h:306

get_recon_str
const char * get_recon_str(QudaReconstructType recon)
Definition: misc.cpp:770

QudaGaugeParam_s::cuda_prec_precondition
QudaPrecision cuda_prec_precondition
Definition: quda.h:48

QudaInvertParam_s::clover_order
QudaCloverFieldOrder clover_order
Definition: quda.h:205

max_search_dim
int max_search_dim
Definition: test_util.cpp:1670

V
int V
Definition: test_util.cpp:28

QudaInvertParam_s::tol_hq
double tol_hq
Definition: quda.h:112

QudaMatPCType
enum QudaMatPCType_s QudaMatPCType

spinorOut
cpuColorSpinorField * spinorOut
Definition: covdev_test.cpp:41

gaugeSiteSize
#define gaugeSiteSize
Definition: test_util.h:6

QudaInvertParam_s::nev
int nev
Definition: quda.h:294

QUDA_PERIODIC_T
Definition: enum_quda.h:54

QUDA_CLOVER_WILSON_DSLASH
Definition: enum_quda.h:87

fused_exterior_ndeg_tm_dslash_cuda_gen.i
int i
start here
Definition: fused_exterior_ndeg_tm_dslash_cuda_gen.py:816

blas_reference.h

sqrt
double sqrt(double)

double
double
Definition: CMakeCUDACompilerId.cpp1.ii:8010

main
int main(int argc, char **argv)
Definition: deflated_invert_test.cpp:294

QudaInvertParam_s::true_res_hq
double true_res_hq
Definition: quda.h:116

QudaInvertParam_s::gamma_basis
QudaGammaBasis gamma_basis
Definition: quda.h:197

vec_outfile
char vec_outfile[]
Definition: test_util.cpp:1637

cpu_prec
QudaPrecision & cpu_prec
Definition: deflated_invert_test.cpp:117

QudaGaugeParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:45

QudaInvertParam_s::max_search_dim
int max_search_dim
Definition: quda.h:298

eigcg_max_restarts
int eigcg_max_restarts
Definition: test_util.cpp:1674

QudaInvertParam_s::tol_precondition
double tol_precondition
Definition: quda.h:264

link_recon_precondition
QudaReconstructType link_recon_precondition
Definition: test_util.cpp:1614

max_restart_num
int max_restart_num
Definition: test_util.cpp:1675

dslash_util.h

QUDA_BOOLEAN_NO
Definition: enum_quda.h:408

mass
double mass
Definition: test_util.cpp:1642

QudaGaugeParam_s::reconstruct
QudaReconstructType reconstruct
Definition: quda.h:43

QudaGaugeParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:42

QUDA_KAPPA_NORMALIZATION
Definition: enum_quda.h:196

matpc_type
QudaMatPCType matpc_type
Definition: test_util.cpp:1652

QudaGaugeParam_s::X
int X[4]
Definition: quda.h:29

QudaInvertParam_s::mass
double mass
Definition: quda.h:96

QudaEigParam_s::import_vectors
QudaBoolean import_vectors
Definition: quda.h:361

solver_ext_lib
QudaExtLibType solver_ext_lib
Definition: test_util.cpp:1679

QudaEigParam_s::location
QudaFieldLocation location
Definition: quda.h:370

QudaInvertParam_s::gcrNkrylov
int gcrNkrylov
Definition: quda.h:237

QudaEigParam_s
Definition: quda.h:344

QudaInvertParam_s::maxiter
int maxiter
Definition: quda.h:117

QUDA_TWISTED_CLOVER_DSLASH
Definition: enum_quda.h:94

norm_2
double norm_2(void *v, int len, QudaPrecision precision)
Definition: blas_reference.cpp:48

rand
int rand(void) __attribute__((__availability__(swift

QudaInvertParam_s::sp_pad
int sp_pad
Definition: quda.h:221

QudaInvertParam_s::compute_clover_inverse
int compute_clover_inverse
Definition: quda.h:215

prec_precondition
QudaPrecision prec_precondition
Definition: test_util.cpp:1617

QUDA_WILSON_DSLASH
Definition: enum_quda.h:86

construct_clover_field
void construct_clover_field(void *clover, double norm, double diag, QudaPrecision precision)
Definition: test_util.cpp:1166

memset
void * memset(void *__b, int __c, size_t __len)

cuda_prec
QudaPrecision & cuda_prec
Definition: deflated_invert_test.cpp:118

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:61

QudaEigParam_s::vec_outfile
char vec_outfile[256]
Definition: quda.h:379

QudaFieldLocation
enum QudaFieldLocation_s QudaFieldLocation

usage
void usage(char **)
Definition: test_util.cpp:1693

Nsrc
int Nsrc
Definition: test_util.cpp:1628

wil_mat
void wil_mat(void *out, void **gauge, void *in, double kappa, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:296

QudaGaugeParam_s::gaugeGiB
double gaugeGiB
Definition: quda.h:60

QudaInvertParam_s::cuda_prec_precondition
QudaPrecision cuda_prec_precondition
Definition: quda.h:193

QUDA_TWISTED_MASS_DSLASH
Definition: enum_quda.h:93

QudaInvertParam_s::iter
int iter
Definition: quda.h:224

QudaInvertParam_s::deflation_grid
int deflation_grid
Definition: quda.h:302

prec_ritz
QudaPrecision prec_ritz
Definition: test_util.cpp:1618

QudaInvertParam_s::tol_restart
double tol_restart
Definition: quda.h:111

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:60

clover_coeff
double clover_coeff
Definition: test_util.cpp:1645

QudaReconstructType
enum QudaReconstructType_s QudaReconstructType

quda.h
Main header file for the QUDA library.

xdim
int xdim
Definition: test_util.cpp:1620

nev
int nev
Definition: test_util.cpp:1669

device
int device
Definition: CMakeCUDACompilerId.cpp1.ii:2238

initRand
void initRand()
Definition: test_util.cpp:117

latfile
char latfile[]
Definition: test_util.cpp:1627

QUDA_DEGRAND_ROSSI_GAMMA_BASIS
Definition: enum_quda.h:338

QudaEigParam_s::extlib_type
QudaExtLibType extlib_type
Definition: quda.h:388

mem_type_ritz
QudaMemoryType mem_type_ritz
Definition: test_util.cpp:1682

QudaInvertParam_s::Ls
int Ls
Definition: quda.h:100

printfQuda
#define printfQuda(...)
Definition: util_quda.h:84

precon_type
QudaInverterType precon_type
Definition: test_util.cpp:1639

QUDA_DAG_NO
Definition: enum_quda.h:190

QudaGaugeParam_s::t_boundary
QudaTboundary t_boundary
Definition: quda.h:38

QudaInvertParam_s::twist_flavor
QudaTwistFlavorType twist_flavor
Definition: quda.h:108

Vh
int Vh
Definition: test_util.cpp:29

nvec
int nvec[]
Definition: test_util.cpp:1635

QUDA_INC_EIGCG_INVERTER
Definition: enum_quda.h:111

e
return e
Definition: CMakeCUDACompilerId.cpp1.ii:3026

qio_field.h

QudaInvertParam_s::max_restart_num
int max_restart_num
Definition: quda.h:308

QUDA_DIRAC_ORDER
Definition: enum_quda.h:215

QudaDslashType
enum QudaDslashType_s QudaDslashType

domain_wall_dslash_reference.h

twist_flavor
QudaTwistFlavorType twist_flavor
Definition: test_util.cpp:1649

QudaInvertParam_s::cl_pad
int cl_pad
Definition: quda.h:222

location_ritz
QudaFieldLocation location_ritz
Definition: test_util.cpp:1681

QUDA_DIRECT_PC_SOLVE
Definition: enum_quda.h:142

quda::blas::mxpy
void mxpy(ColorSpinorField &x, ColorSpinorField &y)
Definition: blas_quda.cu:192

QudaInvertParam_s::residual_type
QudaResidualType residual_type
Definition: quda.h:286

gridsize_from_cmdline
int gridsize_from_cmdline[]
Definition: test_util.cpp:50

QudaInvertParam_s::rhs_idx
int rhs_idx
Definition: quda.h:300

wil_matpc
void wil_matpc(void *outEven, void **gauge, void *inEven, double kappa, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:334

QudaInvertParam_s::inc_tol
double inc_tol
Definition: quda.h:310

QudaInvertParam_s::num_offset
int num_offset
Definition: quda.h:146

QudaInvertParam_s::cloverGiB
double cloverGiB
Definition: quda.h:226

clock
clock_t clock(void) __asm("_" "clock")

QudaInvertParam_s::compute_clover
int compute_clover
Definition: quda.h:214

wilson_dslash_reference.h

tdim
int tdim
Definition: test_util.cpp:1623

float
float
Definition: CMakeCUDACompilerId.cpp1.ii:12791

QudaInvertParam_s::omega
double omega
Definition: quda.h:270

display_test_info
void display_test_info()
Definition: deflated_invert_test.cpp:92

QUDA_NORMOP_PC_SOLVE
Definition: enum_quda.h:143

read_gauge_field
void read_gauge_field(const char *filename, void *gauge[], QudaPrecision prec, const int *X, int argc, char *argv[])
Definition: qio_field.h:12

QudaInvertParam_s::deflation_op
void * deflation_op
Definition: quda.h:254

QudaInvertParam_s::eigenval_tol
double eigenval_tol
Definition: quda.h:304

QudaInvertParam_s::clover_cpu_prec
QudaPrecision clover_cpu_prec
Definition: quda.h:200

QudaEigParam_s::cuda_prec_ritz
QudaPrecision cuda_prec_ritz
Definition: quda.h:364

QudaInvertParam_s
Definition: quda.h:88

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:296

initComms
void initComms(int argc, char **argv, const int *commDims)
Definition: test_util.cpp:72

QudaInvertParam_s::matpc_type
QudaMatPCType matpc_type
Definition: quda.h:183

newQudaEigParam
QudaEigParam newQudaEigParam(void)

QudaEigParam_s::vec_infile
char vec_infile[256]
Definition: quda.h:376

QudaInverterType
enum QudaInverterType_s QudaInverterType

QUDA_L2_RELATIVE_RESIDUAL
Definition: enum_quda.h:166

QudaMemoryType
enum QudaMemoryType_s QudaMemoryType

QudaGaugeParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:40

QudaExtLibType
enum QudaExtLibType_s QudaExtLibType

newQudaGaugeParam
QudaGaugeParam newQudaGaugeParam(void)

QUDA_RECONSTRUCT_INVALID
Definition: enum_quda.h:72

QudaInvertParam_s::preserve_source
QudaPreserveSource preserve_source
Definition: quda.h:188

QudaInvertParam_s::clover_coeff
double clover_coeff
Definition: quda.h:208

QudaTwistFlavorType
enum QudaTwistFlavorType_s QudaTwistFlavorType

link_recon_sloppy
QudaReconstructType link_recon_sloppy
Definition: test_util.cpp:1613