quda-ref/v1.0.0/solver_8cpp_source.html

 #include <quda_internal.h>
 #include <invert_quda.h>
 #include <multigrid.h>
 #include <eigensolve_quda.h>
 #include <cmath>

 namespace quda {

   static void report(const char *type) {
     if (getVerbosity() >= QUDA_VERBOSE) printfQuda("Creating a %s solver\n", type);
   }

   Solver::Solver(SolverParam &param, TimeProfile &profile) :
     param(param),
     profile(profile),
     node_parity(0),
     eig_solve(nullptr)
   {
     // compute parity of the node
     for (int i=0; i<4; i++) node_parity += commCoords(i);
     node_parity = node_parity % 2;
   }

   Solver::~Solver()
   {
     if (eig_solve) {
       delete eig_solve;
       eig_solve = nullptr;
     }
   }

   // solver factory
   Solver* Solver::create(SolverParam &param, DiracMatrix &mat, DiracMatrix &matSloppy,
        DiracMatrix &matPrecon, TimeProfile &profile)
   {
     Solver *solver = nullptr;

     if (param.preconditioner && param.inv_type != QUDA_GCR_INVERTER)
       errorQuda("Explicit preconditoner not supported for %d solver", param.inv_type);

     if (param.preconditioner && param.inv_type_precondition != QUDA_MG_INVERTER)
       errorQuda("Explicit preconditoner not supported for %d preconditioner", param.inv_type_precondition);

     switch (param.inv_type) {
     case QUDA_CG_INVERTER:
       report("CG");
       solver = new CG(mat, matSloppy, param, profile);
       break;
     case QUDA_BICGSTAB_INVERTER:
       report("BiCGstab");
       solver = new BiCGstab(mat, matSloppy, matPrecon, param, profile);
       break;
     case QUDA_GCR_INVERTER:
       report("GCR");
       if (param.preconditioner) {
   Solver *mg = param.mg_instance ? static_cast<MG*>(param.preconditioner) : static_cast<multigrid_solver*>(param.preconditioner)->mg;
   // FIXME dirty hack to ensure that preconditioner precision set in interface isn't used in the outer GCR-MG solver
   if (!param.mg_instance) param.precision_precondition = param.precision_sloppy;
   solver = new GCR(mat, *(mg), matSloppy, matPrecon, param, profile);
       } else {
   solver = new GCR(mat, matSloppy, matPrecon, param, profile);
       }
       break;
     case QUDA_CA_CG_INVERTER:
       report("CA-CG");
       solver = new CACG(mat, matSloppy, param, profile);
       break;
     case QUDA_CA_CGNE_INVERTER:
       report("CA-CGNE");
       solver = new CACGNE(mat, matSloppy, param, profile);
       break;
     case QUDA_CA_CGNR_INVERTER:
       report("CA-CGNR");
       solver = new CACGNR(mat, matSloppy, param, profile);
       break;
     case QUDA_CA_GCR_INVERTER:
       report("CA-GCR");
       solver = new CAGCR(mat, matSloppy, param, profile);
       break;
     case QUDA_MR_INVERTER:
       report("MR");
       solver = new MR(mat, matSloppy, param, profile);
       break;
     case QUDA_SD_INVERTER:
       report("SD");
       solver = new SD(mat, param, profile);
       break;
     case QUDA_XSD_INVERTER:
 #ifdef MULTI_GPU
       report("XSD");
       solver = new XSD(mat, param, profile);
 #else
       errorQuda("Extended Steepest Descent is multi-gpu only");
 #endif
       break;
     case QUDA_PCG_INVERTER:
       report("PCG");
       solver = new PreconCG(mat, matSloppy, matPrecon, param, profile);
       break;
     case QUDA_MPCG_INVERTER:
       report("MPCG");
       solver = new MPCG(mat, param, profile);
       break;
     case QUDA_MPBICGSTAB_INVERTER:
       report("MPBICGSTAB");
       solver = new MPBiCGstab(mat, param, profile);
       break;
     case QUDA_BICGSTABL_INVERTER:
       report("BICGSTABL");
       solver = new BiCGstabL(mat, matSloppy, param, profile);
       break;
     case QUDA_EIGCG_INVERTER:
       report("EIGCG");
       solver = new IncEigCG(mat, matSloppy, matPrecon, param, profile);
       break;
     case QUDA_INC_EIGCG_INVERTER:
       report("INC EIGCG");
       solver = new IncEigCG(mat, matSloppy, matPrecon, param, profile);
       break;
     case QUDA_GMRESDR_INVERTER:
       report("GMRESDR");
       if (param.preconditioner) {
   multigrid_solver *mg = static_cast<multigrid_solver*>(param.preconditioner);
   // FIXME dirty hack to ensure that preconditioner precision set in interface isn't used in the outer GCR-MG solver
   param.precision_precondition = param.precision_sloppy;
   solver = new GMResDR(mat, *(mg->mg), matSloppy, matPrecon, param, profile);
       } else {
   solver = new GMResDR(mat, matSloppy, matPrecon, param, profile);
       }
       break;
     case QUDA_CGNE_INVERTER:
       report("CGNE");
       solver = new CGNE(mat, matSloppy, param, profile);
       break;
     case QUDA_CGNR_INVERTER:
       report("CGNR");
       solver = new CGNR(mat, matSloppy, param, profile);
       break;
     case QUDA_CG3_INVERTER:
       report("CG3");
       solver = new CG3(mat, matSloppy, param, profile);
       break;
     case QUDA_CG3NE_INVERTER:
       report("CG3NE");
       solver = new CG3NE(mat, matSloppy, param, profile);
       break;
     case QUDA_CG3NR_INVERTER:
       report("CG3NR");
       // CG3NR is included in CG3NE
       solver = new CG3NE(mat, matSloppy, param, profile);
       break;
     default:
       errorQuda("Invalid solver type %d", param.inv_type);
     }

     return solver;
   }

   void Solver::constructDeflationSpace(const ColorSpinorField &meta, const DiracMatrix &mat, bool svd)
   {
     if (deflate_init) return;

     // Deflation requested + first instance of solver
     profile.TPSTOP(QUDA_PROFILE_INIT);
     eig_solve = EigenSolver::create(&param.eig_param, mat, profile);
     profile.TPSTART(QUDA_PROFILE_INIT);

     // Clone from an existing vector
     ColorSpinorParam csParam(meta);
     csParam.create = QUDA_ZERO_FIELD_CREATE;
     // This is the vector precision used by matResidual
     csParam.setPrecision(param.precision_sloppy, QUDA_INVALID_PRECISION, true);
     param.evecs.resize(param.eig_param.nConv);
     for (int i = 0; i < param.eig_param.nConv; i++) param.evecs[i] = ColorSpinorField::Create(csParam);

     // Construct vectors to hold deflated RHS
     defl_tmp1.push_back(ColorSpinorField::Create(csParam));
     defl_tmp2.push_back(ColorSpinorField::Create(csParam));

     param.evals.resize(param.eig_param.nConv);
     for (int i = 0; i < param.eig_param.nConv; i++) param.evals[i] = 0.0;
     profile.TPSTOP(QUDA_PROFILE_INIT);
     (*eig_solve)(param.evecs, param.evals);
     profile.TPSTART(QUDA_PROFILE_INIT);

     if (svd) {
       // Resize deflation space and compute left SV of M
       for (int i = param.eig_param.nConv; i < 2 * param.eig_param.nConv; i++)
         param.evecs.push_back(ColorSpinorField::Create(csParam));

       // Populate latter half of the array with left SV
       eig_solve->computeSVD(mat, param.evecs, param.evals);
     }

     deflate_init = true;
   }

   void Solver::blocksolve(ColorSpinorField& out, ColorSpinorField& in){
     for (int i = 0; i < param.num_src; i++) {
       (*this)(out.Component(i), in.Component(i));
       param.true_res_offset[i] = param.true_res;
       param.true_res_hq_offset[i] = param.true_res_hq;
     }
   }

   double Solver::stopping(double tol, double b2, QudaResidualType residual_type) {

     double stop=0.0;
     if ( (residual_type & QUDA_L2_ABSOLUTE_RESIDUAL) &&
    (residual_type & QUDA_L2_RELATIVE_RESIDUAL) ) {
       // use the most stringent stopping condition
       double lowest = (b2 < 1.0) ? b2 : 1.0;
       stop = lowest*tol*tol;
     } else if (residual_type & QUDA_L2_ABSOLUTE_RESIDUAL) {
       stop = tol*tol;
     } else {
       stop = b2*tol*tol;
     }

     return stop;
   }

   bool Solver::convergence(double r2, double hq2, double r2_tol, double hq_tol) {

     // check the heavy quark residual norm if necessary
     if ( (param.residual_type & QUDA_HEAVY_QUARK_RESIDUAL) && (hq2 > hq_tol) )
       return false;

     // check the L2 relative residual norm if necessary
     if ( ((param.residual_type & QUDA_L2_RELATIVE_RESIDUAL) ||
     (param.residual_type & QUDA_L2_ABSOLUTE_RESIDUAL)) && (r2 > r2_tol) )
       return false;

     return true;
   }

   bool Solver::convergenceHQ(double r2, double hq2, double r2_tol, double hq_tol) {

     // check the heavy quark residual norm if necessary
     if ( (param.residual_type & QUDA_HEAVY_QUARK_RESIDUAL) && (hq2 > hq_tol) )
       return false;

     return true;
   }

   bool Solver::convergenceL2(double r2, double hq2, double r2_tol, double hq_tol) {

     // check the L2 relative residual norm if necessary
     if ( ((param.residual_type & QUDA_L2_RELATIVE_RESIDUAL) ||
     (param.residual_type & QUDA_L2_ABSOLUTE_RESIDUAL)) && (r2 > r2_tol) )
       return false;

     return true;
   }

   void Solver::PrintStats(const char* name, int k, double r2, double b2, double hq2) {
     if (getVerbosity() >= QUDA_VERBOSE) {
       if (param.residual_type & QUDA_HEAVY_QUARK_RESIDUAL) {
   printfQuda("%s: %d iterations, <r,r> = %e, |r|/|b| = %e, heavy-quark residual = %e\n",
        name, k, r2, sqrt(r2/b2), hq2);
       } else {
   printfQuda("%s: %d iterations, <r,r> = %e, |r|/|b| = %e\n",
        name, k, r2, sqrt(r2/b2));
       }
     }

     if (std::isnan(r2)) errorQuda("Solver appears to have diverged");
   }

   void Solver::PrintSummary(const char *name, int k, double r2, double b2,
                             double r2_tol, double hq_tol) {
     if (getVerbosity() >= QUDA_SUMMARIZE) {
       if (param.compute_true_res) {
   if (param.residual_type & QUDA_HEAVY_QUARK_RESIDUAL) {
     printfQuda("%s: Convergence at %d iterations, L2 relative residual: iterated = %e, true = %e "
                      "(requested = %e), heavy-quark residual = %e (requested = %e)\n",
          name, k, sqrt(r2/b2), param.true_res, sqrt(r2_tol/b2), param.true_res_hq, hq_tol);
   } else {
     printfQuda("%s: Convergence at %d iterations, L2 relative residual: iterated = %e, true = %e (requested = %e)\n",
          name, k, sqrt(r2/b2), param.true_res, sqrt(r2_tol/b2));
   }
       } else {
   if (param.residual_type & QUDA_HEAVY_QUARK_RESIDUAL) {
     printfQuda("%s: Convergence at %d iterations, L2 relative residual: iterated = %e "
                      "(requested = %e), heavy-quark residual = %e (requested = %e)\n",
          name, k, sqrt(r2/b2), sqrt(r2_tol/b2), param.true_res_hq, hq_tol);
   } else {
     printfQuda("%s: Convergence at %d iterations, L2 relative residual: iterated = %e (requested = %e)\n",
                      name, k, sqrt(r2/b2), sqrt(r2_tol/b2));
   }
       }
     }
   }

   bool MultiShiftSolver::convergence(const double *r2, const double *r2_tol, int n) const {

     for (int i=0; i<n; i++) {
       // check the L2 relative residual norm if necessary
       if ( ((param.residual_type & QUDA_L2_RELATIVE_RESIDUAL) ||
       (param.residual_type & QUDA_L2_ABSOLUTE_RESIDUAL)) && (r2[i] > r2_tol[i]) && r2_tol[i] != 0.0)
   return false;
     }

     return true;
   }

 } // namespace quda
invert_quda.h

quda::SolverParam::mg_instance
bool mg_instance
whether to use a global or local (node) reduction for this solver
Definition: invert_quda.h:248

quda::SolverParam::compute_true_res
bool compute_true_res
Definition: invert_quda.h:124

QUDA_VERBOSE
Definition: enum_quda.h:265

quda::CACG
Communication-avoiding CG solver. This solver does un-preconditioned CG, running in steps of nKrylov...
Definition: invert_quda.h:891

QUDA_CGNR_INVERTER
Definition: enum_quda.h:120

QUDA_GCR_INVERTER
Definition: enum_quda.h:104

quda::ColorSpinorParam::setPrecision
void setPrecision(QudaPrecision precision, QudaPrecision ghost_precision=QUDA_INVALID_PRECISION, bool force_native=false)
Definition: color_spinor_field.h:231

QUDA_GMRESDR_INVERTER
Definition: enum_quda.h:113

quda::Solver::convergenceHQ
bool convergenceHQ(double r2, double hq2, double r2_tol, double hq_tol)
Test for HQ solver convergence – ignore L2 residual.
Definition: solver.cpp:237

quda::ColorSpinorField
Definition: color_spinor_field.h:311

quda::BiCGstab
Definition: invert_quda.h:707

QudaResidualType
enum QudaResidualType_s QudaResidualType

quda::SolverParam::inv_type
QudaInverterType inv_type
Definition: invert_quda.h:22

getVerbosity
QudaVerbosity getVerbosity()
Definition: util_quda.cpp:21

QUDA_INVALID_PRECISION
Definition: enum_quda.h:63

quda::GCR
Definition: invert_quda.h:816

errorQuda
#define errorQuda(...)
Definition: util_quda.h:121

quda::SolverParam::true_res_hq
double true_res_hq
Definition: invert_quda.h:133

QUDA_MR_INVERTER
Definition: enum_quda.h:105

quda::sqrt
__host__ __device__ ValueType sqrt(ValueType x)
Definition: complex_quda.h:120

commCoords
int commCoords(int)
Definition: comm_common.cpp:813

quda::Solver::PrintStats
void PrintStats(const char *name, int k, double r2, double b2, double hq2)
Prints out the running statistics of the solver (requires a verbosity of QUDA_VERBOSE) ...
Definition: solver.cpp:256

QUDA_SUMMARIZE
Definition: enum_quda.h:264

QUDA_CG3NR_INVERTER
Definition: enum_quda.h:123

quda::CAGCR
Communication-avoiding GCR solver. This solver does un-preconditioned GCR, first building up a polyno...
Definition: invert_quda.h:990

quda::ColorSpinorField::Create
static ColorSpinorField * Create(const ColorSpinorParam &param)
Definition: color_spinor_field.cpp:752

quda::Solver::convergence
bool convergence(double r2, double hq2, double r2_tol, double hq_tol)
Definition: solver.cpp:223

QUDA_EIGCG_INVERTER
Definition: enum_quda.h:111

quda::Solver::profile
TimeProfile & profile
Definition: invert_quda.h:464

quda::CACGNE
Definition: invert_quda.h:952

quda::MR
Definition: invert_quda.h:863

QUDA_CG_INVERTER
Definition: enum_quda.h:102

quda::ColorSpinorField::Component
ColorSpinorField & Component(const int idx) const
Definition: color_spinor_field.cpp:653

quda::Solver::~Solver
virtual ~Solver()
Definition: solver.cpp:24

QUDA_CG3NE_INVERTER
Definition: enum_quda.h:122

quda::SolverParam::inv_type_precondition
QudaInverterType inv_type_precondition
Definition: invert_quda.h:28

QUDA_MPBICGSTAB_INVERTER
Definition: enum_quda.h:106

QUDA_MG_INVERTER
Definition: enum_quda.h:117

quda::Solver::defl_tmp1
std::vector< ColorSpinorField * > defl_tmp1
Definition: invert_quda.h:547

quda
Definition: blas_cublas.h:5

quda::CGNR
Definition: invert_quda.h:658

QUDA_BICGSTABL_INVERTER
Definition: enum_quda.h:118

param
QudaGaugeParam param
Definition: pack_test.cpp:17

QudaEigParam_s::nConv
int nConv
Definition: quda.h:420

quda::Solver::convergenceL2
bool convergenceL2(double r2, double hq2, double r2_tol, double hq_tol)
Test for L2 solver convergence – ignore HQ residual.
Definition: solver.cpp:246

quda::Solver::defl_tmp2
std::vector< ColorSpinorField * > defl_tmp2
Definition: invert_quda.h:548

quda::MultiShiftSolver::convergence
bool convergence(const double *r2, const double *r2_tol, int n) const
Definition: solver.cpp:295

QUDA_CA_GCR_INVERTER
Definition: enum_quda.h:127

multigrid.h

QUDA_CG3_INVERTER
Definition: enum_quda.h:121

tol
double tol
Definition: test_util.cpp:1656

quda::EigenSolver::create
static EigenSolver * create(QudaEigParam *eig_param, const DiracMatrix &mat, TimeProfile &profile)
Creates the eigensolver using the parameters given and the matrix.
Definition: eigensolve_quda.cpp:109

quda::SolverParam::residual_type
QudaResidualType residual_type
Definition: invert_quda.h:49

quda::SolverParam::true_res_hq_offset
double true_res_hq_offset[QUDA_MAX_MULTI_SHIFT]
Definition: invert_quda.h:187

QUDA_CA_CGNR_INVERTER
Definition: enum_quda.h:126

quda::Solver::stopping
static double stopping(double tol, double b2, QudaResidualType residual_type)
Set the solver L2 stopping condition.
Definition: solver.cpp:206

csParam
ColorSpinorParam csParam
Definition: pack_test.cpp:24

in
cpuColorSpinorField * in
Definition: staggered_invert_test.cpp:98

quda::Solver::create
static Solver * create(SolverParam &param, DiracMatrix &mat, DiracMatrix &matSloppy, DiracMatrix &matPrecon, TimeProfile &profile)
Definition: solver.cpp:33

quda::IncEigCG
Definition: invert_quda.h:1225

quda::CGNE
Definition: invert_quda.h:642

quda::Solver::blocksolve
virtual void blocksolve(ColorSpinorField &out, ColorSpinorField &in)
Definition: solver.cpp:198

QUDA_PCG_INVERTER
Definition: enum_quda.h:109

quda::multigrid_solver::mg
MG * mg
Definition: multigrid.h:480

quda::SolverParam::num_src
int num_src
Definition: invert_quda.h:164

quda::Solver::constructDeflationSpace
void constructDeflationSpace(const ColorSpinorField &meta, const DiracMatrix &mat, bool svd)
Constructs the deflation space.
Definition: solver.cpp:159

QUDA_CGNE_INVERTER
Definition: enum_quda.h:119

quda::EigenSolver::computeSVD
void computeSVD(const DiracMatrix &mat, std::vector< ColorSpinorField *> &evecs, std::vector< Complex > &evals)
Computes Left/Right SVD from pre computed Right/Left.
Definition: eigensolve_quda.cpp:263

quda::SolverParam::true_res_offset
double true_res_offset[QUDA_MAX_MULTI_SHIFT]
Definition: invert_quda.h:181

quda::Solver::eig_solve
EigenSolver * eig_solve
Definition: invert_quda.h:545

quda::SolverParam::evals
std::vector< Complex > evals
Definition: invert_quda.h:61

quda::Solver::node_parity
int node_parity
Definition: invert_quda.h:465

quda::XSD
Definition: invert_quda.h:1051

quda::SolverParam::eig_param
QudaEigParam eig_param
Definition: invert_quda.h:55

QUDA_HEAVY_QUARK_RESIDUAL
Definition: enum_quda.h:189

QUDA_MPCG_INVERTER
Definition: enum_quda.h:110

QUDA_BICGSTAB_INVERTER
Definition: enum_quda.h:103

quda::MPBiCGstab
Definition: invert_quda.h:742

QUDA_SD_INVERTER
Definition: enum_quda.h:107

quda::SolverParam::precision_precondition
QudaPrecision precision_precondition
Definition: invert_quda.h:151

quda::MG
Definition: multigrid.h:177

quda::BiCGstabL
Definition: invert_quda.h:755

quda::SolverParam::evecs
std::vector< ColorSpinorField * > evecs
Definition: invert_quda.h:58

quda::QUDA_PROFILE_INIT
Definition: timer.h:106

quda::SolverParam::true_res
double true_res
Definition: invert_quda.h:130

quda::Solver
Definition: invert_quda.h:460

quda::ColorSpinorParam
Definition: color_spinor_field.h:80

quda::Solver::Solver
Solver(SolverParam &param, TimeProfile &profile)
Definition: solver.cpp:13

quda::Solver::param
SolverParam & param
Definition: invert_quda.h:463

out
cpuColorSpinorField * out
Definition: staggered_invert_test.cpp:99

quda::report
static void report(const char *type)
Definition: solver.cpp:9

quda::CG
Conjugate-Gradient Solver.
Definition: invert_quda.h:570

quda::CG3NE
Definition: invert_quda.h:625

quda::SolverParam::preconditioner
void * preconditioner
Definition: invert_quda.h:33

quda::DiracMatrix
Definition: dirac_quda.h:1100

QUDA_CA_CG_INVERTER
Definition: enum_quda.h:124

printfQuda
#define printfQuda(...)
Definition: util_quda.h:115

QUDA_INC_EIGCG_INVERTER
Definition: enum_quda.h:112

quda::CG3
Definition: invert_quda.h:607

QUDA_XSD_INVERTER
Definition: enum_quda.h:108

quda::TimeProfile
Definition: timer.h:171

QUDA_L2_ABSOLUTE_RESIDUAL
Definition: enum_quda.h:188

quda::SolverParam::precision_sloppy
QudaPrecision precision_sloppy
Definition: invert_quda.h:145

QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:360

QUDA_CA_CGNE_INVERTER
Definition: enum_quda.h:125

quda::Solver::PrintSummary
void PrintSummary(const char *name, int k, double r2, double b2, double r2_tol, double hq_tol)
Prints out the summary of the solver convergence (requires a verbosity of QUDA_SUMMARIZE). Assumes SolverParam.true_res and SolverParam.true_res_hq has been set.
Definition: solver.cpp:270

quda::multigrid_solver
Definition: multigrid.h:466

quda::ColorSpinorParam::create
QudaFieldCreate create
Definition: color_spinor_field.h:95

quda::SolverParam
Definition: invert_quda.h:17

mat
void mat(void *out, void **link, void *in, int dagger_bit, int mu, QudaPrecision sPrecision, QudaPrecision gPrecision)
Definition: covdev_reference.cpp:112

quda::GMResDR
Definition: invert_quda.h:1277

quda::Solver::deflate_init
bool deflate_init
Definition: invert_quda.h:546

quda::PreconCG
Definition: invert_quda.h:689

QUDA_L2_RELATIVE_RESIDUAL
Definition: enum_quda.h:187

quda::CACGNR
Definition: invert_quda.h:968

eigensolve_quda.h

quda::MPCG
Definition: invert_quda.h:673

quda_internal.h

quda::SD
Definition: invert_quda.h:1035