quda-ref/v1.1.0/inv__pcg__quda_8cpp_source.html

 #include <cstdio>

 #include <cstdlib>

 #include <cmath>

 #include <iostream>


 #include <quda_internal.h>

 #include <color_spinor_field.h>

 #include <blas_quda.h>

 #include <dslash_quda.h>

 #include <invert_quda.h>

 #include <util_quda.h>


 namespace quda

 {


   using namespace blas;


   // set the required parameters for the inner solver

   static void fillInnerSolverParam(SolverParam &inner, const SolverParam &outer)

   {

     inner.tol = outer.tol_precondition;

     inner.delta = 1e-20; // no reliable updates within the inner solver


     // most preconditioners are uni-precision solvers, with CG being an exception

     inner.precision

       = outer.inv_type_precondition == QUDA_CG_INVERTER ? outer.precision_sloppy : outer.precision_precondition;

     inner.precision_sloppy = outer.precision_precondition;


     // this sets a fixed iteration count if we're using the MR solver

     inner.residual_type

       = (outer.inv_type_precondition == QUDA_MR_INVERTER) ? QUDA_INVALID_RESIDUAL : QUDA_L2_RELATIVE_RESIDUAL;


     inner.iter = 0;

     inner.gflops = 0;

     inner.secs = 0;


     inner.inv_type_precondition = QUDA_INVALID_INVERTER;

     inner.is_preconditioner = true; // used to tell the inner solver it is an inner solver

     inner.pipeline = true;


     inner.schwarz_type = outer.schwarz_type;

     inner.global_reduction = inner.schwarz_type == QUDA_INVALID_SCHWARZ ? true : false;


     inner.maxiter = outer.maxiter_precondition;

     if (outer.inv_type_precondition == QUDA_CA_GCR_INVERTER) {

       inner.Nkrylov = inner.maxiter / outer.precondition_cycle;

     } else {

       inner.Nsteps = outer.precondition_cycle;

     }


     if (outer.inv_type == QUDA_PCG_INVERTER && outer.precision_sloppy != outer.precision_precondition)

       inner.preserve_source = QUDA_PRESERVE_SOURCE_NO;

     else

       inner.preserve_source = QUDA_PRESERVE_SOURCE_YES;


     inner.verbosity_precondition = outer.verbosity_precondition;


     inner.compute_true_res = false;

     inner.sloppy_converge = true;

   }


   PreconCG::PreconCG(const DiracMatrix &mat, const DiracMatrix &matSloppy, const DiracMatrix &matPrecon,

                      const DiracMatrix &matEig, SolverParam &param, TimeProfile &profile) :

     Solver(mat, matSloppy, matPrecon, matEig, param, profile),

     K(0),

     Kparam(param)

   {

     fillInnerSolverParam(Kparam, param);

     // Preconditioners do not need a deflation space,

     // so we explicily set this here.

     Kparam.deflate = false;


     if (param.inv_type_precondition == QUDA_CG_INVERTER) {

       K = new CG(matPrecon, matPrecon, matPrecon, matEig, Kparam, profile);

     } else if (param.inv_type_precondition == QUDA_MR_INVERTER) {

       K = new MR(matPrecon, matPrecon, Kparam, profile);

     } else if (param.inv_type_precondition == QUDA_SD_INVERTER) {

       K = new SD(matPrecon, Kparam, profile);

     } else if (param.inv_type_precondition != QUDA_INVALID_INVERTER) { // unknown preconditioner

       errorQuda("Unknown inner solver %d", param.inv_type_precondition);

     }

   }


   PreconCG::~PreconCG()

   {

     profile.TPSTART(QUDA_PROFILE_FREE);


     if (K) delete K;

     destroyDeflationSpace();


     profile.TPSTOP(QUDA_PROFILE_FREE);

   }


   void PreconCG::operator()(ColorSpinorField &x, ColorSpinorField &b)

   {

     profile.TPSTART(QUDA_PROFILE_INIT);


     double b2 = blas::norm2(b);


     // Check to see that we're not trying to invert on a zero-field source

     if (b2 == 0 && param.compute_null_vector == QUDA_COMPUTE_NULL_VECTOR_NO) {

       profile.TPSTOP(QUDA_PROFILE_INIT);

       printfQuda("Warning: inverting on zero-field source\n");

       x = b;

       param.true_res = 0.0;

       param.true_res_hq = 0.0;

       return;

     }


     int k = 0;

     int rUpdate = 0;


     if (param.deflate) {

       // Construct the eigensolver and deflation space if requested.

       constructDeflationSpace(b, matEig);

       if (deflate_compute) {

         // compute the deflation space.

         (*eig_solve)(evecs, evals);

         deflate_compute = false;

       }

       if (recompute_evals) {

         eig_solve->computeEvals(matEig, evecs, evals);

         recompute_evals = false;

       }

     }


     cudaColorSpinorField *minvrPre = NULL;

     cudaColorSpinorField *rPre = NULL;

     cudaColorSpinorField *minvr = NULL;

     cudaColorSpinorField *minvrSloppy = NULL;

     cudaColorSpinorField *p = NULL;


     ColorSpinorParam csParam(b);

     cudaColorSpinorField r(b);

     if (K) minvr = new cudaColorSpinorField(b);

     csParam.create = QUDA_ZERO_FIELD_CREATE;

     cudaColorSpinorField y(b, csParam);


     csParam.setPrecision(param.precision_sloppy);


     // temporary fields

     ColorSpinorField *tmpp = ColorSpinorField::Create(csParam);

     ColorSpinorField *tmp2p = nullptr;

     ColorSpinorField *tmp3p = nullptr;

     if (!mat.isStaggered()) {

       // tmp2 only needed for multi-gpu Wilson-like kernels

       tmp2p = ColorSpinorField::Create(csParam);

       // additional high-precision temporary if Wilson and mixed-precision

       csParam.setPrecision(param.precision);

       tmp3p = (param.precision != param.precision_sloppy) ? ColorSpinorField::Create(csParam) : tmpp;

       csParam.setPrecision(param.precision_sloppy);

     } else {

       tmp3p = tmp2p = tmpp;

     }

     ColorSpinorField &tmp = *tmpp;

     ColorSpinorField &tmp2 = *tmp2p;

     ColorSpinorField &tmp3 = *tmp3p;


     // compute initial residual

     double r2 = 0.0;

     if (param.use_init_guess == QUDA_USE_INIT_GUESS_YES) {

       // Compute r = b - A * x

       mat(r, x, y, tmp3);

       r2 = blas::xmyNorm(b, r);

       if (b2 == 0) b2 = r2;

       // y contains the original guess.

       blas::copy(y, x);

     } else {

       if (&r != &b) blas::copy(r, b);

       r2 = b2;

       blas::zero(y);

     }


     if (param.deflate && param.maxiter > 1) {

       // Deflate and accumulate to solution vector

       eig_solve->deflate(y, r, evecs, evals, true);

       mat(r, y, x, tmp3);

       r2 = blas::xmyNorm(b, r);

     }


     cudaColorSpinorField Ap(x, csParam);


     cudaColorSpinorField *r_sloppy;

     if (param.precision_sloppy == x.Precision()) {

       r_sloppy = &r;

       minvrSloppy = minvr;

     } else {

       csParam.create = QUDA_COPY_FIELD_CREATE;

       r_sloppy = new cudaColorSpinorField(r, csParam);

       if (K) minvrSloppy = new cudaColorSpinorField(*minvr, csParam);

     }


     cudaColorSpinorField *x_sloppy;

     if (param.precision_sloppy == x.Precision() || !param.use_sloppy_partial_accumulator) {

       csParam.create = QUDA_REFERENCE_FIELD_CREATE;

       x_sloppy = &static_cast<cudaColorSpinorField &>(x);

     } else {

       csParam.create = QUDA_COPY_FIELD_CREATE;

       x_sloppy = new cudaColorSpinorField(x, csParam);

     }


     ColorSpinorField &xSloppy = *x_sloppy;

     ColorSpinorField &rSloppy = *r_sloppy;


     blas::zero(x);

     if (&x != &xSloppy) blas::zero(xSloppy);


     const bool use_heavy_quark_res = (param.residual_type & QUDA_HEAVY_QUARK_RESIDUAL) ? true : false;


     if (K) {

       csParam.create = QUDA_COPY_FIELD_CREATE;

       csParam.setPrecision(Kparam.precision);

       rPre = new cudaColorSpinorField(rSloppy, csParam);

       // Create minvrPre

       minvrPre = new cudaColorSpinorField(*rPre);

       (*K)(*minvrPre, *rPre);

       *minvrSloppy = *minvrPre;

       p = new cudaColorSpinorField(*minvrSloppy);

     } else {

       p = new cudaColorSpinorField(rSloppy);

     }


     profile.TPSTOP(QUDA_PROFILE_INIT);

     profile.TPSTART(QUDA_PROFILE_PREAMBLE);


     double stop = stopping(param.tol, b2, param.residual_type); // stopping condition of solver

     double heavy_quark_res = 0.0;                               // heavy quark residual

     if (use_heavy_quark_res) heavy_quark_res = sqrt(HeavyQuarkResidualNorm(x, r).z);


     double alpha = 0.0, beta = 0.0;

     double pAp;

     double rMinvr = 0;

     double rMinvr_old = 0.0;

     double r_new_Minvr_old = 0.0;

     double r2_old = 0;

     r2 = norm2(r);


     double rNorm = sqrt(r2);

     double r0Norm = rNorm;

     double maxrx = rNorm;

     double maxrr = rNorm;

     double maxr_deflate = rNorm; // The maximum residual since the last deflation

     double delta = param.delta;


     if (K) rMinvr = reDotProduct(rSloppy, *minvrSloppy);


     profile.TPSTOP(QUDA_PROFILE_PREAMBLE);

     profile.TPSTART(QUDA_PROFILE_COMPUTE);


     blas::flops = 0;


     PrintStats("PCG", k, r2, b2, heavy_quark_res);


     const int maxResIncrease = param.max_res_increase; // check if we reached the limit of our tolerance

     const int maxResIncreaseTotal = param.max_res_increase_total;


     int resIncrease = 0;

     int resIncreaseTotal = 0;


     while (!convergence(r2, heavy_quark_res, stop, param.tol_hq) && k < param.maxiter) {


       matSloppy(Ap, *p, tmp, tmp2);


       double sigma;

       pAp = reDotProduct(*p, Ap);


       alpha = (K) ? rMinvr / pAp : r2 / pAp;

       Complex cg_norm = axpyCGNorm(-alpha, Ap, rSloppy);

       // r --> r - alpha*A*p

       r2_old = r2;

       r2 = real(cg_norm);


       sigma = imag(cg_norm) >= 0.0 ? imag(cg_norm) : r2; // use r2 if (r_k+1, r_k-1 - r_k) breaks


       if (K) rMinvr_old = rMinvr;


       rNorm = sqrt(r2);

       if (rNorm > maxrx) maxrx = rNorm;

       if (rNorm > maxrr) maxrr = rNorm;


       int updateX = (rNorm < delta * r0Norm && r0Norm <= maxrx) ? 1 : 0;

       int updateR = ((rNorm < delta * maxrr && r0Norm <= maxrr) || updateX) ? 1 : 0;


       // force a reliable update if we are within target tolerance (only if doing reliable updates)

       if (convergence(r2, heavy_quark_res, stop, param.tol_hq) && delta >= param.tol) updateX = 1;


       if (!(updateR || updateX)) {


         if (K) {

           // can fuse these two kernels

           r_new_Minvr_old = reDotProduct(rSloppy, *minvrSloppy);

           *rPre = rSloppy;


           (*K)(*minvrPre, *rPre);


           // can fuse these two kernels

           *minvrSloppy = *minvrPre;

           rMinvr = reDotProduct(rSloppy, *minvrSloppy);


           beta = (rMinvr - r_new_Minvr_old) / rMinvr_old;

           axpyZpbx(alpha, *p, xSloppy, *minvrSloppy, beta);

         } else {

           beta = sigma / r2_old; // use the alternative beta computation

           axpyZpbx(alpha, *p, xSloppy, rSloppy, beta);

         }

       } else { // reliable update


         axpy(alpha, *p, xSloppy); // xSloppy += alpha*p

         xpy(xSloppy, y);          // y += x

         // Now compute r

         mat(r, y, x, tmp3); // x is just a temporary here

         r2 = xmyNorm(b, r);


         if (param.deflate && sqrt(r2) < maxr_deflate * param.tol_restart) {

           // Deflate and accumulate to solution vector

           eig_solve->deflate(y, r, evecs, evals, true);


           // Compute r_defl = RHS - A * LHS

           mat(r, y, x, tmp3);

           r2 = blas::xmyNorm(b, r);


           maxr_deflate = sqrt(r2);

         }


         copy(rSloppy, r); // copy r to rSloppy

         zero(xSloppy);


         // break-out check if we have reached the limit of the precision

         if (sqrt(r2) > r0Norm && updateX) {

           resIncrease++;

           resIncreaseTotal++;

           // reuse r0Norm for this

           warningQuda(

             "PCG: new reliable residual norm %e is greater than previous reliable residual norm %e (total #inc %i)",

             sqrt(r2), r0Norm, resIncreaseTotal);


           if (resIncrease > maxResIncrease or resIncreaseTotal > maxResIncreaseTotal) break;


         } else {

           resIncrease = 0;

         }


         rNorm = sqrt(r2);

         maxrr = rNorm;

         maxrx = rNorm;

         r0Norm = rNorm;

         ++rUpdate;


         if (K) {

           *rPre = rSloppy;

           (*K)(*minvrPre, *rPre);

           *minvrSloppy = *minvrPre;


           rMinvr = reDotProduct(rSloppy, *minvrSloppy);

           beta = rMinvr / rMinvr_old;


           xpay(*minvrSloppy, beta, *p); // p = minvrSloppy + beta*p

         } else {                        // standard CG - no preconditioning


           // explicitly restore the orthogonality of the gradient vector

           double rp = reDotProduct(rSloppy, *p) / (r2);

           axpy(-rp, rSloppy, *p);


           beta = r2 / r2_old;

           xpay(rSloppy, beta, *p);

         }

       }

       ++k;

       PrintStats("PCG", k, r2, b2, heavy_quark_res);

     }


     profile.TPSTOP(QUDA_PROFILE_COMPUTE);


     profile.TPSTART(QUDA_PROFILE_EPILOGUE);


     if (x.Precision() != param.precision_sloppy) copy(x, xSloppy);

     xpy(y, x); // x += y


     param.secs = profile.Last(QUDA_PROFILE_COMPUTE);

     double gflops = (blas::flops + mat.flops() + matSloppy.flops() + matPrecon.flops() + matEig.flops()) * 1e-9;

     param.gflops = gflops;

     param.iter += k;


     if (k == param.maxiter) warningQuda("Exceeded maximum iterations %d", param.maxiter);


     if (getVerbosity() >= QUDA_VERBOSE) printfQuda("PCG: Reliable updates = %d\n", rUpdate);


     // compute the true residual

     mat(r, x, y, tmp3);

     double true_res = xmyNorm(b, r);

     param.true_res = sqrt(true_res / b2);


     // reset the flops counters

     blas::flops = 0;

     mat.flops();

     matSloppy.flops();

     matPrecon.flops();

     matEig.flops();


     profile.TPSTOP(QUDA_PROFILE_EPILOGUE);

     profile.TPSTART(QUDA_PROFILE_FREE);


     if (tmpp) delete tmpp;

     if (!mat.isStaggered()) {

       if (tmp2p && tmpp != tmp2p) delete tmp2p;

       if (tmp3p && tmpp != tmp3p && param.precision != param.precision_sloppy) delete tmp3p;

     }


     if (K) { // These are only needed if preconditioning is used

       delete minvrPre;

       delete rPre;

       delete minvr;

       if (x.Precision() != param.precision_sloppy) delete minvrSloppy;

     }

     delete p;


     if (param.precision_sloppy != x.Precision()) {

       delete r_sloppy;

       if (param.use_sloppy_partial_accumulator) { delete x_sloppy; }

     }


     profile.TPSTOP(QUDA_PROFILE_FREE);

     return;

   }


 } // namespace quda

blas_quda.h

quda::CG
Conjugate-Gradient Solver.
Definition: invert_quda.h:639

quda::ColorSpinorField
Definition: color_spinor_field.h:379

quda::ColorSpinorField::Create
static ColorSpinorField * Create(const ColorSpinorParam &param)
Definition: color_spinor_field.cpp:714

quda::ColorSpinorParam
Definition: color_spinor_field.h:131

quda::DiracMatrix
Definition: dirac_quda.h:1892

quda::DiracMatrix::isStaggered
bool isStaggered() const
return if the operator is a staggered operator
Definition: dirac_quda.h:1935

quda::DiracMatrix::flops
unsigned long long flops() const
Definition: dirac_quda.h:1909

quda::EigenSolver::deflate
void deflate(std::vector< ColorSpinorField * > &sol, const std::vector< ColorSpinorField * > &src, const std::vector< ColorSpinorField * > &evecs, const std::vector< Complex > &evals, bool accumulate=false) const
Deflate a set of source vectors with a given eigenspace.
Definition: eigensolve_quda.cpp:752

quda::EigenSolver::computeEvals
void computeEvals(const DiracMatrix &mat, std::vector< ColorSpinorField * > &evecs, std::vector< Complex > &evals, int size)
Compute eigenvalues and their residiua.
Definition: eigensolve_quda.cpp:718

quda::LatticeField::Precision
QudaPrecision Precision() const
Definition: lattice_field.h:567

quda::MR
Definition: invert_quda.h:961

quda::PreconCG::~PreconCG
virtual ~PreconCG()
Definition: inv_pcg_quda.cpp:84

quda::PreconCG::operator()
void operator()(ColorSpinorField &out, ColorSpinorField &in)
Definition: inv_pcg_quda.cpp:94

quda::PreconCG::PreconCG
PreconCG(const DiracMatrix &mat, const DiracMatrix &matSloppy, const DiracMatrix &matPrecon, const DiracMatrix &matEig, SolverParam &param, TimeProfile &profile)
Definition: inv_pcg_quda.cpp:62

quda::SD
Definition: invert_quda.h:1147

quda::Solver
Definition: invert_quda.h:462

quda::Solver::deflate_compute
bool deflate_compute
Definition: invert_quda.h:475

quda::Solver::profile
TimeProfile & profile
Definition: invert_quda.h:471

quda::Solver::mat
const DiracMatrix & mat
Definition: invert_quda.h:465

quda::Solver::convergence
bool convergence(double r2, double hq2, double r2_tol, double hq_tol)
Definition: solver.cpp:328

quda::Solver::recompute_evals
bool recompute_evals
Definition: invert_quda.h:476

quda::Solver::evecs
std::vector< ColorSpinorField * > evecs
Definition: invert_quda.h:477

quda::Solver::destroyDeflationSpace
void destroyDeflationSpace()
Destroy the allocated deflation space.
Definition: solver.cpp:229

quda::Solver::matEig
const DiracMatrix & matEig
Definition: invert_quda.h:468

quda::Solver::param
SolverParam & param
Definition: invert_quda.h:470

quda::Solver::stopping
static double stopping(double tol, double b2, QudaResidualType residual_type)
Set the solver L2 stopping condition.
Definition: solver.cpp:311

quda::Solver::evals
std::vector< Complex > evals
Definition: invert_quda.h:478

quda::Solver::eig_solve
EigenSolver * eig_solve
Definition: invert_quda.h:473

quda::Solver::PrintStats
void PrintStats(const char *name, int k, double r2, double b2, double hq2)
Prints out the running statistics of the solver (requires a verbosity of QUDA_VERBOSE)
Definition: solver.cpp:373

quda::Solver::constructDeflationSpace
void constructDeflationSpace(const ColorSpinorField &meta, const DiracMatrix &mat)
Constructs the deflation space and eigensolver.
Definition: solver.cpp:168

quda::Solver::matPrecon
const DiracMatrix & matPrecon
Definition: invert_quda.h:467

quda::Solver::matSloppy
const DiracMatrix & matSloppy
Definition: invert_quda.h:466

quda::TimeProfile
Definition: timer.h:174

quda::TimeProfile::Last
double Last(QudaProfileType idx)
Definition: timer.h:254

quda::cudaColorSpinorField
Definition: color_spinor_field.h:682

color_spinor_field.h

mat
void mat(void *out, void **link, void *in, int dagger_bit, int mu, QudaPrecision sPrecision, QudaPrecision gPrecision)
Definition: covdev_reference.cpp:109

tmp
cudaColorSpinorField * tmp
Definition: covdev_test.cpp:34

dslash_quda.h

QUDA_USE_INIT_GUESS_YES
@ QUDA_USE_INIT_GUESS_YES
Definition: enum_quda.h:430

QUDA_VERBOSE
@ QUDA_VERBOSE
Definition: enum_quda.h:267

QUDA_HEAVY_QUARK_RESIDUAL
@ QUDA_HEAVY_QUARK_RESIDUAL
Definition: enum_quda.h:195

QUDA_INVALID_RESIDUAL
@ QUDA_INVALID_RESIDUAL
Definition: enum_quda.h:196

QUDA_L2_RELATIVE_RESIDUAL
@ QUDA_L2_RELATIVE_RESIDUAL
Definition: enum_quda.h:193

QUDA_MR_INVERTER
@ QUDA_MR_INVERTER
Definition: enum_quda.h:110

QUDA_PCG_INVERTER
@ QUDA_PCG_INVERTER
Definition: enum_quda.h:114

QUDA_CA_GCR_INVERTER
@ QUDA_CA_GCR_INVERTER
Definition: enum_quda.h:132

QUDA_SD_INVERTER
@ QUDA_SD_INVERTER
Definition: enum_quda.h:112

QUDA_CG_INVERTER
@ QUDA_CG_INVERTER
Definition: enum_quda.h:107

QUDA_INVALID_INVERTER
@ QUDA_INVALID_INVERTER
Definition: enum_quda.h:133

QUDA_PRESERVE_SOURCE_NO
@ QUDA_PRESERVE_SOURCE_NO
Definition: enum_quda.h:238

QUDA_PRESERVE_SOURCE_YES
@ QUDA_PRESERVE_SOURCE_YES
Definition: enum_quda.h:239

QUDA_INVALID_SCHWARZ
@ QUDA_INVALID_SCHWARZ
Definition: enum_quda.h:189

QUDA_ZERO_FIELD_CREATE
@ QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:361

QUDA_COPY_FIELD_CREATE
@ QUDA_COPY_FIELD_CREATE
Definition: enum_quda.h:362

QUDA_REFERENCE_FIELD_CREATE
@ QUDA_REFERENCE_FIELD_CREATE
Definition: enum_quda.h:363

QUDA_COMPUTE_NULL_VECTOR_NO
@ QUDA_COMPUTE_NULL_VECTOR_NO
Definition: enum_quda.h:441

invert_quda.h

quda::blas::axpyCGNorm
Complex axpyCGNorm(double a, ColorSpinorField &x, ColorSpinorField &y)

quda::blas::axpyZpbx
void axpyZpbx(double a, ColorSpinorField &x, ColorSpinorField &y, ColorSpinorField &z, double b)

quda::blas::HeavyQuarkResidualNorm
double3 HeavyQuarkResidualNorm(ColorSpinorField &x, ColorSpinorField &r)

quda::blas::xmyNorm
double xmyNorm(ColorSpinorField &x, ColorSpinorField &y)
Definition: blas_quda.h:79

quda::blas::flops
unsigned long long flops

quda::blas::xpay
void xpay(ColorSpinorField &x, double a, ColorSpinorField &y)
Definition: blas_quda.h:45

quda::blas::zero
void zero(ColorSpinorField &a)

quda::blas::norm2
double norm2(const ColorSpinorField &a)

quda::blas::reDotProduct
double reDotProduct(ColorSpinorField &x, ColorSpinorField &y)

quda::blas::axpy
void axpy(double a, ColorSpinorField &x, ColorSpinorField &y)
Definition: blas_quda.h:43

quda::blas::xpy
void xpy(ColorSpinorField &x, ColorSpinorField &y)
Definition: blas_quda.h:41

quda::blas::copy
void copy(ColorSpinorField &dst, const ColorSpinorField &src)
Definition: blas_quda.h:24

quda::device::profile::stop
void stop()
Stop profiling.
Definition: device.cpp:228

quda
Definition: blas_lapack.h:24

quda::norm2
double norm2(const CloverField &a, bool inverse=false)
Definition: clover_field.cpp:485

quda::zero
__device__ __host__ void zero(double &a)
Definition: float_vector.h:318

quda::Complex
std::complex< double > Complex
Definition: quda_internal.h:86

quda::sqrt
__host__ __device__ ValueType sqrt(ValueType x)
Definition: complex_quda.h:120

quda::QUDA_PROFILE_INIT
@ QUDA_PROFILE_INIT
Definition: timer.h:106

quda::QUDA_PROFILE_EPILOGUE
@ QUDA_PROFILE_EPILOGUE
Definition: timer.h:110

quda::QUDA_PROFILE_COMPUTE
@ QUDA_PROFILE_COMPUTE
Definition: timer.h:108

quda::QUDA_PROFILE_FREE
@ QUDA_PROFILE_FREE
Definition: timer.h:111

quda::QUDA_PROFILE_PREAMBLE
@ QUDA_PROFILE_PREAMBLE
Definition: timer.h:107

quda::copy
__host__ __device__ std::enable_if<!isFixed< T1 >::value &&!isFixed< T2 >::value, void >::type copy(T1 &a, const T2 &b)
Copy function which is trival between floating point types. When converting to an integer type,...
Definition: convert.h:64

csParam
ColorSpinorParam csParam
Definition: pack_test.cpp:25

param
QudaGaugeParam param
Definition: pack_test.cpp:18

updateR
void updateR()
update the radius for halos.
Definition: interface_quda.cpp:531

quda_internal.h

quda::SolverParam
Definition: invert_quda.h:17

quda::SolverParam::iter
int iter
Definition: invert_quda.h:133

quda::SolverParam::precision
QudaPrecision precision
Definition: invert_quda.h:136

quda::SolverParam::compute_null_vector
QudaComputeNullVector compute_null_vector
Definition: invert_quda.h:61

quda::SolverParam::true_res
double true_res
Definition: invert_quda.h:124

quda::SolverParam::use_sloppy_partial_accumulator
bool use_sloppy_partial_accumulator
Definition: invert_quda.h:70

quda::SolverParam::max_res_increase_total
int max_res_increase_total
Definition: invert_quda.h:90

quda::SolverParam::residual_type
QudaResidualType residual_type
Definition: invert_quda.h:49

quda::SolverParam::precision_sloppy
QudaPrecision precision_sloppy
Definition: invert_quda.h:139

quda::SolverParam::deflate
bool deflate
Definition: invert_quda.h:52

quda::SolverParam::true_res_hq
double true_res_hq
Definition: invert_quda.h:127

quda::SolverParam::max_res_increase
int max_res_increase
Definition: invert_quda.h:85

quda::SolverParam::use_init_guess
QudaUseInitGuess use_init_guess
Definition: invert_quda.h:58

quda::SolverParam::secs
double secs
Definition: invert_quda.h:217

quda::SolverParam::maxiter
int maxiter
Definition: invert_quda.h:130

quda::SolverParam::tol_hq
double tol_hq
Definition: invert_quda.h:115

quda::SolverParam::gflops
double gflops
Definition: invert_quda.h:220

quda::SolverParam::tol_restart
double tol_restart
Definition: invert_quda.h:112

quda::SolverParam::tol
double tol
Definition: invert_quda.h:109

quda::SolverParam::inv_type_precondition
QudaInverterType inv_type_precondition
Definition: invert_quda.h:28

quda::SolverParam::delta
double delta
Definition: invert_quda.h:64

util_quda.h

printfQuda
#define printfQuda(...)
Definition: util_quda.h:114

getVerbosity
QudaVerbosity getVerbosity()
Definition: util_quda.cpp:21

warningQuda
#define warningQuda(...)
Definition: util_quda.h:132

errorQuda
#define errorQuda(...)
Definition: util_quda.h:120