quda-ref/v1.0.0/inv__ca__gcr_8cpp_source.html

 #include <invert_quda.h>
 #include <blas_quda.h>
 #include <Eigen/Dense>

 namespace quda {

   CAGCR::CAGCR(DiracMatrix &mat, DiracMatrix &matSloppy, SolverParam &param, TimeProfile &profile)
     : Solver(param, profile), mat(mat), matSloppy(matSloppy), init(false),
       basis(param.ca_basis), alpha(nullptr), rp(nullptr), tmpp(nullptr), tmp_sloppy(nullptr) { }

   CAGCR::~CAGCR() {
     if (!param.is_preconditioner) profile.TPSTART(QUDA_PROFILE_FREE);

     if (init) {
       if (alpha) delete []alpha;
       bool use_source = (param.preserve_source == QUDA_PRESERVE_SOURCE_NO &&
                          param.precision == param.precision_sloppy &&
                          param.use_init_guess == QUDA_USE_INIT_GUESS_NO);
       if (basis == QUDA_POWER_BASIS) {
         for (int i=0; i<param.Nkrylov+1; i++) if (i>0 || !use_source) delete p[i];
       } else {
         for (int i=0; i<param.Nkrylov; i++) if (i>0 || !use_source) delete p[i];
         for (int i=0; i<param.Nkrylov; i++) delete q[i];
       }
       if (tmp_sloppy) delete tmp_sloppy;
       if (tmpp) delete tmpp;
       if (rp) delete rp;
     }

     if (deflate_init) {
       for (auto veci : param.evecs)
         if (veci) delete veci;
       delete defl_tmp1[0];
       delete defl_tmp2[0];
     }

     if (!param.is_preconditioner) profile.TPSTOP(QUDA_PROFILE_FREE);
   }

   void CAGCR::create(ColorSpinorField &b)
   {
     if (!init) {
       if (!param.is_preconditioner) {
         blas::flops = 0;
         profile.TPSTART(QUDA_PROFILE_INIT);
       }

       alpha = new Complex[param.Nkrylov];

       bool mixed = param.precision != param.precision_sloppy;
       bool use_source = (param.preserve_source == QUDA_PRESERVE_SOURCE_NO && !mixed &&
                          param.use_init_guess == QUDA_USE_INIT_GUESS_NO);

       ColorSpinorParam csParam(b);
       csParam.create = QUDA_NULL_FIELD_CREATE;

       // Source needs to be preserved if we're computing the true residual
       rp = (mixed && !use_source) ? ColorSpinorField::Create(csParam) : nullptr;
       tmpp = ColorSpinorField::Create(csParam);

       // now allocate sloppy fields
       csParam.setPrecision(param.precision_sloppy);

       if (basis != QUDA_POWER_BASIS) {
         warningQuda("CA-GCR does not support any basis besides QUDA_POWER_BASIS. Switching to QUDA_POWER_BASIS...\n");
         basis = QUDA_POWER_BASIS;
       }

       if (basis == QUDA_POWER_BASIS) {
         // in power basis q[k] = p[k+1], so we don't need a separate q array
         p.resize(param.Nkrylov+1);
         q.resize(param.Nkrylov);
         for (int i=0; i<param.Nkrylov+1; i++) {
           p[i] = (i==0 && use_source) ? &b : ColorSpinorField::Create(csParam);
           if (i>0) q[i-1] = p[i];
         }
       } else {
         p.resize(param.Nkrylov);
         q.resize(param.Nkrylov);
         for (int i=0; i<param.Nkrylov; i++) {
           p[i] = (i==0 && use_source) ? &b : ColorSpinorField::Create(csParam);
           q[i] = ColorSpinorField::Create(csParam);
         }
       }

       // Once the GCR operator is called, we are able to construct an appropriate
       // Krylov space for deflation
       if (param.deflate && !deflate_init) { constructDeflationSpace(b, DiracMdagM(mat.Expose()), true); }

       //sloppy temporary for mat-vec
       tmp_sloppy = mixed ? ColorSpinorField::Create(csParam) : nullptr;

       if (!param.is_preconditioner) profile.TPSTOP(QUDA_PROFILE_INIT);

       init = true;
     } // init
   }

   void CAGCR::solve(Complex *psi_, std::vector<ColorSpinorField*> &q, ColorSpinorField &b)
   {
     using namespace Eigen;
     typedef Matrix<Complex, Dynamic, Dynamic> matrix;
     typedef Matrix<Complex, Dynamic, 1> vector;

     const int N = q.size();
     vector phi(N), psi(N);
     matrix A(N,N);

 #if 1
     // only a single reduction but requires using the full dot product
     // compute rhs vector phi = Q* b = (q_i, b)
     std::vector<ColorSpinorField*> Q;
     for (int i=0; i<N; i++) Q.push_back(q[i]);
     Q.push_back(&b);

     // Construct the matrix Q* Q = (A P)* (A P) = (q_i, q_j) = (A p_i, A p_j)
     Complex *A_ = new Complex[N*(N+1)];
     blas::cDotProduct(A_, q, Q);
     for (int i=0; i<N; i++) {
       phi(i) = A_[i*(N+1)+N];
       for (int j=0; j<N; j++) {
         A(i,j) = A_[i*(N+1)+j];
       }
     }
     delete[] A_;
 #else
     // two reductions but uses the Hermitian block dot product
     // compute rhs vector phi = Q* b = (q_i, b)
     std::vector<ColorSpinorField*> B;
     B.push_back(&b);
     Complex *phi_ = new Complex[N];
     blas::cDotProduct(phi_,q, B);
     for (int i=0; i<N; i++) phi(i) = phi_[i];
     delete phi_;

     // Construct the matrix Q* Q = (A P)* (A P) = (q_i, q_j) = (A p_i, A p_j)
     Complex *A_ = new Complex[N*N];
     blas::hDotProduct(A_, q, q);
     for (int i=0; i<N; i++)
       for (int j=0; j<N; j++)
         A(i,j) = A_[i*N+j];
     delete[] A_;
 #endif

     if (!param.is_preconditioner) {
       profile.TPSTOP(QUDA_PROFILE_COMPUTE);
       param.secs += profile.Last(QUDA_PROFILE_COMPUTE);
       profile.TPSTART(QUDA_PROFILE_EIGEN);
     }

     // use Cholesky LDL since this seems plenty stable
     LDLT<matrix> cholesky(A);
     psi = cholesky.solve(phi);

     for (int i=0; i<N; i++) psi_[i] = psi(i);

     if (!param.is_preconditioner) {
       profile.TPSTOP(QUDA_PROFILE_EIGEN);
       param.secs += profile.Last(QUDA_PROFILE_EIGEN);
       profile.TPSTART(QUDA_PROFILE_COMPUTE);
     }

   }

   /*
     The main CA-GCR algorithm, which consists of three main steps:
     1. Build basis vectors q_k = A p_k for k = 1..Nkrlylov
     2. Minimize the residual in this basis
     3. Update solution and residual vectors
     4. (Optional) restart if convergence or maxiter not reached
   */
   void CAGCR::operator()(ColorSpinorField &x, ColorSpinorField &b)
   {
     const int nKrylov = param.Nkrylov;

     if (checkPrecision(x,b) != param.precision) errorQuda("Precision mismatch %d %d", checkPrecision(x,b), param.precision);
     if (param.return_residual && param.preserve_source == QUDA_PRESERVE_SOURCE_YES) errorQuda("Cannot preserve source and return the residual");

     if (param.maxiter == 0 || nKrylov == 0) {
       if (param.use_init_guess == QUDA_USE_INIT_GUESS_NO) blas::zero(x);
       return;
     }

     create(b);

     ColorSpinorField &r = rp ? *rp : *p[0];
     ColorSpinorField &tmp = *tmpp;
     ColorSpinorField &tmpSloppy = tmp_sloppy ? *tmp_sloppy : tmp;

     if (!param.is_preconditioner) profile.TPSTART(QUDA_PROFILE_PREAMBLE);

     // compute b2, but only if we need to
     bool fixed_iteration = param.sloppy_converge && nKrylov==param.maxiter && !param.compute_true_res;
     double b2 = !fixed_iteration ? blas::norm2(b) : 1.0;
     double r2 = 0.0; // if zero source then we will exit immediately doing no work

     // compute intitial residual depending on whether we have an initial guess or not
     if (param.use_init_guess == QUDA_USE_INIT_GUESS_YES) {
       mat(r, x, tmp);
       //r = b - Ax0
       if (!fixed_iteration) {
         r2 = blas::xmyNorm(b, r);
       } else {
         blas::xpay(b, -1.0, r);
         r2 = b2; // dummy setting
       }
     } else {
       r2 = b2;
       blas::copy(r, b);
       blas::zero(x);
     }

     if (param.deflate == true) {
       std::vector<ColorSpinorField *> rhs;
       // Use residual from supplied guess r, or original
       // rhs b. use `defl_tmp2` as a temp.
       blas::copy(*defl_tmp2[0], r);
       rhs.push_back(defl_tmp2[0]);

       // Deflate: Hardcoded to SVD
       eig_solve->deflateSVD(defl_tmp1, rhs, param.evecs, param.evals);

       // Compute r_defl = RHS - A * LHS
       mat(r, *defl_tmp1[0]);
       r2 = blas::xmyNorm(*rhs[0], r);

       // defl_tmp must be added to the solution at the end
       blas::axpy(1.0, *defl_tmp1[0], x);
     }

     // Check to see that we're not trying to invert on a zero-field source
     if (b2 == 0) {
       if (param.compute_null_vector == QUDA_COMPUTE_NULL_VECTOR_NO) {
         warningQuda("inverting on zero-field source\n");
         x = b;
         param.true_res = 0.0;
         param.true_res_hq = 0.0;
         return;
             } else {
         b2 = r2;
       }
     }

     double stop = !fixed_iteration ? stopping(param.tol, b2, param.residual_type) : 0.0; // stopping condition of solver

     const bool use_heavy_quark_res = (param.residual_type & QUDA_HEAVY_QUARK_RESIDUAL) ? true : false;

     // this parameter determines how many consective reliable update
     // reisudal increases we tolerate before terminating the solver,
     // i.e., how long do we want to keep trying to converge
     const int maxResIncrease = param.max_res_increase; // check if we reached the limit of our tolerance
     const int maxResIncreaseTotal = param.max_res_increase_total;

     double heavy_quark_res = 0.0; // heavy quark residual
     if(use_heavy_quark_res) heavy_quark_res = sqrt(blas::HeavyQuarkResidualNorm(x,r).z);

     int resIncrease = 0;
     int resIncreaseTotal = 0;

     if (!param.is_preconditioner) {
       blas::flops = 0;
       profile.TPSTOP(QUDA_PROFILE_PREAMBLE);
       profile.TPSTART(QUDA_PROFILE_COMPUTE);
     }
     int total_iter = 0;
     int restart = 0;
     double r2_old = r2;
     bool l2_converge = false;

     blas::copy(*p[0], r); // no op if uni-precision

     PrintStats("CA-GCR", total_iter, r2, b2, heavy_quark_res);
     while ( !convergence(r2, heavy_quark_res, stop, param.tol_hq) && total_iter < param.maxiter) {

       // build up a space of size nKrylov
       for (int k=0; k<nKrylov; k++) {
         matSloppy(*q[k], *p[k], tmpSloppy);
         if (k<nKrylov-1 && basis != QUDA_POWER_BASIS) blas::copy(*p[k+1], *q[k]);
       }

       solve(alpha, q, *p[0]);

       // update the solution vector
       std::vector<ColorSpinorField*> X;
       X.push_back(&x);
       // need to make sure P is only length nKrylov
       std::vector<ColorSpinorField*> P;
       for (int i=0; i<nKrylov; i++) P.push_back(p[i]);
       blas::caxpy(alpha, P, X);

       // no need to compute residual vector if not returning
       // residual vector and only doing a single fixed iteration
       if (!fixed_iteration || param.return_residual) {
         // update the residual vector
         std::vector<ColorSpinorField*> R;
         R.push_back(&r);
         for (int i=0; i<nKrylov; i++) alpha[i] = -alpha[i];
         blas::caxpy(alpha, q, R);
       }

       total_iter+=nKrylov;
       if ( !fixed_iteration || getVerbosity() >= QUDA_DEBUG_VERBOSE) {
         // only compute the residual norm if we need to
         r2 = blas::norm2(r);
       }

       PrintStats("CA-GCR", total_iter, r2, b2, heavy_quark_res);

       // update since nKrylov or maxiter reached, converged or reliable update required
       // note that the heavy quark residual will by definition only be checked every nKrylov steps
       if (total_iter>=param.maxiter || (r2 < stop && !l2_converge) || sqrt(r2/r2_old) < param.delta) {

         if ( (r2 < stop || total_iter>=param.maxiter) && param.sloppy_converge) break;
         mat(r, x, tmp);
         r2 = blas::xmyNorm(b, r);
         if (use_heavy_quark_res) heavy_quark_res = sqrt(blas::HeavyQuarkResidualNorm(x, r).z);

         // break-out check if we have reached the limit of the precision
         if (r2 > r2_old) {
           resIncrease++;
           resIncreaseTotal++;
           warningQuda("CA-GCR: new reliable residual norm %e is greater than previous reliable residual norm %e (total #inc %i)",
           sqrt(r2), sqrt(r2_old), resIncreaseTotal);
           if (resIncrease > maxResIncrease or resIncreaseTotal > maxResIncreaseTotal) {
             warningQuda("CA-GCR: solver exiting due to too many true residual norm increases");
             break;
           }
         } else {
           resIncrease = 0;
         }

         r2_old = r2;
       }

       // No matter what, if we haven't converged, we do a restart.
       if ( !convergence(r2, heavy_quark_res, stop, param.tol_hq) ) {
         restart++; // restarting if residual is still too great

         PrintStats("CA-GCR (restart)", restart, r2, b2, heavy_quark_res);
         blas::copy(*p[0],r); // no-op if uni-precision

         r2_old = r2;

         // prevent ending the Krylov space prematurely if other convergence criteria not met
         if (r2 < stop) l2_converge = true;
       }

     }

     if (total_iter>param.maxiter && getVerbosity() >= QUDA_SUMMARIZE)
       warningQuda("Exceeded maximum iterations %d", param.maxiter);

     if (getVerbosity() >= QUDA_VERBOSE) printfQuda("CA-GCR: number of restarts = %d\n", restart);

     if (param.compute_true_res) {
       // Calculate the true residual
       mat(r, x, tmp);
       double true_res = blas::xmyNorm(b, r);
       param.true_res = sqrt(true_res / b2);
       param.true_res_hq = (param.residual_type & QUDA_HEAVY_QUARK_RESIDUAL) ? sqrt(blas::HeavyQuarkResidualNorm(x,r).z) : 0.0;
       if (param.return_residual) blas::copy(b, r);
     } else {
       if (param.return_residual) blas::copy(b, r);
     }

     if (!param.is_preconditioner) {
       qudaDeviceSynchronize(); // ensure solver is complete before ending timing
       profile.TPSTOP(QUDA_PROFILE_COMPUTE);
       profile.TPSTART(QUDA_PROFILE_EPILOGUE);
       param.secs += profile.Last(QUDA_PROFILE_COMPUTE);

       // store flops and reset counters
       double gflops = (blas::flops + mat.flops() + matSloppy.flops())*1e-9;

       param.gflops += gflops;
       param.iter += total_iter;

       // reset the flops counters
       blas::flops = 0;
       mat.flops();
       matSloppy.flops();

       profile.TPSTOP(QUDA_PROFILE_EPILOGUE);
     }

     PrintSummary("CA-GCR", total_iter, r2, b2, stop, param.tol_hq);
   }

 } // namespace quda
invert_quda.h

quda::CAGCR::alpha
Complex * alpha
Definition: invert_quda.h:1001

quda::SolverParam::compute_true_res
bool compute_true_res
Definition: invert_quda.h:124

QUDA_VERBOSE
Definition: enum_quda.h:265

quda::SolverParam::return_residual
bool return_residual
Definition: invert_quda.h:158

quda::ColorSpinorParam::setPrecision
void setPrecision(QudaPrecision precision, QudaPrecision ghost_precision=QUDA_INVALID_PRECISION, bool force_native=false)
Definition: color_spinor_field.h:231

quda::CAGCR::create
void create(ColorSpinorField &b)
Initiate the fields needed by the solver.
Definition: inv_ca_gcr.cpp:40

quda::SolverParam::delta
double delta
Definition: invert_quda.h:70

quda::ColorSpinorField
Definition: color_spinor_field.h:311

QUDA_PRESERVE_SOURCE_YES
Definition: enum_quda.h:237

getVerbosity
QudaVerbosity getVerbosity()
Definition: util_quda.cpp:21

quda::QUDA_PROFILE_FREE
Definition: timer.h:111

checkPrecision
#define checkPrecision(...)
Definition: lattice_field.h:695

errorQuda
#define errorQuda(...)
Definition: util_quda.h:121

quda::blas::norm2
double norm2(const ColorSpinorField &a)
Definition: reduce_quda.cu:721

quda::SolverParam::secs
double secs
Definition: invert_quda.h:220

quda::SolverParam::true_res_hq
double true_res_hq
Definition: invert_quda.h:133

quda::sqrt
__host__ __device__ ValueType sqrt(ValueType x)
Definition: complex_quda.h:120

QUDA_COMPUTE_NULL_VECTOR_NO
Definition: enum_quda.h:440

quda::blas::cDotProduct
Complex cDotProduct(ColorSpinorField &, ColorSpinorField &)
Definition: reduce_quda.cu:764

quda::Solver::PrintStats
void PrintStats(const char *name, int k, double r2, double b2, double hq2)
Prints out the running statistics of the solver (requires a verbosity of QUDA_VERBOSE) ...
Definition: solver.cpp:256

QUDA_SUMMARIZE
Definition: enum_quda.h:264

quda::CAGCR::CAGCR
CAGCR(DiracMatrix &mat, DiracMatrix &matSloppy, SolverParam &param, TimeProfile &profile)
Definition: inv_ca_gcr.cpp:7

tmp
cudaColorSpinorField * tmp
Definition: covdev_test.cpp:44

quda::ColorSpinorField::Create
static ColorSpinorField * Create(const ColorSpinorParam &param)
Definition: color_spinor_field.cpp:752

quda::Solver::convergence
bool convergence(double r2, double hq2, double r2_tol, double hq_tol)
Definition: solver.cpp:223

quda::CAGCR::mat
const DiracMatrix & mat
Definition: invert_quda.h:993

QUDA_NULL_FIELD_CREATE
Definition: enum_quda.h:359

quda::Solver::profile
TimeProfile & profile
Definition: invert_quda.h:464

R
static int R[4]
Definition: interface_quda.cpp:84

quda::blas::copy
void copy(ColorSpinorField &dst, const ColorSpinorField &src)
Definition: copy_quda.cu:355

quda::blas::xmyNorm
double xmyNorm(ColorSpinorField &x, ColorSpinorField &y)
Definition: blas_quda.h:75

quda::SolverParam::preserve_source
QudaPreserveSource preserve_source
Definition: invert_quda.h:154

quda::SolverParam::iter
int iter
Definition: invert_quda.h:139

quda::SolverParam::max_res_increase_total
int max_res_increase_total
Definition: invert_quda.h:96

quda::CAGCR::~CAGCR
virtual ~CAGCR()
Definition: inv_ca_gcr.cpp:11

quda::Solver::defl_tmp1
std::vector< ColorSpinorField * > defl_tmp1
Definition: invert_quda.h:547

QUDA_POWER_BASIS
Definition: enum_quda.h:195

quda
Definition: blas_cublas.h:5

quda::blas::xpay
void xpay(ColorSpinorField &x, double a, ColorSpinorField &y)
Definition: blas_quda.h:37

quda::CAGCR::solve
void solve(Complex *psi_, std::vector< ColorSpinorField *> &q, ColorSpinorField &b)
Solve the equation A p_k psi_k = q_k psi_k = b by minimizing the least square residual using Eigen&#39;s ...
Definition: inv_ca_gcr.cpp:99

Eigen

param
QudaGaugeParam param
Definition: pack_test.cpp:17

quda::CAGCR::rp
ColorSpinorField * rp
Definition: invert_quda.h:1003

quda::Solver::defl_tmp2
std::vector< ColorSpinorField * > defl_tmp2
Definition: invert_quda.h:548

quda::SolverParam::compute_null_vector
QudaComputeNullVector compute_null_vector
Definition: invert_quda.h:67

quda::EigenSolver::deflateSVD
void deflateSVD(std::vector< ColorSpinorField *> vec_defl, std::vector< ColorSpinorField *> vec, std::vector< ColorSpinorField *> evecs, std::vector< Complex > evals)
Deflate vector with both left and Right singular vectors.
Definition: eigensolve_quda.cpp:309

quda::SolverParam::sloppy_converge
bool sloppy_converge
Definition: invert_quda.h:127

quda::TimeProfile::Last
double Last(QudaProfileType idx)
Definition: timer.h:251

qudaDeviceSynchronize
#define qudaDeviceSynchronize()
Definition: quda_cuda_api.h:145

QUDA_USE_INIT_GUESS_YES
Definition: enum_quda.h:429

quda::SolverParam::gflops
double gflops
Definition: invert_quda.h:223

quda::SolverParam::residual_type
QudaResidualType residual_type
Definition: invert_quda.h:49

QUDA_PRESERVE_SOURCE_NO
Definition: enum_quda.h:236

quda::Solver::stopping
static double stopping(double tol, double b2, QudaResidualType residual_type)
Set the solver L2 stopping condition.
Definition: solver.cpp:206

quda::QUDA_PROFILE_EPILOGUE
Definition: timer.h:110

quda::SolverParam::maxiter
int maxiter
Definition: invert_quda.h:136

csParam
ColorSpinorParam csParam
Definition: pack_test.cpp:24

quda::blas::axpy
void axpy(double a, ColorSpinorField &x, ColorSpinorField &y)
Definition: blas_quda.h:35

quda::QUDA_PROFILE_COMPUTE
Definition: timer.h:108

warningQuda
#define warningQuda(...)
Definition: util_quda.h:133

quda::QUDA_PROFILE_EIGEN
Definition: timer.h:114

quda::SolverParam::is_preconditioner
bool is_preconditioner
verbosity to use for preconditioner
Definition: invert_quda.h:241

quda::SolverParam::tol_hq
double tol_hq
Definition: invert_quda.h:121

quda::CAGCR::q
std::vector< ColorSpinorField * > q
Definition: invert_quda.h:1008

quda::Solver::constructDeflationSpace
void constructDeflationSpace(const ColorSpinorField &meta, const DiracMatrix &mat, bool svd)
Constructs the deflation space.
Definition: solver.cpp:159

quda::blas::HeavyQuarkResidualNorm
double3 HeavyQuarkResidualNorm(ColorSpinorField &x, ColorSpinorField &r)
Definition: reduce_quda.cu:809

quda::QUDA_PROFILE_PREAMBLE
Definition: timer.h:107

X
int X[4]
Definition: covdev_test.cpp:70

quda::Complex
std::complex< double > Complex
Definition: quda_internal.h:46

quda::Solver::eig_solve
EigenSolver * eig_solve
Definition: invert_quda.h:545

quda::SolverParam::evals
std::vector< Complex > evals
Definition: invert_quda.h:61

quda::cublas::init
void init()
Create the CUBLAS context.
Definition: blas_cublas.cu:31

QUDA_HEAVY_QUARK_RESIDUAL
Definition: enum_quda.h:189

quda::SolverParam::max_res_increase
int max_res_increase
Definition: invert_quda.h:91

quda::blas::caxpy
void caxpy(const Complex &a, ColorSpinorField &x, ColorSpinorField &y)
Definition: blas_quda.cu:512

quda::CAGCR::basis
QudaCABasis basis
Definition: invert_quda.h:999

quda::CAGCR::tmp_sloppy
ColorSpinorField * tmp_sloppy
Definition: invert_quda.h:1005

quda::blas::zero
void zero(ColorSpinorField &a)
Definition: blas_quda.cu:472

quda::CAGCR::init
bool init
Definition: invert_quda.h:995

quda::SolverParam::Nkrylov
int Nkrylov
Definition: invert_quda.h:193

quda::SolverParam::evecs
std::vector< ColorSpinorField * > evecs
Definition: invert_quda.h:58

blas_quda.h

quda::SolverParam::precision
QudaPrecision precision
Definition: invert_quda.h:142

quda::QUDA_PROFILE_INIT
Definition: timer.h:106

quda::SolverParam::true_res
double true_res
Definition: invert_quda.h:130

quda::Solver
Definition: invert_quda.h:460

QUDA_DEBUG_VERBOSE
Definition: enum_quda.h:266

quda::ColorSpinorParam
Definition: color_spinor_field.h:80

QUDA_USE_INIT_GUESS_NO
Definition: enum_quda.h:428

quda::CAGCR::p
std::vector< ColorSpinorField * > p
Definition: invert_quda.h:1007

quda::Solver::param
SolverParam & param
Definition: invert_quda.h:463

quda::blas::hDotProduct
void hDotProduct(Complex *result, std::vector< ColorSpinorField *> &a, std::vector< ColorSpinorField *> &b)
Computes the matrix of inner products between the vector set a and the vector set b...
Definition: multi_reduce_quda.cu:1056

quda::CAGCR::matSloppy
const DiracMatrix & matSloppy
Definition: invert_quda.h:994

quda::DiracMdagM
Definition: dirac_quda.h:1181

quda::DiracMatrix::flops
unsigned long long flops() const
Definition: dirac_quda.h:1119

ca_basis
QudaCABasis ca_basis
Definition: test_util.cpp:1631

quda::DiracMatrix
Definition: dirac_quda.h:1100

printfQuda
#define printfQuda(...)
Definition: util_quda.h:115

quda::blas::flops
unsigned long long flops
Definition: blas_quda.cu:22

quda::TimeProfile
Definition: timer.h:171

quda::SolverParam::deflate
bool deflate
Definition: invert_quda.h:52

quda::CAGCR::tmpp
ColorSpinorField * tmpp
Definition: invert_quda.h:1004

quda::SolverParam::use_init_guess
QudaUseInitGuess use_init_guess
Definition: invert_quda.h:64

quda::CAGCR::operator()
void operator()(ColorSpinorField &out, ColorSpinorField &in)
Definition: inv_ca_gcr.cpp:172

quda::SolverParam::precision_sloppy
QudaPrecision precision_sloppy
Definition: invert_quda.h:145

quda::Solver::PrintSummary
void PrintSummary(const char *name, int k, double r2, double b2, double r2_tol, double hq_tol)
Prints out the summary of the solver convergence (requires a verbosity of QUDA_SUMMARIZE). Assumes SolverParam.true_res and SolverParam.true_res_hq has been set.
Definition: solver.cpp:270

quda::ColorSpinorParam::create
QudaFieldCreate create
Definition: color_spinor_field.h:95

quda::SolverParam
Definition: invert_quda.h:17

mat
void mat(void *out, void **link, void *in, int dagger_bit, int mu, QudaPrecision sPrecision, QudaPrecision gPrecision)
Definition: covdev_reference.cpp:112

quda::Solver::deflate_init
bool deflate_init
Definition: invert_quda.h:546

quda::SolverParam::tol
double tol
Definition: invert_quda.h:115

quda::Matrix
Definition: quda_matrix.h:64

quda::DiracMatrix::Expose
const Dirac * Expose() const
Definition: dirac_quda.h:1135