v0.9.0/doc/inv__gcr__quda_8cpp_source.html

 #include <stdio.h>
 #include <stdlib.h>
 #include <math.h>

 #include <complex>

 #include <quda_internal.h>
 #include <blas_quda.h>
 #include <dslash_quda.h>
 #include <invert_quda.h>
 #include <util_quda.h>
 #include <color_spinor_field.h>

 #include <sys/time.h>

 namespace quda {

   double timeInterval(struct timeval start, struct timeval end) {
     long ds = end.tv_sec - start.tv_sec;
     long dus = end.tv_usec - start.tv_usec;
     return ds + 0.000001*dus;
   }

   // set the required parameters for the inner solver
   void fillInnerSolveParam(SolverParam &inner, const SolverParam &outer) {
     inner.tol = outer.tol_precondition;
     inner.maxiter = outer.maxiter_precondition;
     inner.delta = 1e-20; // no reliable updates within the inner solver

     inner.precision = outer.precision_precondition; // preconditioners are uni-precision solvers
     inner.precision_sloppy = outer.precision_precondition;

     inner.iter = 0;
     inner.gflops = 0;
     inner.secs = 0;

     inner.inv_type_precondition = QUDA_INVALID_INVERTER;
     inner.is_preconditioner = true; // tell inner solver it is a preconditioner

     inner.global_reduction = false;

     inner.use_init_guess = QUDA_USE_INIT_GUESS_NO;

     if (outer.inv_type == QUDA_GCR_INVERTER && outer.precision_sloppy != outer.precision_precondition)
       inner.preserve_source = QUDA_PRESERVE_SOURCE_NO;
     else inner.preserve_source = QUDA_PRESERVE_SOURCE_YES;

   }

   void computeBeta(Complex **beta, std::vector<ColorSpinorField*> Ap, int i, int N, int k) {
     Complex *Beta = new Complex[N];
     std::vector<ColorSpinorField*> a(N), b(1);
     for (int j=0; j<N; j++) {
       a[j] = Ap[i+j];
       Beta[j] = 0;
     }
     b[0] = Ap[k];
     blas::cDotProduct(Beta, a, b); // vectorized dot product
 #if 0
     for (int j=0; j<N; j++) {
       printfQuda("%d/%d vectorized %e %e, regular %e %e\n", j+1, N, Beta[j].real(), Beta[j].imag(),
      blas::cDotProduct(*a[j], *b[j]).real(), blas::cDotProduct(*a[j], *b[j]).imag());
       }
 #endif

     for (int j=0; j<N; j++) beta[i+j][k] = Beta[j];
     delete [] Beta;
   }

   void updateAp(Complex **beta, std::vector<ColorSpinorField*> Ap, int begin, int size, int k) {

     Complex *beta_ = new Complex[size];
     for (int i=0; i<size; i++) beta_[i] = -beta[i+begin][k];

     std::vector<ColorSpinorField*> Ap_(Ap.begin() + begin, Ap.begin() + begin + size);
     std::vector<ColorSpinorField*> Apk(Ap.begin() + k, Ap.begin() + k + 1);

     blas::caxpy(beta_, Ap_, Apk);

     delete []beta_;
   }

   void orthoDir(Complex **beta, std::vector<ColorSpinorField*> Ap, int k, int pipeline) {

     switch (pipeline) {
     case 0: // no kernel fusion
       for (int i=0; i<k; i++) { // 5 (k-1) memory transactions here
   beta[i][k] = blas::cDotProduct(*(Ap[i]), *(Ap[k]));
   blas::caxpy(-beta[i][k], *Ap[i], *Ap[k]);
       }
       break;
     case 1: // basic kernel fusion
       if (k==0) break;
       beta[0][k] = blas::cDotProduct(*Ap[0], *Ap[k]);
       for (int i=0; i<k-1; i++) { // 4 (k-1) memory transactions here
   beta[i+1][k] = blas::caxpyDotzy(-beta[i][k], *Ap[i], *Ap[k], *Ap[i+1]);
       }
       blas::caxpy(-beta[k-1][k], *Ap[k-1], *Ap[k]);
       break;
     case 2: // two-way pipelining
     case 3: // three-way pipelining
     case 4: // four-way pipelining
     case 5: // five-way pipelining
     case 6: // six-way pipelining
     case 7: // seven-way pipelining
     case 8: // eight-way pipelining
       {
   const int N = pipeline;
   for (int i=0; i<k-(N-1); i+=N) {
     computeBeta(beta, Ap, i, N, k);
     updateAp(beta, Ap, i, N, k);
   }

   if (k%N != 0) { // need to update the remainder
     for (int r = N-1; r>0; r--) {
       if ((k%N) % r == 0) { // if true this is the remainder
         computeBeta(beta, Ap, k-r, r, k);
         updateAp(beta, Ap, k-r, r, k);
         break;
       }
     }
   }
       }
       break;
     default:
       errorQuda("Pipeline length %d type not defined", pipeline);
     }

   }

   void backSubs(const Complex *alpha, Complex** const beta, const double *gamma, Complex *delta, int n) {
     for (int k=n-1; k>=0;k--) {
       delta[k] = alpha[k];
       for (int j=k+1;j<n; j++) {
   delta[k] -= beta[k][j]*delta[j];
       }
       delta[k] /= gamma[k];
     }
   }

   void updateSolution(ColorSpinorField &x, const Complex *alpha, Complex** const beta,
           double *gamma, int k, std::vector<ColorSpinorField*> p) {

     Complex *delta = new Complex[k];

     // Update the solution vector
     backSubs(alpha, beta, gamma, delta, k);

     std::vector<ColorSpinorField*> X;
     X.push_back(&x);

     std::vector<ColorSpinorField*> P;
     for (int i=0; i<k; i++) P.push_back(p[i]);
     blas::caxpy(delta, P, X);

     delete []delta;
   }

   GCR::GCR(DiracMatrix &mat, DiracMatrix &matSloppy, DiracMatrix &matPrecon, SolverParam &param,
      TimeProfile &profile) :
     Solver(param, profile), mat(mat), matSloppy(matSloppy), matPrecon(matPrecon), K(0), Kparam(param),
     nKrylov(param.Nkrylov), init(false),  rp(nullptr), yp(nullptr), tmpp(nullptr), x_sloppy(nullptr),
     r_sloppy(nullptr), r_pre(nullptr), p_pre(nullptr), rM(nullptr)
   {

     fillInnerSolveParam(Kparam, param);

     if (param.inv_type_precondition == QUDA_CG_INVERTER) // inner CG preconditioner
       K = new CG(matPrecon, matPrecon, Kparam, profile);
     else if (param.inv_type_precondition == QUDA_BICGSTAB_INVERTER) // inner BiCGstab preconditioner
       K = new BiCGstab(matPrecon, matPrecon, matPrecon, Kparam, profile);
     else if (param.inv_type_precondition == QUDA_MR_INVERTER) // inner MR preconditioner
       K = new MR(matPrecon, matPrecon, Kparam, profile);
     else if (param.inv_type_precondition == QUDA_SD_INVERTER) // inner MR preconditioner
       K = new SD(matPrecon, Kparam, profile);
     else if (param.inv_type_precondition == QUDA_INVALID_INVERTER) // unknown preconditioner
       K = NULL;
     else
       errorQuda("Unsupported preconditioner %d\n", param.inv_type_precondition);

     p.resize(nKrylov);
     Ap.resize(nKrylov);

     alpha = new Complex[nKrylov];
     beta = new Complex*[nKrylov];
     for (int i=0; i<nKrylov; i++) beta[i] = new Complex[nKrylov];
     gamma = new double[nKrylov];
   }

   GCR::GCR(DiracMatrix &mat, Solver &K, DiracMatrix &matSloppy, DiracMatrix &matPrecon,
      SolverParam &param, TimeProfile &profile) :
     Solver(param, profile), mat(mat), matSloppy(matSloppy), matPrecon(matPrecon), K(&K), Kparam(param),
     nKrylov(param.Nkrylov), init(false), rp(nullptr), yp(nullptr), tmpp(nullptr), x_sloppy(nullptr),
     r_sloppy(nullptr), r_pre(nullptr), p_pre(nullptr), rM(nullptr)
   {
     p.resize(nKrylov);
     Ap.resize(nKrylov);

     alpha = new Complex[nKrylov];
     beta = new Complex*[nKrylov];
     for (int i=0; i<nKrylov; i++) beta[i] = new Complex[nKrylov];
     gamma = new double[nKrylov];
   }

   GCR::~GCR() {
     profile.TPSTART(QUDA_PROFILE_FREE);
     delete []alpha;
     for (int i=0; i<nKrylov; i++) delete []beta[i];
     delete []beta;
     delete []gamma;

     if (K && param.inv_type_precondition != QUDA_MG_INVERTER) delete K;

     if (param.precondition_cycle > 1) delete rM;

     if (param.precision_sloppy != param.precision) {
       if (x_sloppy) delete x_sloppy;
       if (r_sloppy) delete r_sloppy;
     }

     if (param.precision_precondition != param.precision_sloppy || param.precondition_cycle > 1) {
       if (p_pre) delete p_pre;
       if (r_pre) delete r_pre;
     }

     for (int i=0; i<nKrylov; i++) {
       if (p[i]) delete p[i];
       if (Ap[i]) delete Ap[i];
     }

     if (tmpp) delete tmpp;
     if (rp) delete rp;
     if (yp) delete yp;
     profile.TPSTOP(QUDA_PROFILE_FREE);
   }

   void GCR::operator()(ColorSpinorField &x, ColorSpinorField &b)
   {
     profile.TPSTART(QUDA_PROFILE_INIT);

     if (!init) {
       ColorSpinorParam csParam(x);
       csParam.create = QUDA_NULL_FIELD_CREATE;
       rp = ColorSpinorField::Create(csParam);

       // high precision accumulator
       yp = ColorSpinorField::Create(csParam);

       // create sloppy fields used for orthogonalization
       csParam.setPrecision(param.precision_sloppy);
       for (int i=0; i<nKrylov; i++) {
   p[i] = ColorSpinorField::Create(csParam);
   Ap[i] = ColorSpinorField::Create(csParam);
       }

       tmpp = ColorSpinorField::Create(csParam); //temporary for sloppy mat-vec

       if (param.precision_sloppy != param.precision) {
   csParam.setPrecision(param.precision_sloppy);
   x_sloppy = ColorSpinorField::Create(csParam);
   r_sloppy = ColorSpinorField::Create(csParam);
       } else {
   x_sloppy = &x;
   r_sloppy = rp;
       }

       // these low precision fields are used by the inner solver
       if (param.precision_precondition != param.precision_sloppy || param.precondition_cycle > 1) {
   csParam.setPrecision(param.precision_precondition);
   p_pre = ColorSpinorField::Create(csParam);
   r_pre = ColorSpinorField::Create(csParam);
       } else {
   p_pre = NULL;
   r_pre = r_sloppy;
       }

       if (param.precondition_cycle > 1) {
   ColorSpinorParam rParam(*r_sloppy);
   rM = ColorSpinorField::Create(rParam);
       }
       init = true;
     }

     ColorSpinorField &r = *rp;
     ColorSpinorField &y = *yp;
     ColorSpinorField &xSloppy = *x_sloppy;
     ColorSpinorField &rSloppy = *r_sloppy;
     ColorSpinorField &rPre = *r_pre;
     ColorSpinorField &tmp = *tmpp;
     blas::zero(y);

     bool precMatch = (param.precision_precondition != param.precision_sloppy || param.precondition_cycle > 1) ? false : true;

     // compute parity of the node
     int parity = 0;
     for (int i=0; i<4; i++) parity += commCoords(i);
     parity = parity % 2;

     double b2 = blas::norm2(b);  // norm sq of source
     double r2;                // norm sq of residual

     // compute initial residual depending on whether we have an initial guess or not
     if (param.use_init_guess == QUDA_USE_INIT_GUESS_YES) {
       mat(r, x, y);
       r2 = blas::xmyNorm(b, r);
       blas::copy(y, x);
       if (&x == &xSloppy) blas::zero(x); // need to zero x when doing uni-precision solver
     } else {
       blas::copy(r, b);
       r2 = b2;
       blas::zero(x); // defensive measure in case solution isn't already zero
       if (&x != &xSloppy) blas::zero(xSloppy);
     }

     // Check to see that we're not trying to invert on a zero-field source
     if (b2 == 0) {
       if (param.compute_null_vector == QUDA_COMPUTE_NULL_VECTOR_NO) {
   profile.TPSTOP(QUDA_PROFILE_INIT);
   warningQuda("inverting on zero-field source\n");
   x = b;
   param.true_res = 0.0;
   param.true_res_hq = 0.0;
   return;
       } else {
   b2 = r2;
       }
     }

     double stop = stopping(param.tol, b2, param.residual_type); // stopping condition of solver

     const bool use_heavy_quark_res =
       (param.residual_type & QUDA_HEAVY_QUARK_RESIDUAL) ? true : false;

     // this parameter determines how many consective reliable update
     // reisudal increases we tolerate before terminating the solver,
     // i.e., how long do we want to keep trying to converge
     const int maxResIncrease = param.max_res_increase; // check if we reached the limit of our tolerance
     const int maxResIncreaseTotal = param.max_res_increase_total;

     double heavy_quark_res = 0.0; // heavy quark residual
     if(use_heavy_quark_res) heavy_quark_res = sqrt(blas::HeavyQuarkResidualNorm(x,r).z);

     int resIncrease = 0;
     int resIncreaseTotal = 0;

     profile.TPSTOP(QUDA_PROFILE_INIT);
     profile.TPSTART(QUDA_PROFILE_PREAMBLE);

     blas::flops = 0;

     blas::copy(rSloppy, r);

     int total_iter = 0;
     int restart = 0;
     double r2_old = r2;
     bool l2_converge = false;

     int pipeline = param.pipeline;
     // Vectorized dot product only has limited support so work around
     if (Ap[0]->Location() == QUDA_CPU_FIELD_LOCATION || pipeline == 0) pipeline = 1;

     if (pipeline > 1)
       warningQuda("GCR with pipeline length %d is experimental", pipeline);

     profile.TPSTOP(QUDA_PROFILE_PREAMBLE);
     profile.TPSTART(QUDA_PROFILE_COMPUTE);

     int k = 0;
     PrintStats("GCR", total_iter+k, r2, b2, heavy_quark_res);
     while ( !convergence(r2, heavy_quark_res, stop, param.tol_hq) &&
       total_iter < param.maxiter) {

       for (int m=0; m<param.precondition_cycle; m++) {
   if (param.inv_type_precondition != QUDA_INVALID_INVERTER) {
     ColorSpinorField &pPre = (precMatch ? *p[k] : *p_pre);

     if (m==0) { // residual is just source
       blas::copy(rPre, rSloppy);
     } else { // compute residual
       blas::copy(*rM, rSloppy);
       blas::axpy(-1.0, *Ap[k], *rM);
       blas::copy(rPre, *rM);
     }

     pushVerbosity(param.verbosity_precondition);
     if ((parity+m)%2 == 0 || param.schwarz_type == QUDA_ADDITIVE_SCHWARZ) (*K)(pPre, rPre);
     else blas::copy(pPre, rPre);
     popVerbosity();

     // relaxation p = omega*p + (1-omega)*r
     //if (param.omega!=1.0) blas::axpby((1.0-param.omega), rPre, param.omega, pPre);

     if (m==0) { blas::copy(*p[k], pPre); }
     else { blas::copy(tmp, pPre); blas::xpy(tmp, *p[k]); }

   } else { // no preconditioner
     *p[k] = rSloppy;
   }
   matSloppy(*Ap[k], *p[k], tmp);
   if (getVerbosity()>= QUDA_DEBUG_VERBOSE)
     printfQuda("GCR debug iter=%d: Ap2=%e, p2=%e, rPre2=%e\n",
          total_iter, blas::norm2(*Ap[k]), blas::norm2(*p[k]), blas::norm2(rPre));
       }

       orthoDir(beta, Ap, k, pipeline);

       double3 Apr = blas::cDotProductNormA(*Ap[k], rSloppy);

       if (getVerbosity()>= QUDA_DEBUG_VERBOSE) {
   printfQuda("GCR debug iter=%d: Apr=(%e,%e,%e)\n", total_iter, Apr.x, Apr.y, Apr.z);
   for (int i=0; i<k; i++)
     for (int j=0; j<=k; j++)
       printfQuda("GCR debug iter=%d: beta[%d][%d] = (%e,%e)\n",
            total_iter, i, j, real(beta[i][j]), imag(beta[i][j]));
       }

       gamma[k] = sqrt(Apr.z); // gamma[k] = Ap[k]
       if (gamma[k] == 0.0) errorQuda("GCR breakdown\n");
       alpha[k] = Complex(Apr.x, Apr.y) / gamma[k]; // alpha = (1/|Ap|) * (Ap, r)

       // r -= (1/|Ap|^2) * (Ap, r) r, Ap *= 1/|Ap|
       r2 = blas::cabxpyAxNorm(1.0/gamma[k], -alpha[k], *Ap[k], rSloppy);

       k++;
       total_iter++;

       PrintStats("GCR", total_iter, r2, b2, heavy_quark_res);

       // update since nKrylov or maxiter reached, converged or reliable update required
       // note that the heavy quark residual will by definition only be checked every nKrylov steps
       if (k==nKrylov || total_iter==param.maxiter || (r2 < stop && !l2_converge) || sqrt(r2/r2_old) < param.delta) {

   // update the solution vector
   updateSolution(xSloppy, alpha, beta, gamma, k, p);

   // recalculate residual in high precision
   blas::copy(x, xSloppy);
   blas::xpy(x, y);
   mat(r, y, x);
   r2 = blas::xmyNorm(b, r);

   if (use_heavy_quark_res) heavy_quark_res = sqrt(blas::HeavyQuarkResidualNorm(y, r).z);

   // break-out check if we have reached the limit of the precision
   if (r2 > r2_old) {
     resIncrease++;
     resIncreaseTotal++;
     warningQuda("GCR: new reliable residual norm %e is greater than previous reliable residual norm %e (total #inc %i)",
           sqrt(r2), sqrt(r2_old), resIncreaseTotal);
     if (resIncrease > maxResIncrease or resIncreaseTotal > maxResIncreaseTotal) {
       warningQuda("GCR: solver exiting due to too many true residual norm increases");
       break;
     }
   } else {
     resIncrease = 0;
   }

   k = 0;

   if ( !convergence(r2, heavy_quark_res, stop, param.tol_hq) ) {
     restart++; // restarting if residual is still too great

     PrintStats("GCR (restart)", restart, r2, b2, heavy_quark_res);
     blas::copy(rSloppy, r);
     blas::zero(xSloppy);

     r2_old = r2;

     // prevent ending the Krylov space prematurely if other convergence criteria not met
     if (r2 < stop) l2_converge = true;
   }

   r2_old = r2;

       }

     }

     if (total_iter > 0) blas::copy(x, y);

     profile.TPSTOP(QUDA_PROFILE_COMPUTE);
     profile.TPSTART(QUDA_PROFILE_EPILOGUE);

     param.secs += profile.Last(QUDA_PROFILE_COMPUTE);

     double gflops = (blas::flops + mat.flops() + matSloppy.flops() + matPrecon.flops())*1e-9;
     if (K) gflops += K->flops()*1e-9;

     if (k>=param.maxiter && getVerbosity() >= QUDA_SUMMARIZE)
       warningQuda("Exceeded maximum iterations %d", param.maxiter);

     if (getVerbosity() >= QUDA_VERBOSE) printfQuda("GCR: number of restarts = %d\n", restart);

     if (param.compute_true_res) {
       // Calculate the true residual
       mat(r, x, y);
       double true_res = blas::xmyNorm(b, r);
       param.true_res = sqrt(true_res / b2);
       if (param.residual_type & QUDA_HEAVY_QUARK_RESIDUAL)
   param.true_res_hq = sqrt(blas::HeavyQuarkResidualNorm(x,r).z);
       else
   param.true_res_hq = 0.0;
     }

     param.gflops += gflops;
     param.iter += total_iter;

     // reset the flops counters
     blas::flops = 0;
     mat.flops();
     matSloppy.flops();
     matPrecon.flops();

     profile.TPSTOP(QUDA_PROFILE_EPILOGUE);
     profile.TPSTART(QUDA_PROFILE_FREE);

     PrintSummary("GCR", total_iter, r2, b2);

     profile.TPSTOP(QUDA_PROFILE_FREE);

     return;
   }

 } // namespace quda
invert_quda.h

quda::Solver::convergence
bool convergence(const double &r2, const double &hq2, const double &r2_tol, const double &hq_tol)
Definition: solver.cpp:139

quda::SolverParam::compute_true_res
bool compute_true_res
Definition: invert_quda.h:97

QUDA_VERBOSE
Definition: enum_quda.h:237

quda::SolverParam::global_reduction
bool global_reduction
whether the solver acting as a preconditioner for another solver
Definition: invert_quda.h:201

quda::timeInterval
double timeInterval(struct timeval start, struct timeval end)
Definition: inv_gcr_quda.cpp:18

quda::SolverParam::schwarz_type
QudaSchwarzType schwarz_type
Definition: invert_quda.h:175

quda::SolverParam::maxiter_precondition
int maxiter_precondition
Definition: invert_quda.h:167

quda::computeBeta
void computeBeta(Complex **beta, std::vector< ColorSpinorField *> Ap, int i, int N, int k)
Definition: inv_gcr_quda.cpp:50

QUDA_GCR_INVERTER
Definition: enum_quda.h:103

quda::SolverParam::verbosity_precondition
QudaVerbosity verbosity_precondition
Definition: invert_quda.h:197

quda::Solver::flops
virtual double flops() const
Definition: invert_quda.h:399

quda::Solver::stopping
static double stopping(const double &tol, const double &b2, QudaResidualType residual_type)
Definition: solver.cpp:122

quda::blas::cDotProductNormA
double3 cDotProductNormA(ColorSpinorField &a, ColorSpinorField &b)
Definition: reduce_quda.cu:572

quda::SolverParam::delta
double delta
Definition: invert_quda.h:56

quda::GCR::r_pre
ColorSpinorField * r_pre
sloppy residual vector
Definition: invert_quda.h:624

quda::ColorSpinorField
Definition: color_spinor_field.h:271

QUDA_PRESERVE_SOURCE_YES
Definition: enum_quda.h:209

quda::BiCGstab
Definition: invert_quda.h:486

quda::SolverParam::inv_type
QudaInverterType inv_type
Definition: invert_quda.h:19

getVerbosity
QudaVerbosity getVerbosity()
Definition: util_quda.cpp:20

quda::GCR::p
std::vector< ColorSpinorField * > p
residual vector for doing multi-cycle preconditioning
Definition: invert_quda.h:628

quda::QUDA_PROFILE_FREE
Definition: quda_internal.h:175

errorQuda
#define errorQuda(...)
Definition: util_quda.h:90

quda::blas::norm2
double norm2(const ColorSpinorField &a)
Definition: reduce_quda.cu:241

color_spinor_field.h

quda::blas::init
void init()
Definition: blas_quda.cu:64

start
cudaEvent_t start
Definition: CMakeCUDACompilerId.cpp1.ii:2453

quda::GCR::Kparam
SolverParam Kparam
Definition: invert_quda.h:603

quda::SolverParam::secs
double secs
Definition: invert_quda.h:178

quda::SolverParam::true_res_hq
double true_res_hq
Definition: invert_quda.h:103

QUDA_MR_INVERTER
Definition: enum_quda.h:104

quda::sqrt
__host__ __device__ ValueType sqrt(ValueType x)
Definition: complex_quda.h:105

QUDA_COMPUTE_NULL_VECTOR_NO
Definition: enum_quda.h:402

quda::blas::cDotProduct
Complex cDotProduct(ColorSpinorField &, ColorSpinorField &)
Definition: reduce_quda.cu:500

quda::Complex
std::complex< double > Complex
Definition: eig_variables.h:13

commCoords
int commCoords(int)
Definition: comm_common.cpp:672

QUDA_SUMMARIZE
Definition: enum_quda.h:236

tmp
cudaColorSpinorField * tmp
Definition: covdev_test.cpp:44

quda::ColorSpinorField::Create
static ColorSpinorField * Create(const ColorSpinorParam &param)
Definition: color_spinor_field.cpp:748

quda::GCR::nKrylov
int nKrylov
Definition: invert_quda.h:608

QUDA_NULL_FIELD_CREATE
Definition: enum_quda.h:330

z
int int z
Definition: CMakeCUDACompilerId.cpp1.ii:2637

quda::GCR::gamma
double * gamma
Definition: invert_quda.h:612

quda::Solver::profile
TimeProfile & profile
Definition: invert_quda.h:329

quda::GCR::operator()
void operator()(ColorSpinorField &out, ColorSpinorField &in)
Definition: inv_gcr_quda.cpp:237

quda::blas::copy
void copy(ColorSpinorField &dst, const ColorSpinorField &src)
Definition: copy_quda.cu:263

quda::MR
Definition: invert_quda.h:645

QUDA_CG_INVERTER
Definition: enum_quda.h:101

quda::blas::xmyNorm
double xmyNorm(ColorSpinorField &x, ColorSpinorField &y)
Definition: reduce_quda.cu:364

quda::SolverParam::inv_type_precondition
QudaInverterType inv_type_precondition
Definition: invert_quda.h:25

util_quda.h

quda::SolverParam::preserve_source
QudaPreserveSource preserve_source
Definition: invert_quda.h:121

quda::SolverParam::iter
int iter
Definition: invert_quda.h:109

quda::SolverParam::max_res_increase_total
int max_res_increase_total
Definition: invert_quda.h:79

quda::GCR::rM
ColorSpinorField * rM
preconditioner result
Definition: invert_quda.h:626

QUDA_MG_INVERTER
Definition: enum_quda.h:116

quda::GCR::beta
Complex ** beta
Definition: invert_quda.h:611

quda::GCR::r_sloppy
ColorSpinorField * r_sloppy
sloppy solution vector
Definition: invert_quda.h:623

quda::fillInnerSolveParam
void fillInnerSolveParam(SolverParam &inner, const SolverParam &outer)
Definition: inv_gcr_quda.cpp:25

quda::GCR::alpha
Complex * alpha
Definition: invert_quda.h:610

quda
Definition: blas_cublas.h:6

pipeline
int pipeline
Definition: test_util.cpp:1632

param
QudaGaugeParam param
Definition: pack_test.cpp:17

b
#define b
Definition: dw_dslash4_core.h:83

x
p x
Definition: CMakeCUDACompilerId.cpp1.ii:3011

quda::SolverParam::pipeline
int pipeline
Definition: invert_quda.h:85

quda::backSubs
void backSubs(const Complex *alpha, Complex **const beta, const double *gamma, Complex *delta, int n)
Definition: inv_gcr_quda.cpp:131

quda::GCR::GCR
GCR(DiracMatrix &mat, DiracMatrix &matSloppy, DiracMatrix &matPrecon, SolverParam &param, TimeProfile &profile)
Definition: inv_gcr_quda.cpp:159

quda::SolverParam::compute_null_vector
QudaComputeNullVector compute_null_vector
Definition: invert_quda.h:53

quda::TimeProfile::Last
double Last(QudaProfileType idx)
Definition: quda_internal.h:312

quda::GCR::K
Solver * K
Definition: invert_quda.h:602

quda::Solver::PrintSummary
void PrintSummary(const char *name, int k, const double &r2, const double &b2)
Definition: solver.cpp:194

quda::blas::cabxpyAxNorm
double cabxpyAxNorm(const double &a, const Complex &b, ColorSpinorField &x, ColorSpinorField &y)
Definition: reduce_quda.cu:449

delta
static unsigned int delta
Definition: CMakeCUDACompilerId.cpp1.ii:12998

QUDA_USE_INIT_GUESS_YES
Definition: enum_quda.h:397

quda::SolverParam::gflops
double gflops
Definition: invert_quda.h:181

quda::SolverParam::residual_type
QudaResidualType residual_type
Definition: invert_quda.h:47

quda::updateSolution
void updateSolution(ColorSpinorField &x, const Complex *alpha, Complex **const beta, double *gamma, int k, std::vector< ColorSpinorField *> p)
Definition: inv_gcr_quda.cpp:141

QUDA_PRESERVE_SOURCE_NO
Definition: enum_quda.h:208

quda::GCR::~GCR
virtual ~GCR()
Definition: inv_gcr_quda.cpp:205

quda::QUDA_PROFILE_EPILOGUE
Definition: quda_internal.h:174

QUDA_ADDITIVE_SCHWARZ
Definition: enum_quda.h:160

quda::SolverParam::maxiter
int maxiter
Definition: invert_quda.h:106

csParam
ColorSpinorParam csParam
Definition: pack_test.cpp:24

p
static __inline__ size_t p
Definition: CMakeCUDACompilerId.cpp1.ii:2995

quda::QUDA_PROFILE_COMPUTE
Definition: quda_internal.h:172

fused_exterior_ndeg_tm_dslash_cuda_gen.i
int i
start here
Definition: fused_exterior_ndeg_tm_dslash_cuda_gen.py:816

warningQuda
#define warningQuda(...)
Definition: util_quda.h:101

quda::GCR::Ap
std::vector< ColorSpinorField * > Ap
Definition: invert_quda.h:629

quda::SolverParam::is_preconditioner
bool is_preconditioner
verbosity to use for preconditioner
Definition: invert_quda.h:199

quda::SolverParam::tol_hq
double tol_hq
Definition: invert_quda.h:94

quda::GCR::yp
ColorSpinorField * yp
residual vector
Definition: invert_quda.h:620

quda::blas::HeavyQuarkResidualNorm
double3 HeavyQuarkResidualNorm(ColorSpinorField &x, ColorSpinorField &r)
Definition: reduce_quda.cu:703

quda::GCR::init
bool init
Definition: invert_quda.h:617

quda::QUDA_PROFILE_PREAMBLE
Definition: quda_internal.h:171

timeval
Definition: CMakeCUDACompilerId.cpp1.ii:4831

quda::blas::caxpyDotzy
Complex caxpyDotzy(const Complex &a, ColorSpinorField &x, ColorSpinorField &y, ColorSpinorField &z)
Definition: reduce_quda.cu:544

gamma
double gamma(double) __attribute__((availability(macosx

QUDA_HEAVY_QUARK_RESIDUAL
Definition: enum_quda.h:168

quda::GCR::p_pre
ColorSpinorField * p_pre
residual passed to preconditioner
Definition: invert_quda.h:625

quda::SolverParam::max_res_increase
int max_res_increase
Definition: invert_quda.h:74

quda::blas::caxpy
void caxpy(const Complex &a, ColorSpinorField &x, ColorSpinorField &y)
Definition: blas_quda.cu:246

quda::SolverParam::tol_precondition
double tol_precondition
Definition: invert_quda.h:164

QUDA_BICGSTAB_INVERTER
Definition: enum_quda.h:102

QUDA_SD_INVERTER
Definition: enum_quda.h:106

quda::blas::zero
void zero(ColorSpinorField &a)
Definition: blas_quda.cu:45

pushVerbosity
void pushVerbosity(QudaVerbosity verbosity)
Definition: util_quda.cpp:82

quda::SolverParam::precision_precondition
QudaPrecision precision_precondition
Definition: invert_quda.h:118

quda::blas::axpy
void axpy(const double &a, ColorSpinorField &x, ColorSpinorField &y)
Definition: blas_quda.cu:150

X
int X
Definition: asym_wilson_clover_dslash_dagger_fermi_core.h:394

blas_quda.h

quda::SolverParam::precision
QudaPrecision precision
Definition: invert_quda.h:112

quda::QUDA_PROFILE_INIT
Definition: quda_internal.h:170

quda::SolverParam::true_res
double true_res
Definition: invert_quda.h:100

quda::Solver
Definition: invert_quda.h:325

QUDA_DEBUG_VERBOSE
Definition: enum_quda.h:238

quda::ColorSpinorParam
Definition: color_spinor_field.h:80

QUDA_USE_INIT_GUESS_NO
Definition: enum_quda.h:396

quda::orthoDir
void orthoDir(Complex **beta, std::vector< ColorSpinorField *> Ap, int k, int pipeline)
Definition: inv_gcr_quda.cpp:83

quda::Solver::param
SolverParam & param
Definition: invert_quda.h:328

QUDA_INVALID_INVERTER
Definition: enum_quda.h:120

quda::CG
Definition: invert_quda.h:402

quda::DiracMatrix::flops
unsigned long long flops() const
Definition: dirac_quda.h:995

quda::Solver::PrintStats
void PrintStats(const char *, int k, const double &r2, const double &b2, const double &hq2)
Definition: solver.cpp:179

quda::DiracMatrix
Definition: dirac_quda.h:979

dslash_quda.h

n
int n
Definition: CMakeCUDACompilerId.cpp1.ii:8086

printfQuda
#define printfQuda(...)
Definition: util_quda.h:84

quda::blas::flops
unsigned long long flops
Definition: blas_quda.cu:42

quda::GCR::tmpp
ColorSpinorField * tmpp
high precision accumulator
Definition: invert_quda.h:621

size
size_t size
Definition: CMakeCUDACompilerId.cpp1.ii:2289

e
return e
Definition: CMakeCUDACompilerId.cpp1.ii:3026

quda::blas::xpy
void xpy(ColorSpinorField &x, ColorSpinorField &y)
Definition: blas_quda.cu:128

quda::TimeProfile
Definition: quda_internal.h:232

quda::GCR::mat
const DiracMatrix & mat
Definition: invert_quda.h:598

quda::GCR::rp
ColorSpinorField * rp
Definition: invert_quda.h:619

quda::SolverParam::precondition_cycle
int precondition_cycle
Definition: invert_quda.h:161

quda::GCR::matPrecon
const DiracMatrix & matPrecon
Definition: invert_quda.h:600

quda::SolverParam::use_init_guess
QudaUseInitGuess use_init_guess
Definition: invert_quda.h:50

popVerbosity
void popVerbosity()
Definition: util_quda.cpp:93

quda::GCR::matSloppy
const DiracMatrix & matSloppy
Definition: invert_quda.h:599

quda::SolverParam::precision_sloppy
QudaPrecision precision_sloppy
Definition: invert_quda.h:115

quda::GCR::x_sloppy
ColorSpinorField * x_sloppy
temporary for mat-vec
Definition: invert_quda.h:622

quda::SolverParam
Definition: invert_quda.h:15

mat
void mat(void *out, void **link, void *in, int dagger_bit, int mu, QudaPrecision sPrecision, QudaPrecision gPrecision)
Definition: covdev_reference.cpp:117

parity
QudaParity parity
Definition: covdev_test.cpp:53

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:296

quda::updateAp
void updateAp(Complex **beta, std::vector< ColorSpinorField *> Ap, int begin, int size, int k)
Definition: inv_gcr_quda.cpp:70

a
#define a
Definition: dw_dslash4_core.h:82

quda::SolverParam::tol
double tol
Definition: invert_quda.h:88

end
cudaEvent_t cudaEvent_t end
Definition: CMakeCUDACompilerId.cpp1.ii:2453

y
int y
Definition: CMakeCUDACompilerId.cpp1.ii:2637

quda_internal.h

quda::SD
Definition: invert_quda.h:666