quda-ref/v1.1.0/inv__cg3__quda_8cpp_source.html

 #include <stdio.h>

 #include <stdlib.h>

 #include <math.h>

 #include <iostream>


 #include <complex>


 #include <quda_internal.h>

 #include <blas_quda.h>

 #include <dslash_quda.h>

 #include <invert_quda.h>

 #include <util_quda.h>


 namespace quda {


   CG3::CG3(const DiracMatrix &mat, const DiracMatrix &matSloppy, const DiracMatrix &matPrecon, SolverParam &param,

            TimeProfile &profile) :

     Solver(mat, matSloppy, matPrecon, matPrecon, param, profile),

     init(false)

   {

   }


   CG3::~CG3()

   {

     if ( init ) {

       delete rp;

       delete yp;

       delete tmpp;

       delete ArSp;

       delete rS_oldp;

       if (param.precision != param.precision_sloppy) {

         delete rSp;

         delete xSp;

         delete xS_oldp;

         delete tmpSp;

       }

       if (!mat.isStaggered()) delete tmp2Sp;


       init = false;

     }

   }


   CG3NE::CG3NE(const DiracMatrix &mat, const DiracMatrix &matSloppy, const DiracMatrix &matPrecon, SolverParam &param,

                TimeProfile &profile) :

     CG3(mmdag, mmdagSloppy, mmdagPrecon, param, profile),

     mmdag(mat.Expose()),

     mmdagSloppy(matSloppy.Expose()),

     mmdagPrecon(matPrecon.Expose()),

     xp(nullptr),

     yp(nullptr),

     init(false)

   {

   }


   CG3NE::~CG3NE()

   {

     if (init) {

       if (xp) delete xp;

       if (yp) delete yp;

       init = false;

     }

   }


   // CG3NE: M Mdag y = b is solved; x = Mdag y is returned as solution.

   void CG3NE::operator()(ColorSpinorField &x, ColorSpinorField &b)

   {

     if (param.maxiter == 0 || param.Nsteps == 0) {

       if (param.use_init_guess == QUDA_USE_INIT_GUESS_NO) blas::zero(x);

       return;

     }


     const int iter0 = param.iter;


     if (!init) {

       ColorSpinorParam csParam(x);

       csParam.create = QUDA_NULL_FIELD_CREATE;

       xp = ColorSpinorField::Create(x, csParam);

       csParam.create = QUDA_ZERO_FIELD_CREATE;

       yp = ColorSpinorField::Create(x, csParam);

       init = true;

     }


     double b2 = blas::norm2(b);


     if (param.use_init_guess == QUDA_USE_INIT_GUESS_YES) {


       // compute initial residual

       mmdag.Expose()->M(*xp, x);

       double r2 = blas::xmyNorm(b, *xp);

       if (b2 == 0.0) b2 = r2;


       // compute solution to residual equation

       CG3::operator()(*yp, *xp);


       mmdag.Expose()->Mdag(*xp, *yp);


       // compute full solution

       blas::xpy(*xp, x);


     } else {


       CG3::operator()(*yp, b);

       mmdag.Expose()->Mdag(x, *yp);

     }


     // future optimization: with preserve_source == QUDA_PRESERVE_SOURCE_NO; b is already

     // expected to be the CG residual which matches the CG3NE residual

     // (but only with zero initial guess).  at the moment, CG does not respect this convention

     if (param.compute_true_res || param.preserve_source == QUDA_PRESERVE_SOURCE_NO) {


       // compute the true residual

       mmdag.Expose()->M(*xp, x);


       ColorSpinorField &A = param.preserve_source == QUDA_PRESERVE_SOURCE_YES ? b : *xp;

       ColorSpinorField &B = param.preserve_source == QUDA_PRESERVE_SOURCE_YES ? *xp : b;

       blas::axpby(-1.0, A, 1.0, B);


       double r2;

       if (param.residual_type & QUDA_HEAVY_QUARK_RESIDUAL) {

         double3 h3 = blas::HeavyQuarkResidualNorm(x, B);

         r2 = h3.y;

         param.true_res_hq = sqrt(h3.z);

       } else {

         r2 = blas::norm2(B);

       }

       param.true_res = sqrt(r2 / b2);


       PrintSummary("CG3NE", param.iter - iter0, r2, b2, stopping(param.tol, b2, param.residual_type), param.tol_hq);

     }

   }


   CG3NR::CG3NR(const DiracMatrix &mat, const DiracMatrix &matSloppy, const DiracMatrix &matPrecon, SolverParam &param,

                TimeProfile &profile) :

     CG3(mdagm, mdagmSloppy, mdagmPrecon, param, profile),

     mdagm(mat.Expose()),

     mdagmSloppy(matSloppy.Expose()),

     mdagmPrecon(matPrecon.Expose()),

     bp(nullptr),

     init(false)

   {

   }


   CG3NR::~CG3NR()

   {

     if (init) {

       if (bp) delete bp;

       init = false;

     }

   }


   // CG3NR: Mdag M x = Mdag b is solved.

   void CG3NR::operator()(ColorSpinorField &x, ColorSpinorField &b)

   {

     if (param.maxiter == 0 || param.Nsteps == 0) {

       if (param.use_init_guess == QUDA_USE_INIT_GUESS_NO) blas::zero(x);

       return;

     }


     const int iter0 = param.iter;


     if (!init) {

       ColorSpinorParam csParam(b);

       csParam.create = QUDA_ZERO_FIELD_CREATE;

       bp = ColorSpinorField::Create(csParam);

       init = true;

     }


     double b2 = blas::norm2(b);

     if (b2 == 0.0) { // compute initial residual vector

       mdagm.Expose()->M(*bp, x);

       b2 = blas::norm2(*bp);

     }


     mdagm.Expose()->Mdag(*bp, b);

     CG3::operator()(x, *bp);


     if (param.compute_true_res || param.preserve_source == QUDA_PRESERVE_SOURCE_NO) {


       // compute the true residual

       mdagm.Expose()->M(*bp, x);


       ColorSpinorField &A = param.preserve_source == QUDA_PRESERVE_SOURCE_YES ? b : *bp;

       ColorSpinorField &B = param.preserve_source == QUDA_PRESERVE_SOURCE_YES ? *bp : b;

       blas::axpby(-1.0, A, 1.0, B);


       double r2;

       if (param.residual_type & QUDA_HEAVY_QUARK_RESIDUAL) {

         double3 h3 = blas::HeavyQuarkResidualNorm(x, B);

         r2 = h3.y;

         param.true_res_hq = sqrt(h3.z);

       } else {

         r2 = blas::norm2(B);

       }

       param.true_res = sqrt(r2 / b2);

       PrintSummary("CG3NR", param.iter - iter0, r2, b2, stopping(param.tol, b2, param.residual_type), param.tol_hq);


     } else if (param.preserve_source == QUDA_PRESERVE_SOURCE_NO) {

       mdagm.Expose()->M(*bp, x);

       blas::axpby(-1.0, *bp, 1.0, b);

     }

   }


   void CG3::operator()(ColorSpinorField &x, ColorSpinorField &b)

   {

     if (checkLocation(x, b) != QUDA_CUDA_FIELD_LOCATION)

       errorQuda("Not supported");

     if (x.Precision() != param.precision || b.Precision() != param.precision)

       errorQuda("Precision mismatch");


     profile.TPSTART(QUDA_PROFILE_INIT);


     // Check to see that we're not trying to invert on a zero-field source

     double b2 = blas::norm2(b);

     if(b2 == 0 &&

        (param.compute_null_vector == QUDA_COMPUTE_NULL_VECTOR_NO || param.use_init_guess == QUDA_USE_INIT_GUESS_NO)){

       profile.TPSTOP(QUDA_PROFILE_INIT);

       printfQuda("Warning: inverting on zero-field source\n");

       x = b;

       param.true_res = 0.0;

       param.true_res_hq = 0.0;

       return;

     }


     const bool mixed_precision = (param.precision != param.precision_sloppy);

     ColorSpinorParam csParam(x);

     if (!init) {

       csParam.create = QUDA_ZERO_FIELD_CREATE;

       rp = ColorSpinorField::Create(csParam);

       tmpp = ColorSpinorField::Create(csParam);

       yp = ColorSpinorField::Create(csParam);


       // Sloppy fields

       csParam.setPrecision(param.precision_sloppy);

       ArSp = ColorSpinorField::Create(csParam);

       rS_oldp = ColorSpinorField::Create(csParam);

       if (mixed_precision) {

         rSp = ColorSpinorField::Create(csParam);

         xSp = ColorSpinorField::Create(csParam);

         xS_oldp = ColorSpinorField::Create(csParam);

         tmpSp = ColorSpinorField::Create(csParam);

       } else {

         xS_oldp = yp;

         tmpSp = tmpp;

       }

       if(!mat.isStaggered()) {

         tmp2Sp = ColorSpinorField::Create(csParam);

       } else {

         tmp2Sp = tmpSp;

       }


       init = true;

     }


     ColorSpinorField &r = *rp;

     ColorSpinorField &y = *yp;

     ColorSpinorField &rS = mixed_precision ? *rSp : r;

     ColorSpinorField &xS = mixed_precision ? *xSp : x;

     ColorSpinorField &ArS = *ArSp;

     ColorSpinorField &rS_old = *rS_oldp;

     ColorSpinorField &xS_old = *xS_oldp;

     ColorSpinorField &tmp = *tmpp;

     ColorSpinorField &tmpS = *tmpSp;

     ColorSpinorField &tmp2S = *tmp2Sp;


     double stop = stopping(param.tol, b2, param.residual_type); // stopping condition of solver


     const bool use_heavy_quark_res =

       (param.residual_type & QUDA_HEAVY_QUARK_RESIDUAL) ? true : false;


     // this parameter determines how many consective reliable update

     // reisudal increases we tolerate before terminating the solver,

     // i.e., how long do we want to keep trying to converge

     const int maxResIncrease = param.max_res_increase; // check if we reached the limit of our tolerance

     const int maxResIncreaseTotal = param.max_res_increase_total;

     int resIncrease = 0;

     int resIncreaseTotal = 0;


     // these are only used if we use the heavy_quark_res

     const int hqmaxresIncrease = maxResIncrease + 1;

     int heavy_quark_check = param.heavy_quark_check; // how often to check the heavy quark residual

     double heavy_quark_res = 0.0; // heavy quark residual

     double heavy_quark_res_old = 0.0;  // heavy quark residual

     int hqresIncrease = 0;

     bool L2breakdown = false;


     int pipeline = param.pipeline;


     profile.TPSTOP(QUDA_PROFILE_INIT);

     profile.TPSTART(QUDA_PROFILE_PREAMBLE);


     blas::flops = 0;


     // compute initial residual depending on whether we have an initial guess or not

     double r2;

     if (param.use_init_guess == QUDA_USE_INIT_GUESS_YES) {

       mat(r, x, y, tmp);

       r2 = blas::xmyNorm(b, r);

       if(b2==0) b2 = r2;

       if (mixed_precision) {

         blas::copy(y, x);

         blas::zero(xS);

       }

     } else {

       blas::copy(r, b);

       r2 = b2;

       blas::zero(x);

       if (mixed_precision) {

         blas::zero(y);

         blas::zero(xS);

       }

     }

     blas::copy(rS, r);


     if (use_heavy_quark_res) {

       heavy_quark_res = sqrt(blas::HeavyQuarkResidualNorm(x, r).z);

       heavy_quark_res_old = heavy_quark_res;

     }


     profile.TPSTOP(QUDA_PROFILE_PREAMBLE);

     if(convergence(r2, heavy_quark_res, stop, param.tol_hq)) {

       if(param.preserve_source == QUDA_PRESERVE_SOURCE_NO) {

         blas::copy(b, r);

       }

       return;

     }

     profile.TPSTART(QUDA_PROFILE_COMPUTE);


     double r2_old = r2;

     double rNorm  = sqrt(r2);

     double r0Norm = rNorm;

     double maxrx  = rNorm;

     double maxrr  = rNorm;

     double delta  = param.delta;

     bool restart = false;


     int k = 0;

     PrintStats("CG3", k, r2, b2, heavy_quark_res);

     double rho = 1.0, gamma = 1.0;


     while ( !convergence(r2, heavy_quark_res, stop, param.tol_hq) && k < param.maxiter) {


       matSloppy(ArS, rS, tmpS, tmp2S);

       double gamma_old = gamma;

       double rAr = blas::reDotProduct(rS,ArS);

       gamma = r2/rAr;


       // CG3 step

       if (k == 0 || restart) { // First iteration

         if (pipeline) {

           r2 = blas::quadrupleCG3InitNorm(gamma, xS, rS, xS_old, rS_old, ArS);

         } else {

           blas::copy(xS_old, xS);

           blas::copy(rS_old, rS);


           blas::axpy(gamma, rS, xS);  // x += gamma*r

           r2 = blas::axpyNorm(-gamma, ArS, rS); // r -= gamma*w

         }

         restart = false;

       } else {

         rho = rho/(rho-(gamma/gamma_old)*(r2/r2_old));

         r2_old = r2;


         if (pipeline) {

           r2 = blas::quadrupleCG3UpdateNorm(gamma, rho, xS, rS, xS_old, rS_old, ArS);

         } else {

           blas::copy(tmpS, xS);

           blas::copy(tmp2S, rS);


           blas::axpby(gamma*rho, rS, rho, xS);

           blas::axpby(-gamma*rho, ArS, rho, rS);


           blas::axpy(1.-rho, xS_old, xS);

           r2 = blas::axpyNorm(1.-rho, rS_old, rS);


           blas::copy(xS_old, tmpS);

           blas::copy(rS_old, tmp2S);

         }

       }


       k++;


       if (use_heavy_quark_res && k%heavy_quark_check==0) {

         heavy_quark_res_old = heavy_quark_res;

         if (mixed_precision) {

           blas::copy(tmpS,y);

           heavy_quark_res = sqrt(blas::xpyHeavyQuarkResidualNorm(xS, tmpS, rS).z);

         } else {

           heavy_quark_res = sqrt(blas::HeavyQuarkResidualNorm(xS, rS).z);

         }

       }


       // reliable update conditions

       if (mixed_precision) {

         rNorm = sqrt(r2);

         if (rNorm > maxrx) maxrx = rNorm;

         if (rNorm > maxrr) maxrr = rNorm;

         bool update = (rNorm < delta*r0Norm && r0Norm <= maxrx); // condition for x

         update = ( update || (rNorm < delta*maxrr && r0Norm <= maxrr)); // condition for r


         // force a reliable update if we are within target tolerance (only if doing reliable updates)

         if ( convergence(r2, heavy_quark_res, stop, param.tol_hq) && param.delta >= param.tol ) update = true;


         // For heavy-quark inversion force a reliable update if we continue after

         if ( use_heavy_quark_res and L2breakdown and convergenceHQ(r2, heavy_quark_res, stop, param.tol_hq) and param.delta >= param.tol ) {

           update = true;

         }


         if (update) {

           // updating the "new" vectors

           blas::copy(x, xS);

           blas::xpy(x, y);

           mat(r, y, x, tmp); //  here we can use x as tmp

           r2 = blas::xmyNorm(b, r);

           param.true_res = sqrt(r2 / b2);

           if (use_heavy_quark_res) {

             heavy_quark_res = sqrt(blas::HeavyQuarkResidualNorm(y, r).z);

             param.true_res_hq = heavy_quark_res;

           }

           rNorm = sqrt(r2);

           r0Norm = sqrt(r2);

           maxrr = rNorm;

           maxrx = rNorm;

           // we update sloppy and old fields

           if (!convergence(r2, heavy_quark_res, stop, param.tol_hq)) {

             blas::copy(rS, r);

             blas::axpy(-1., xS, xS_old);

             // we preserve the orthogonality between the previous residual and the new

             Complex rr_old = blas::cDotProduct(rS, rS_old);

             r2_old = blas::caxpyNorm(-rr_old/r2, rS, rS_old);

             blas::zero(xS);

           }

         }


         // break-out check if we have reached the limit of the precision

         if (sqrt(r2) > r0Norm) {

           resIncrease++;

           resIncreaseTotal++;

           warningQuda(

             "CG3: new reliable residual norm %e is greater than previous reliable residual norm %e (total #inc %i)",

             sqrt(r2), r0Norm, resIncreaseTotal);

           if (resIncrease > maxResIncrease or resIncreaseTotal > maxResIncreaseTotal) {

             if (use_heavy_quark_res) {

               L2breakdown = true;

             } else {

               warningQuda("CG3: solver exiting due to too many true residual norm increases");

               break;

             }

           }

         } else {

           resIncrease = 0;

         }


         // if L2 broke down we turn off reliable updates and restart the CG

         if (use_heavy_quark_res and L2breakdown) {

           delta = 0;

           heavy_quark_check = 1;

           warningQuda("CG3: Restarting without reliable updates for heavy-quark residual");

           restart = true;

           L2breakdown = false;

           if (heavy_quark_res > heavy_quark_res_old) {

             hqresIncrease++;

             warningQuda("CG3: new reliable HQ residual norm %e is greater than previous reliable residual norm %e", heavy_quark_res, heavy_quark_res_old);

             // break out if we do not improve here anymore

             if (hqresIncrease > hqmaxresIncrease) {

               warningQuda("CG3: solver exiting due to too many heavy quark residual norm increases");

               break;

             }

           }

         }

       } else {

         if (convergence(r2, heavy_quark_res, stop, param.tol_hq)) {

           mat(r, x, tmp, tmp2S);

           r2 = blas::xmyNorm(b, r);

           r0Norm = sqrt(r2);

           // we update sloppy and old fields

           if (!convergence(r2, heavy_quark_res, stop, param.tol_hq)) {

             // we preserve the orthogonality between the previous residual and the new

             Complex rr_old = blas::cDotProduct(rS, rS_old);

             r2_old = blas::caxpyNorm(-rr_old/r2, rS, rS_old);

           }

         }


         // break-out check if we have reached the limit of the precision

         if (sqrt(r2) > r0Norm) {

           resIncrease++;

           resIncreaseTotal++;

           warningQuda(

             "CG3: new reliable residual norm %e is greater than previous reliable residual norm %e (total #inc %i)",

             sqrt(r2), r0Norm, resIncreaseTotal);

           if (resIncrease > maxResIncrease or resIncreaseTotal > maxResIncreaseTotal) {

               warningQuda("CG3: solver exiting due to too many true residual norm increases");

               break;

           }

         }

       }


       PrintStats("CG3", k, r2, b2, heavy_quark_res);

     }


     if (mixed_precision) blas::copy(x, y);

     profile.TPSTOP(QUDA_PROFILE_COMPUTE);

     profile.TPSTART(QUDA_PROFILE_EPILOGUE);


     param.secs = profile.Last(QUDA_PROFILE_COMPUTE);

     double gflops = (blas::flops + mat.flops() + matSloppy.flops())*1e-9;

     param.gflops = gflops;

     param.iter += k;


     if (k == param.maxiter)

       warningQuda("Exceeded maximum iterations %d", param.maxiter);


     // compute the true residuals

     if (!mixed_precision && param.compute_true_res) {

       mat(r, x, y, tmp);

       param.true_res = sqrt(blas::xmyNorm(b, r) / b2);

       if (use_heavy_quark_res) param.true_res_hq = sqrt(blas::HeavyQuarkResidualNorm(x, r).z);

     }


     if(param.preserve_source == QUDA_PRESERVE_SOURCE_NO) {

       blas::copy(b, r);

     }


     PrintSummary("CG3", k, r2, b2, stop, param.tol_hq);


     // reset the flops counters

     blas::flops = 0;

     mat.flops();

     matSloppy.flops();


     profile.TPSTOP(QUDA_PROFILE_EPILOGUE);

   }


 } // namespace quda

blas_quda.h

quda::CG3
Definition: invert_quda.h:719

quda::CG3::~CG3
virtual ~CG3()
Definition: inv_cg3_quda.cpp:23

quda::CG3::CG3
CG3(const DiracMatrix &mat, const DiracMatrix &matSloppy, const DiracMatrix &matPrecon, SolverParam &param, TimeProfile &profile)
Definition: inv_cg3_quda.cpp:16

quda::CG3::operator()
void operator()(ColorSpinorField &out, ColorSpinorField &in)
Definition: inv_cg3_quda.cpp:203

quda::CG3NE::CG3NE
CG3NE(const DiracMatrix &mat, const DiracMatrix &matSloppy, const DiracMatrix &matPrecon, SolverParam &param, TimeProfile &profile)
Definition: inv_cg3_quda.cpp:43

quda::CG3NE::~CG3NE
virtual ~CG3NE()
Definition: inv_cg3_quda.cpp:55

quda::CG3NE::operator()
void operator()(ColorSpinorField &out, ColorSpinorField &in)
Definition: inv_cg3_quda.cpp:65

quda::CG3NR::CG3NR
CG3NR(const DiracMatrix &mat, const DiracMatrix &matSloppy, const DiracMatrix &matPrecon, SolverParam &param, TimeProfile &profile)
Definition: inv_cg3_quda.cpp:132

quda::CG3NR::~CG3NR
virtual ~CG3NR()
Definition: inv_cg3_quda.cpp:143

quda::CG3NR::operator()
void operator()(ColorSpinorField &out, ColorSpinorField &in)
Definition: inv_cg3_quda.cpp:152

quda::ColorSpinorField
Definition: color_spinor_field.h:379

quda::ColorSpinorField::Create
static ColorSpinorField * Create(const ColorSpinorParam &param)
Definition: color_spinor_field.cpp:714

quda::ColorSpinorParam
Definition: color_spinor_field.h:131

quda::Dirac::M
virtual void M(ColorSpinorField &out, const ColorSpinorField &in) const =0
Apply M for the dirac op. E.g. the Schur Complement operator.

quda::Dirac::Mdag
void Mdag(ColorSpinorField &out, const ColorSpinorField &in) const
Apply Mdag (daggered operator of M.
Definition: dirac.cpp:92

quda::DiracMatrix
Definition: dirac_quda.h:1892

quda::DiracMatrix::Expose
const Dirac * Expose() const
Definition: dirac_quda.h:1964

quda::DiracMatrix::isStaggered
bool isStaggered() const
return if the operator is a staggered operator
Definition: dirac_quda.h:1935

quda::DiracMatrix::flops
unsigned long long flops() const
Definition: dirac_quda.h:1909

quda::LatticeField::Precision
QudaPrecision Precision() const
Definition: lattice_field.h:567

quda::Solver
Definition: invert_quda.h:462

quda::Solver::profile
TimeProfile & profile
Definition: invert_quda.h:471

quda::Solver::mat
const DiracMatrix & mat
Definition: invert_quda.h:465

quda::Solver::convergence
bool convergence(double r2, double hq2, double r2_tol, double hq_tol)
Definition: solver.cpp:328

quda::Solver::convergenceHQ
bool convergenceHQ(double r2, double hq2, double r2_tol, double hq_tol)
Test for HQ solver convergence – ignore L2 residual.
Definition: solver.cpp:348

quda::Solver::PrintSummary
void PrintSummary(const char *name, int k, double r2, double b2, double r2_tol, double hq_tol)
Prints out the summary of the solver convergence (requires a verbosity of QUDA_SUMMARIZE)....
Definition: solver.cpp:386

quda::Solver::param
SolverParam & param
Definition: invert_quda.h:470

quda::Solver::stopping
static double stopping(double tol, double b2, QudaResidualType residual_type)
Set the solver L2 stopping condition.
Definition: solver.cpp:311

quda::Solver::PrintStats
void PrintStats(const char *name, int k, double r2, double b2, double hq2)
Prints out the running statistics of the solver (requires a verbosity of QUDA_VERBOSE)
Definition: solver.cpp:373

quda::Solver::matSloppy
const DiracMatrix & matSloppy
Definition: invert_quda.h:466

quda::TimeProfile
Definition: timer.h:174

quda::TimeProfile::Last
double Last(QudaProfileType idx)
Definition: timer.h:254

pipeline
int pipeline
Definition: command_line_params.cpp:55

mat
void mat(void *out, void **link, void *in, int dagger_bit, int mu, QudaPrecision sPrecision, QudaPrecision gPrecision)
Definition: covdev_reference.cpp:109

tmp
cudaColorSpinorField * tmp
Definition: covdev_test.cpp:34

dslash_quda.h

QUDA_CUDA_FIELD_LOCATION
@ QUDA_CUDA_FIELD_LOCATION
Definition: enum_quda.h:326

QUDA_USE_INIT_GUESS_NO
@ QUDA_USE_INIT_GUESS_NO
Definition: enum_quda.h:429

QUDA_USE_INIT_GUESS_YES
@ QUDA_USE_INIT_GUESS_YES
Definition: enum_quda.h:430

QUDA_HEAVY_QUARK_RESIDUAL
@ QUDA_HEAVY_QUARK_RESIDUAL
Definition: enum_quda.h:195

QUDA_PRESERVE_SOURCE_NO
@ QUDA_PRESERVE_SOURCE_NO
Definition: enum_quda.h:238

QUDA_PRESERVE_SOURCE_YES
@ QUDA_PRESERVE_SOURCE_YES
Definition: enum_quda.h:239

QUDA_ZERO_FIELD_CREATE
@ QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:361

QUDA_NULL_FIELD_CREATE
@ QUDA_NULL_FIELD_CREATE
Definition: enum_quda.h:360

QUDA_COMPUTE_NULL_VECTOR_NO
@ QUDA_COMPUTE_NULL_VECTOR_NO
Definition: enum_quda.h:441

invert_quda.h

checkLocation
#define checkLocation(...)
Definition: lattice_field.h:760

quda::blas_lapack::native::init
void init()
Create the BLAS context.
Definition: blas_lapack_cublas.cpp:28

quda::blas::quadrupleCG3UpdateNorm
double quadrupleCG3UpdateNorm(double a, double b, ColorSpinorField &x, ColorSpinorField &y, ColorSpinorField &z, ColorSpinorField &w, ColorSpinorField &v)

quda::blas::HeavyQuarkResidualNorm
double3 HeavyQuarkResidualNorm(ColorSpinorField &x, ColorSpinorField &r)

quda::blas::xmyNorm
double xmyNorm(ColorSpinorField &x, ColorSpinorField &y)
Definition: blas_quda.h:79

quda::blas::flops
unsigned long long flops

quda::blas::quadrupleCG3InitNorm
double quadrupleCG3InitNorm(double a, ColorSpinorField &x, ColorSpinorField &y, ColorSpinorField &z, ColorSpinorField &w, ColorSpinorField &v)

quda::blas::xpyHeavyQuarkResidualNorm
double3 xpyHeavyQuarkResidualNorm(ColorSpinorField &x, ColorSpinorField &y, ColorSpinorField &r)

quda::blas::caxpyNorm
double caxpyNorm(const Complex &a, ColorSpinorField &x, ColorSpinorField &y)

quda::blas::zero
void zero(ColorSpinorField &a)

quda::blas::norm2
double norm2(const ColorSpinorField &a)

quda::blas::reDotProduct
double reDotProduct(ColorSpinorField &x, ColorSpinorField &y)

quda::blas::axpyNorm
double axpyNorm(double a, ColorSpinorField &x, ColorSpinorField &y)
Definition: blas_quda.h:78

quda::blas::axpy
void axpy(double a, ColorSpinorField &x, ColorSpinorField &y)
Definition: blas_quda.h:43

quda::blas::xpy
void xpy(ColorSpinorField &x, ColorSpinorField &y)
Definition: blas_quda.h:41

quda::blas::copy
void copy(ColorSpinorField &dst, const ColorSpinorField &src)
Definition: blas_quda.h:24

quda::blas::cDotProduct
Complex cDotProduct(ColorSpinorField &, ColorSpinorField &)

quda::blas::axpby
void axpby(double a, ColorSpinorField &x, double b, ColorSpinorField &y)
Definition: blas_quda.h:44

quda::device::profile::stop
void stop()
Stop profiling.
Definition: device.cpp:228

quda
Definition: blas_lapack.h:24

quda::Complex
std::complex< double > Complex
Definition: quda_internal.h:86

quda::sqrt
__host__ __device__ ValueType sqrt(ValueType x)
Definition: complex_quda.h:120

quda::QUDA_PROFILE_INIT
@ QUDA_PROFILE_INIT
Definition: timer.h:106

quda::QUDA_PROFILE_EPILOGUE
@ QUDA_PROFILE_EPILOGUE
Definition: timer.h:110

quda::QUDA_PROFILE_COMPUTE
@ QUDA_PROFILE_COMPUTE
Definition: timer.h:108

quda::QUDA_PROFILE_PREAMBLE
@ QUDA_PROFILE_PREAMBLE
Definition: timer.h:107

csParam
ColorSpinorParam csParam
Definition: pack_test.cpp:25

param
QudaGaugeParam param
Definition: pack_test.cpp:18

quda_internal.h

quda::SolverParam
Definition: invert_quda.h:17

quda::SolverParam::preserve_source
QudaPreserveSource preserve_source
Definition: invert_quda.h:151

quda::SolverParam::iter
int iter
Definition: invert_quda.h:133

quda::SolverParam::Nsteps
int Nsteps
Definition: invert_quda.h:187

quda::SolverParam::precision
QudaPrecision precision
Definition: invert_quda.h:136

quda::SolverParam::compute_null_vector
QudaComputeNullVector compute_null_vector
Definition: invert_quda.h:61

quda::SolverParam::pipeline
int pipeline
Definition: invert_quda.h:106

quda::SolverParam::true_res
double true_res
Definition: invert_quda.h:124

quda::SolverParam::max_res_increase_total
int max_res_increase_total
Definition: invert_quda.h:90

quda::SolverParam::residual_type
QudaResidualType residual_type
Definition: invert_quda.h:49

quda::SolverParam::precision_sloppy
QudaPrecision precision_sloppy
Definition: invert_quda.h:139

quda::SolverParam::true_res_hq
double true_res_hq
Definition: invert_quda.h:127

quda::SolverParam::max_res_increase
int max_res_increase
Definition: invert_quda.h:85

quda::SolverParam::use_init_guess
QudaUseInitGuess use_init_guess
Definition: invert_quda.h:58

quda::SolverParam::secs
double secs
Definition: invert_quda.h:217

quda::SolverParam::maxiter
int maxiter
Definition: invert_quda.h:130

quda::SolverParam::tol_hq
double tol_hq
Definition: invert_quda.h:115

quda::SolverParam::gflops
double gflops
Definition: invert_quda.h:220

quda::SolverParam::heavy_quark_check
int heavy_quark_check
Definition: invert_quda.h:103

quda::SolverParam::compute_true_res
bool compute_true_res
Definition: invert_quda.h:118

quda::SolverParam::tol
double tol
Definition: invert_quda.h:109

quda::SolverParam::delta
double delta
Definition: invert_quda.h:64

util_quda.h

printfQuda
#define printfQuda(...)
Definition: util_quda.h:114

warningQuda
#define warningQuda(...)
Definition: util_quda.h:132

errorQuda
#define errorQuda(...)
Definition: util_quda.h:120