quda-ref/v0.7.0/inv__mr__quda_8cpp_source.html

 #include <stdio.h>

 #include <stdlib.h>

 #include <math.h>


 #include <complex>


 #include <quda_internal.h>

 #include <blas_quda.h>

 #include <dslash_quda.h>

 #include <invert_quda.h>

 #include <util_quda.h>


 #include<face_quda.h>


 #include <color_spinor_field.h>


 namespace quda {


   MR::MR(DiracMatrix &mat, SolverParam &param, TimeProfile &profile) :

     Solver(param, profile), mat(mat), init(false), allocate_r(false)

   {


   }


   MR::~MR() {

     if (param.inv_type_precondition != QUDA_GCR_INVERTER) profile.Start(QUDA_PROFILE_FREE);

     if (init) {

       if (allocate_r) delete rp;

       delete Arp;

       delete tmpp;

     }

     if (param.inv_type_precondition != QUDA_GCR_INVERTER) profile.Stop(QUDA_PROFILE_FREE);

   }


   void MR::operator()(cudaColorSpinorField &x, cudaColorSpinorField &b)

   {


     globalReduce = false; // use local reductions for DD solver


     if (!init) {

       ColorSpinorParam csParam(x);

       csParam.create = QUDA_ZERO_FIELD_CREATE;

       if (param.preserve_source == QUDA_PRESERVE_SOURCE_YES) {

         rp = new cudaColorSpinorField(x, csParam);

         allocate_r = true;

       }

       Arp = new cudaColorSpinorField(x);

       tmpp = new cudaColorSpinorField(x, csParam); //temporary for mat-vec


       init = true;

     }

     cudaColorSpinorField &r =

       (param.preserve_source == QUDA_PRESERVE_SOURCE_YES) ? *rp : b;

     cudaColorSpinorField &Ar = *Arp;

     cudaColorSpinorField &tmp = *tmpp;


     // set initial guess to zero and thus the residual is just the source

     zeroCuda(x);  // can get rid of this for a special first update kernel

     double b2 = normCuda(b);

     if (&r != &b) copyCuda(r, b);


     // domain-wise normalization of the initial residual to prevent underflow

     double r2=0.0; // if zero source then we will exit immediately doing no work

     if (b2 > 0.0) {

       axCuda(1/sqrt(b2), r); // can merge this with the prior copy

       r2 = 1.0; // by definition by this is now true

     }


     if (param.inv_type_precondition != QUDA_GCR_INVERTER) {

       quda::blas_flops = 0;

       profile.Start(QUDA_PROFILE_COMPUTE);

     }


     double omega = 1.0;


     int k = 0;

     if (getVerbosity() >= QUDA_DEBUG_VERBOSE) {

       double x2 = norm2(x);

       double3 Ar3 = cDotProductNormBCuda(Ar, r);

       printfQuda("MR: %d iterations, r2 = %e, <r|A|r> = (%e, %e), x2 = %e\n",

                  k, Ar3.z, Ar3.x, Ar3.y, x2);

     }


     while (k < param.maxiter && r2 > 0.0) {


       mat(Ar, r, tmp);


       double3 Ar3 = cDotProductNormACuda(Ar, r);

       Complex alpha = Complex(Ar3.x, Ar3.y) / Ar3.z;


       // x += omega*alpha*r, r -= omega*alpha*Ar, r2 = norm2(r)

       //r2 = caxpyXmazNormXCuda(omega*alpha, r, x, Ar);

       caxpyXmazCuda(omega*alpha, r, x, Ar);


       if (getVerbosity() >= QUDA_DEBUG_VERBOSE) {

         double x2 = norm2(x);

         double r2 = norm2(r);

         printfQuda("MR: %d iterations, r2 = %e, <r|A|r> = (%e,%e) x2 = %e\n",

                    k+1, r2, Ar3.x, Ar3.y, x2);

       } else if (getVerbosity() >= QUDA_VERBOSE) {

         printfQuda("MR: %d iterations, <r|A|r> = (%e, %e)\n", k, Ar3.x, Ar3.y);

       }


       k++;

     }


     if (getVerbosity() >= QUDA_VERBOSE) {

       mat(Ar, r, tmp);

       Complex Ar2 = cDotProductCuda(Ar, r);

       printfQuda("MR: %d iterations, <r|A|r> = (%e, %e)\n", k, real(Ar2), imag(Ar2));

     }


     // Obtain global solution by rescaling

     if (b2 > 0.0) axCuda(sqrt(b2), x);


     if (param.inv_type_precondition != QUDA_GCR_INVERTER) {

         profile.Stop(QUDA_PROFILE_COMPUTE);

         profile.Start(QUDA_PROFILE_EPILOGUE);

         param.secs += profile.Last(QUDA_PROFILE_COMPUTE);


         double gflops = (quda::blas_flops + mat.flops())*1e-9;

         reduceDouble(gflops);


         param.gflops += gflops;

         param.iter += k;


         // Calculate the true residual

         r2 = norm2(r);

         mat(r, x);

         double true_res = xmyNormCuda(b, r);

         param.true_res = sqrt(true_res / b2);


         if (getVerbosity() >= QUDA_SUMMARIZE) {

           printfQuda("MR: Converged after %d iterations, relative residua: iterated = %e, true = %e\n",

                      k, sqrt(r2/b2), param.true_res);

         }


         // reset the flops counters

         quda::blas_flops = 0;

         mat.flops();

         profile.Stop(QUDA_PROFILE_EPILOGUE);

     }


     globalReduce = true; // renable global reductions for outer solver


     return;

   }


 } // namespace quda

invert_quda.h

QUDA_VERBOSE
Definition: enum_quda.h:217

QUDA_GCR_INVERTER
Definition: enum_quda.h:100

QUDA_PRESERVE_SOURCE_YES
Definition: enum_quda.h:190

getVerbosity
QudaVerbosity getVerbosity()
Definition: util_quda.cpp:20

quda::QUDA_PROFILE_FREE
Definition: quda_internal.h:150

color_spinor_field.h

quda::SolverParam::secs
double secs
Definition: invert_quda.h:140

quda::sqrt
__host__ __device__ ValueType sqrt(ValueType x)
Definition: complex_quda.h:105

quda::Complex
std::complex< double > Complex
Definition: eig_variables.h:13

QUDA_SUMMARIZE
Definition: enum_quda.h:216

quda::MR::MR
MR(DiracMatrix &mat, SolverParam &param, TimeProfile &profile)
Definition: inv_mr_quda.cpp:19

quda::MR::operator()
void operator()(cudaColorSpinorField &out, cudaColorSpinorField &in)
Definition: inv_mr_quda.cpp:35

mat
void mat(void *out, void **fatlink, void **longlink, void *in, double kappa, int dagger_bit, QudaPrecision sPrecision, QudaPrecision gPrecision)
Definition: staggered_dslash_reference.cpp:136

quda::Solver::profile
TimeProfile & profile
Definition: invert_quda.h:224

quda::cudaColorSpinorField
Definition: color_spinor_field.h:302

x2
int x2
Definition: asym_wilson_clover_dslash_dagger_fermi_core.h:393

quda::SolverParam::inv_type_precondition
QudaInverterType inv_type_precondition
Definition: invert_quda.h:24

util_quda.h

quda::SolverParam::preserve_source
QudaPreserveSource preserve_source
Definition: invert_quda.h:90

quda::SolverParam::iter
int iter
Definition: invert_quda.h:78

quda::TimeProfile
Definition: quda_internal.h:171

quda::cDotProductNormBCuda
double3 cDotProductNormBCuda(cudaColorSpinorField &a, cudaColorSpinorField &b)
Definition: reduce_quda.cu:620

quda::DiracMatrix::flops
unsigned long long flops() const
Definition: dirac_quda.h:587

param
QudaGaugeParam param
Definition: pack_test.cpp:17

tmp
cudaColorSpinorField * tmp
Definition: staggered_dslash_test.cpp:48

quda::caxpyXmazCuda
void caxpyXmazCuda(const Complex &a, cudaColorSpinorField &x, cudaColorSpinorField &y, cudaColorSpinorField &z)
Definition: blas_quda.cu:452

quda::SolverParam::gflops
double gflops
Definition: invert_quda.h:143

quda::cDotProductCuda
Complex cDotProductCuda(cudaColorSpinorField &, cudaColorSpinorField &)
Definition: reduce_quda.cu:468

quda::QUDA_PROFILE_EPILOGUE
Definition: quda_internal.h:149

csParam
ColorSpinorParam csParam
Definition: pack_test.cpp:24

face_quda.h

quda::QUDA_PROFILE_COMPUTE
Definition: quda_internal.h:148

quda::copyCuda
void copyCuda(cudaColorSpinorField &dst, const cudaColorSpinorField &src)
Definition: copy_quda.cu:235

quda::normCuda
double normCuda(const cudaColorSpinorField &b)
Definition: reduce_quda.cu:145

x
int x[4]
Definition: hisq_paths_force_core.h:99

quda::blas_flops
unsigned long long blas_flops
Definition: blas_quda.cu:37

blas_quda.h

quda::SolverParam::true_res
double true_res
Definition: invert_quda.h:69

quda::Solver
Definition: invert_quda.h:220

QUDA_DEBUG_VERBOSE
Definition: enum_quda.h:218

quda::ColorSpinorParam
Definition: color_spinor_field.h:14

quda::Solver::param
SolverParam & param
Definition: invert_quda.h:223

quda::TimeProfile::Stop
void Stop(QudaProfileType idx)
Definition: quda_internal.h:194

quda::TimeProfile::Last
double Last(QudaProfileType idx)
Definition: quda_internal.h:204

quda::DiracMatrix
Definition: dirac_quda.h:571

reduceDouble
void reduceDouble(double &)
Definition: face_buffer.cpp:530

dslash_quda.h

printfQuda
#define printfQuda(...)
Definition: util_quda.h:67

quda::zeroCuda
void zeroCuda(cudaColorSpinorField &a)
Definition: blas_quda.cu:40

quda::cDotProductNormACuda
double3 cDotProductNormACuda(cudaColorSpinorField &a, cudaColorSpinorField &b)
Definition: reduce_quda.cu:591

quda::MR::~MR
virtual ~MR()
Definition: inv_mr_quda.cpp:25

quda::TimeProfile::Start
void Start(QudaProfileType idx)
Definition: quda_internal.h:184

init
void init(int argc, char **argv)
Definition: dslash_test.cpp:79

QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:304

quda::ColorSpinorParam::create
QudaFieldCreate create
Definition: color_spinor_field.h:25

quda::SolverParam
Definition: invert_quda.h:14

quda::axCuda
void axCuda(const double &a, cudaColorSpinorField &x)
Definition: blas_quda.cu:171

quda::norm2
double norm2(const ColorSpinorField &)
Definition: color_spinor_field.cpp:486

quda::xmyNormCuda
double xmyNormCuda(cudaColorSpinorField &a, cudaColorSpinorField &b)
Definition: reduce_quda.cu:343

globalReduce
bool globalReduce
Definition: face_buffer.cpp:11

quda_internal.h