v0.9.0/doc/dirac__coarse_8cpp_source.html

 #include <string.h>
 #include <multigrid.h>
 #include <algorithm>

 namespace quda {

   DiracCoarse::DiracCoarse(const DiracParam &param, bool enable_gpu)
     : Dirac(param), mu(param.mu), mu_factor(param.mu_factor), transfer(param.transfer), dirac(param.dirac),
       Y_h(nullptr), X_h(nullptr), Xinv_h(nullptr), Yhat_h(nullptr),
       Y_d(nullptr), X_d(nullptr), Xinv_d(nullptr), Yhat_d(nullptr),
       enable_gpu(enable_gpu), init(true)
   {
     initializeCoarse();
   }

   DiracCoarse::DiracCoarse(const DiracParam &param,
          cpuGaugeField *Y_h, cpuGaugeField *X_h, cpuGaugeField *Xinv_h, cpuGaugeField *Yhat_h,   // cpu link fields
          cudaGaugeField *Y_d, cudaGaugeField *X_d, cudaGaugeField *Xinv_d, cudaGaugeField *Yhat_d) // gpu link field
     : Dirac(param), mu(param.mu), mu_factor(param.mu_factor), transfer(nullptr), dirac(nullptr),
       Y_h(Y_h), X_h(X_h), Xinv_h(Xinv_h), Yhat_h(Yhat_h),
       Y_d(Y_d), X_d(X_d), Xinv_d(Xinv_d), Yhat_d(Yhat_d),
       enable_gpu(Y_d && X_d && Xinv_d), init(false)
   {

   }

   DiracCoarse::DiracCoarse(const DiracCoarse &dirac, const DiracParam &param)
     : Dirac(param), mu(param.mu), mu_factor(param.mu_factor), transfer(param.transfer), dirac(param.dirac),
       Y_h(dirac.Y_h), X_h(dirac.X_h), Xinv_h(dirac.Xinv_h), Yhat_h(dirac.Yhat_h),
       Y_d(dirac.Y_d), X_d(dirac.X_d), Xinv_d(dirac.Xinv_d), Yhat_d(dirac.Yhat_d),
       enable_gpu(dirac.enable_gpu), init(false)
   {

   }

   DiracCoarse::~DiracCoarse()
   {
     if (init) {
       if (Y_h) delete Y_h;
       if (X_h) delete X_h;
       if (Xinv_h) delete Xinv_h;
       if (Yhat_h) delete Yhat_h;
       if (Y_d) delete Y_d;
       if (X_d) delete X_d;
       if (Xinv_d) delete Xinv_d;
       if (Yhat_d) delete Yhat_d;
     }
   }

   void DiracCoarse::initializeCoarse()
   {
     QudaPrecision prec = transfer->Vectors().Precision();
     int ndim = transfer->Vectors().Ndim();
     int x[QUDA_MAX_DIM];
     //Number of coarse sites.
     const int *geo_bs = transfer->Geo_bs();
     for (int i = 0; i < ndim; i++) x[i] = transfer->Vectors().X(i)/geo_bs[i];

     //Coarse Color
     int Nc_c = transfer->nvec();

     //Coarse Spin
     int Ns_c = transfer->Vectors().Nspin()/transfer->Spin_bs();

     GaugeFieldParam gParam;
     memcpy(gParam.x, x, QUDA_MAX_DIM*sizeof(int));
     gParam.nColor = Nc_c*Ns_c;
     gParam.reconstruct = QUDA_RECONSTRUCT_NO;
     gParam.order = QUDA_QDP_GAUGE_ORDER;
     gParam.link_type = QUDA_COARSE_LINKS;
     gParam.t_boundary = QUDA_PERIODIC_T;
     gParam.create = QUDA_ZERO_FIELD_CREATE;
     gParam.precision = prec;
     gParam.nDim = ndim;
     gParam.siteSubset = QUDA_FULL_SITE_SUBSET;
     gParam.ghostExchange = QUDA_GHOST_EXCHANGE_PAD;
     gParam.nFace = 1;

     gParam.geometry = QUDA_COARSE_GEOMETRY;

     Y_h = new cpuGaugeField(gParam);
     Yhat_h = new cpuGaugeField(gParam);

     gParam.ghostExchange = QUDA_GHOST_EXCHANGE_NO;
     gParam.nFace = 0;

     gParam.geometry = QUDA_SCALAR_GEOMETRY;
     X_h = new cpuGaugeField(gParam);
     Xinv_h = new cpuGaugeField(gParam);

     if (enable_gpu) {
       gParam.ghostExchange = QUDA_GHOST_EXCHANGE_PAD;
       gParam.nFace = 1;
       gParam.order = QUDA_FLOAT2_GAUGE_ORDER;
       gParam.geometry = QUDA_COARSE_GEOMETRY;
       int pad = std::max( { (x[0]*x[1]*x[2])/2, (x[1]*x[2]*x[3])/2, (x[0]*x[2]*x[3])/2, (x[0]*x[1]*x[3])/2 } );
       gParam.pad = gParam.nFace * pad * 2; // factor of 2 since we have to store bi-directional ghost zone
       Y_d = new cudaGaugeField(gParam);
       Yhat_d = new cudaGaugeField(gParam);

       gParam.ghostExchange = QUDA_GHOST_EXCHANGE_NO;
       gParam.nFace = 0;
       gParam.pad = 0;

       gParam.geometry = QUDA_SCALAR_GEOMETRY;
       gParam.ghostExchange = QUDA_GHOST_EXCHANGE_NO;
       X_d = new cudaGaugeField(gParam);
       Xinv_d = new cudaGaugeField(gParam);
     }

     bool gpu_setup = true;

     if (enable_gpu && gpu_setup) dirac->createCoarseOp(*Y_d,*X_d,*Xinv_d,*Yhat_d,*transfer,kappa,Mu(),MuFactor());
     else dirac->createCoarseOp(*Y_h,*X_h,*Xinv_h,*Yhat_h,*transfer,kappa,Mu(),MuFactor());

     if (enable_gpu) {
       if (gpu_setup) {
   Y_h->copy(*Y_d);
   Yhat_h->copy(*Yhat_d);
   X_h->copy(*X_d);
   Xinv_h->copy(*Xinv_d);
       } else {
   Y_d->copy(*Y_h);
   Yhat_d->copy(*Yhat_h);
   X_d->copy(*X_h);
   Xinv_d->copy(*Xinv_h);
       }
     }

   }

   void DiracCoarse::Clover(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
   {
     if (&in == &out) errorQuda("Fields cannot alias");
     if (checkLocation(out,in) == QUDA_CUDA_FIELD_LOCATION) {
       if (!enable_gpu) errorQuda("Cannot apply %s on GPU since enable_gpu has not been set", __func__);
       ApplyCoarse(out, in, in, *Y_d, *X_d, kappa, parity, false, true, dagger);
     } else if ( checkLocation(out, in) == QUDA_CPU_FIELD_LOCATION ) {
       ApplyCoarse(out, in, in, *Y_h, *X_h, kappa, parity, false, true, dagger);
     }
     int n = in.Nspin()*in.Ncolor();
     flops += (8*n*n-2*n)*(long long)in.VolumeCB();
   }

   void DiracCoarse::CloverInv(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
   {
     if (&in == &out) errorQuda("Fields cannot alias");
     if (checkLocation(out,in) == QUDA_CUDA_FIELD_LOCATION) {
       if (!enable_gpu) errorQuda("Cannot apply %s on GPU since enable_gpu has not been set", __func__);
       ApplyCoarse(out, in, in, *Y_d, *Xinv_d, kappa, parity, false, true, dagger);
     } else if ( checkLocation(out, in) == QUDA_CPU_FIELD_LOCATION ) {
       ApplyCoarse(out, in, in, *Y_h, *Xinv_h, kappa, parity, false, true, dagger);
     }
     int n = in.Nspin()*in.Ncolor();
     flops += (8*n*n-2*n)*(long long)in.VolumeCB();
   }

   void DiracCoarse::Dslash(ColorSpinorField &out, const ColorSpinorField &in,
          const QudaParity parity) const
   {
     if (checkLocation(out,in) == QUDA_CUDA_FIELD_LOCATION) {
       if (!enable_gpu) errorQuda("Cannot apply %s on GPU since enable_gpu has not been set", __func__);
       ApplyCoarse(out, in, in, *Y_d, *X_d, kappa, parity, true, false, dagger);
     } else if ( checkLocation(out, in) == QUDA_CPU_FIELD_LOCATION ) {
       ApplyCoarse(out, in, in, *Y_h, *X_h, kappa, parity, true, false, dagger);
     }
     int n = in.Nspin()*in.Ncolor();
     flops += (8*(8*n*n)-2*n)*(long long)in.VolumeCB()*in.SiteSubset();
   }

   void DiracCoarse::DslashXpay(ColorSpinorField &out, const ColorSpinorField &in,
              const QudaParity parity, const ColorSpinorField &x,
              const double &k) const
   {
     if (k!=1.0) errorQuda("%s not supported for k!=1.0", __func__);

     if (checkLocation(out,in) == QUDA_CUDA_FIELD_LOCATION) {
       if (!enable_gpu) errorQuda("Cannot apply %s on GPU since enable_gpu has not been set", __func__);
       ApplyCoarse(out, in, x, *Y_d, *X_d, kappa, parity, true, true, dagger);
     } else if ( checkLocation(out, in) == QUDA_CPU_FIELD_LOCATION ) {
       ApplyCoarse(out, in, x, *Y_h, *X_h, kappa, parity, true, true, dagger);
     }
     int n = in.Nspin()*in.Ncolor();
     flops += (9*(8*n*n)-2*n)*(long long)in.VolumeCB()*in.SiteSubset();
   }

   void DiracCoarse::M(ColorSpinorField &out, const ColorSpinorField &in) const
   {
     if ( checkLocation(out, in) == QUDA_CUDA_FIELD_LOCATION ) {
       if (!enable_gpu) errorQuda("Cannot apply %s on GPU since enable_gpu has not been set", __func__);
       ApplyCoarse(out, in, in, *Y_d, *X_d, kappa, QUDA_INVALID_PARITY, true, true, dagger);
     } else if ( checkLocation(out, in) == QUDA_CPU_FIELD_LOCATION ) {
       ApplyCoarse(out, in, in, *Y_h, *X_h, kappa, QUDA_INVALID_PARITY, true, true, dagger);
     }
     int n = in.Nspin()*in.Ncolor();
     flops += (9*(8*n*n)-2*n)*(long long)in.VolumeCB()*in.SiteSubset();
   }

   void DiracCoarse::MdagM(ColorSpinorField &out, const ColorSpinorField &in) const
   {
     bool reset1 = newTmp(&tmp1, in);
     if (tmp1->SiteSubset() != QUDA_FULL_SITE_SUBSET) errorQuda("Temporary vector is not full-site vector");

     M(*tmp1, in);
     Mdag(out, *tmp1);

     deleteTmp(&tmp1, reset1);
   }

   void DiracCoarse::prepare(ColorSpinorField* &src, ColorSpinorField* &sol,
           ColorSpinorField &x, ColorSpinorField &b,
           const QudaSolutionType solType) const
   {
     if (solType == QUDA_MATPC_SOLUTION || solType == QUDA_MATPCDAG_MATPC_SOLUTION) {
       errorQuda("Preconditioned solution requires a preconditioned solve_type");
     }

     src = &b;
     sol = &x;
   }

   void DiracCoarse::reconstruct(ColorSpinorField &x, const ColorSpinorField &b,
         const QudaSolutionType solType) const
   {
     /* do nothing */
   }

   //Make the coarse operator one level down.  Pass both the coarse gauge field and coarse clover field.
   void DiracCoarse::createCoarseOp(GaugeField &Y, GaugeField &X, GaugeField &Xinv, GaugeField &Yhat, const Transfer &T, double kappa, double mu, double mu_factor) const
   {
     double a = 2.0 * kappa * mu * T.Vectors().TwistFlavor();
     if (checkLocation(Y, X, Xinv, Yhat) == QUDA_CPU_FIELD_LOCATION) {
       CoarseCoarseOp(Y, X, Xinv, Yhat, T, *(this->Y_h), *(this->X_h), *(this->Xinv_h), kappa, a, mu_factor, QUDA_COARSE_DIRAC, QUDA_MATPC_INVALID);
     } else {
       CoarseCoarseOp(Y, X, Xinv, Yhat, T, *(this->Y_d), *(this->X_d), *(this->Xinv_d), kappa, a, mu_factor, QUDA_COARSE_DIRAC, QUDA_MATPC_INVALID);
     }
   }

   DiracCoarsePC::DiracCoarsePC(const DiracParam &param, bool enable_gpu) : DiracCoarse(param, enable_gpu)
   {
     /* do nothing */
   }

   DiracCoarsePC::DiracCoarsePC(const DiracCoarse &dirac, const DiracParam &param) : DiracCoarse(dirac, param)
   {
     /* do nothing */
   }

   DiracCoarsePC::~DiracCoarsePC() { }

   void DiracCoarsePC::Dslash(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
   {
     if (checkLocation(out,in) == QUDA_CUDA_FIELD_LOCATION) {
       if (!enable_gpu) errorQuda("Cannot apply %s on GPU since enable_gpu has not been set", __func__);
       ApplyCoarse(out, in, in, *Yhat_d, *X_d, kappa, parity, true, false, dagger);
     } else if ( checkLocation(out, in) == QUDA_CPU_FIELD_LOCATION ) {
       ApplyCoarse(out, in, in, *Yhat_h, *X_h, kappa, parity, true, false, dagger);
     }

     int n = in.Nspin()*in.Ncolor();
     flops += (8*(8*n*n)-2*n)*in.VolumeCB()*in.SiteSubset();
   }

   void DiracCoarsePC::DslashXpay(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity,
          const ColorSpinorField &x, const double &k) const
   {
     // emulated for now
     Dslash(out, in, parity);
     blas::xpay(const_cast<ColorSpinorField&>(x), k, out);

     int n = in.Nspin()*in.Ncolor();
     flops += (8*(8*n*n)-2*n)*in.VolumeCB(); // blas flops counted separately so only need to count dslash flops
   }

   void DiracCoarsePC::M(ColorSpinorField &out, const ColorSpinorField &in) const
   {
     bool reset1 = newTmp(&tmp1, in);

     if (in.SiteSubset() == QUDA_FULL_SITE_SUBSET || out.SiteSubset() == QUDA_FULL_SITE_SUBSET ||
   tmp1->SiteSubset() == QUDA_FULL_SITE_SUBSET)
       errorQuda("Cannot apply preconditioned operator to full field (subsets = %d %d %d)",
     in.SiteSubset(), out.SiteSubset(), tmp1->SiteSubset());

     if (matpcType == QUDA_MATPC_EVEN_EVEN_ASYMMETRIC) {
       // DiracCoarsePC::Dslash applies A^{-1}Dslash
       Dslash(*tmp1, in, QUDA_ODD_PARITY);
       // DiracCoarse::DslashXpay applies (A - D) // FIXME this ignores the -1
       DiracCoarse::Dslash(out, *tmp1, QUDA_EVEN_PARITY);
       Clover(*tmp1, in, QUDA_EVEN_PARITY);
       blas::xpay(*tmp1, -1.0, out);
     } else if (matpcType == QUDA_MATPC_ODD_ODD_ASYMMETRIC) {
       // DiracCoarsePC::Dslash applies A^{-1}Dslash
       Dslash(*tmp1, in, QUDA_EVEN_PARITY);
       // DiracCoarse::DslashXpay applies (A - D) // FIXME this ignores the -1
       DiracCoarse::Dslash(out, *tmp1, QUDA_ODD_PARITY);
       Clover(*tmp1, in, QUDA_ODD_PARITY);
       blas::xpay(*tmp1, -1.0, out);
     } else if (matpcType == QUDA_MATPC_EVEN_EVEN) {
       Dslash(*tmp1, in, QUDA_ODD_PARITY);
       DslashXpay(out, *tmp1, QUDA_EVEN_PARITY, in, -1.0);
     } else if (matpcType == QUDA_MATPC_ODD_ODD) {
       Dslash(*tmp1, in, QUDA_EVEN_PARITY);
       DslashXpay(out, *tmp1, QUDA_ODD_PARITY, in, -1.0);
     } else {
       errorQuda("MatPCType %d not valid for DiracCoarsePC", matpcType);
     }

     deleteTmp(&tmp1, reset1);
   }

   void DiracCoarsePC::MdagM(ColorSpinorField &out, const ColorSpinorField &in) const
   {
     bool reset1 = newTmp(&tmp2, in);
     M(*tmp2, in);
     Mdag(out, *tmp2);
     deleteTmp(&tmp2, reset1);
   }

   void DiracCoarsePC::prepare(ColorSpinorField* &src, ColorSpinorField* &sol, ColorSpinorField &x, ColorSpinorField &b,
             const QudaSolutionType solType) const
   {
     // we desire solution to preconditioned system
     if (solType == QUDA_MATPC_SOLUTION || solType == QUDA_MATPCDAG_MATPC_SOLUTION) {
       src = &b;
       sol = &x;
       return;
     }

     bool reset = newTmp(&tmp1, b.Even());

     // we desire solution to full system
     if (matpcType == QUDA_MATPC_EVEN_EVEN) {
       // src = A_ee^-1 (b_e - D_eo A_oo^-1 b_o)
       src = &(x.Odd());
       CloverInv(*src, b.Odd(), QUDA_ODD_PARITY);
       DiracCoarse::Dslash(*tmp1, *src, QUDA_EVEN_PARITY);
       blas::xpay(const_cast<ColorSpinorField&>(b.Even()), -1.0, *tmp1);
       CloverInv(*src, *tmp1, QUDA_EVEN_PARITY);
       sol = &(x.Even());
     } else if (matpcType == QUDA_MATPC_ODD_ODD) {
       // src = A_oo^-1 (b_o - D_oe A_ee^-1 b_e)
       src = &(x.Even());
       CloverInv(*src, b.Even(), QUDA_EVEN_PARITY);
       DiracCoarse::Dslash(*tmp1, *src, QUDA_ODD_PARITY);
       blas::xpay(const_cast<ColorSpinorField&>(b.Odd()), -1.0, *tmp1);
       CloverInv(*src, *tmp1, QUDA_ODD_PARITY);
       sol = &(x.Odd());
     } else if (matpcType == QUDA_MATPC_EVEN_EVEN_ASYMMETRIC) {
       // src = b_e - D_eo A_oo^-1 b_o
       src = &(x.Odd());
       CloverInv(*tmp1, b.Odd(), QUDA_ODD_PARITY);
       DiracCoarse::Dslash(*src, *tmp1, QUDA_EVEN_PARITY);
       blas::xpay(const_cast<ColorSpinorField&>(b.Even()), -1.0, *src);
       sol = &(x.Even());
     } else if (matpcType == QUDA_MATPC_ODD_ODD_ASYMMETRIC) {
       // src = b_o - D_oe A_ee^-1 b_e
       src = &(x.Even());
       CloverInv(*tmp1, b.Even(), QUDA_EVEN_PARITY);
       DiracCoarse::Dslash(*src, *tmp1, QUDA_ODD_PARITY);
       blas::xpay(const_cast<ColorSpinorField&>(b.Odd()), -1.0, *src);
       sol = &(x.Odd());
     } else {
       errorQuda("MatPCType %d not valid for DiracCloverPC", matpcType);
     }

     // here we use final solution to store parity solution and parity source
     // b is now up for grabs if we want

     deleteTmp(&tmp1, reset);
   }

   void DiracCoarsePC::reconstruct(ColorSpinorField &x, const ColorSpinorField &b, const QudaSolutionType solType) const
   {
     if (solType == QUDA_MATPC_SOLUTION || solType == QUDA_MATPCDAG_MATPC_SOLUTION) {
       return;
     }

     checkFullSpinor(x, b);

     bool reset = newTmp(&tmp1, b.Even());

     // create full solution

     if (matpcType == QUDA_MATPC_EVEN_EVEN ||
   matpcType == QUDA_MATPC_EVEN_EVEN_ASYMMETRIC) {
       // x_o = A_oo^-1 (b_o - D_oe x_e)
       DiracCoarse::Dslash(*tmp1, x.Even(), QUDA_ODD_PARITY);
       blas::xpay(const_cast<ColorSpinorField&>(b.Odd()), -1.0, *tmp1);
       CloverInv(x.Odd(), *tmp1, QUDA_ODD_PARITY);
     } else if (matpcType == QUDA_MATPC_ODD_ODD ||
          matpcType == QUDA_MATPC_ODD_ODD_ASYMMETRIC) {
       // x_e = A_ee^-1 (b_e - D_eo x_o)
       DiracCoarse::Dslash(*tmp1, x.Odd(), QUDA_EVEN_PARITY);
       blas::xpay(const_cast<ColorSpinorField&>(b.Even()), -1.0, *tmp1);
       CloverInv(x.Even(), *tmp1, QUDA_EVEN_PARITY);
     } else {
       errorQuda("MatPCType %d not valid for DiracCoarsePC", matpcType);
     }

     deleteTmp(&tmp1, reset);
   }

   //Make the coarse operator one level down.  For the preconditioned
   //operator we are coarsening the Yhat links, not the Y links.  We
   //pass the fine clover fields, though they are actually ignored.
   void DiracCoarsePC::createCoarseOp(GaugeField &Y, GaugeField &X, GaugeField &Xinv, GaugeField &Yhat, const Transfer &T, double kappa, double mu, double mu_factor) const
   {
     double a = -2.0 * kappa * mu * T.Vectors().TwistFlavor();
     if (checkLocation(Y, X, Xinv, Yhat) == QUDA_CPU_FIELD_LOCATION) {
       CoarseCoarseOp(Y, X, Xinv, Yhat, T, *(this->Yhat_h), *(this->X_h), *(this->Xinv_h), kappa, a, -mu_factor, QUDA_COARSEPC_DIRAC, matpcType);
     } else {
       CoarseCoarseOp(Y, X, Xinv, Yhat, T, *(this->Yhat_d), *(this->X_d), *(this->Xinv_d), kappa, a, -mu_factor, QUDA_COARSEPC_DIRAC, matpcType);
     }
   }

 }
quda::DiracCoarse::~DiracCoarse
virtual ~DiracCoarse()
Definition: dirac_coarse.cpp:36

QUDA_RECONSTRUCT_NO
Definition: enum_quda.h:66

quda::ColorSpinorField::Nspin
int Nspin() const
Definition: color_spinor_field.h:361

quda::Dirac::flops
unsigned long long flops
Definition: dirac_quda.h:100

quda::blas::xpay
void xpay(ColorSpinorField &x, const double &a, ColorSpinorField &y)
Definition: blas_quda.cu:173

mu
double mu
Definition: test_util.cpp:1643

QudaPrecision
enum QudaPrecision_s QudaPrecision

quda::DiracCoarsePC::prepare
void prepare(ColorSpinorField *&src, ColorSpinorField *&sol, ColorSpinorField &x, ColorSpinorField &b, const QudaSolutionType) const
Definition: dirac_coarse.cpp:319

QUDA_INVALID_PARITY
Definition: enum_quda.h:261

quda::DiracCoarse::init
bool init
Definition: dirac_quda.h:761

QUDA_MATPC_ODD_ODD
Definition: enum_quda.h:183

quda::ColorSpinorField
Definition: color_spinor_field.h:271

quda::Transfer
Definition: transfer.h:30

quda::DiracCoarse::X_h
cpuGaugeField * X_h
Definition: dirac_quda.h:749

src
const void * src
Definition: CMakeCUDACompilerId.cpp1.ii:2290

quda::DiracCoarsePC::~DiracCoarsePC
virtual ~DiracCoarsePC()
Definition: dirac_coarse.cpp:249

errorQuda
#define errorQuda(...)
Definition: util_quda.h:90

quda::blas::init
void init()
Definition: blas_quda.cu:64

QUDA_CUDA_FIELD_LOCATION
Definition: enum_quda.h:297

quda::DiracCoarse::CloverInv
void CloverInv(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Apply the inverse coarse clover operator.
Definition: dirac_coarse.cpp:145

QUDA_ODD_PARITY
Definition: enum_quda.h:260

mu_factor
double mu_factor[QUDA_MAX_MG_LEVEL]
Definition: test_util.cpp:1659

quda::Dirac::checkFullSpinor
virtual void checkFullSpinor(const ColorSpinorField &, const ColorSpinorField &) const
Definition: dirac.cpp:129

QUDA_QDP_GAUGE_ORDER
Definition: enum_quda.h:41

quda::DiracCoarsePC::M
void M(ColorSpinorField &out, const ColorSpinorField &in) const
Apply the full operator.
Definition: dirac_coarse.cpp:275

quda::DiracCoarsePC::Dslash
void Dslash(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Apply DslashXpay out = (D * in)
Definition: dirac_coarse.cpp:251

QUDA_FLOAT2_GAUGE_ORDER
Definition: enum_quda.h:39

QUDA_FULL_SITE_SUBSET
Definition: enum_quda.h:304

quda::Dirac::deleteTmp
void deleteTmp(ColorSpinorField **, const bool &reset) const
Definition: dirac.cpp:64

Yhat_d
cudaGaugeField * Yhat_d
Definition: multigrid_benchmark_test.cu:43

quda::DiracCoarse::DslashXpay
virtual void DslashXpay(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity, const ColorSpinorField &x, const double &k) const
Apply DslashXpay out = (D * in + A * x)
Definition: dirac_coarse.cpp:171

quda::Transfer::nvec
int nvec() const
Definition: transfer.h:203

quda::DiracCoarse::mu_factor
double mu_factor
Definition: dirac_quda.h:744

quda::DiracCoarse::Clover
void Clover(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Apply the coarse clover operator.
Definition: dirac_coarse.cpp:132

quda::DiracCoarse::prepare
virtual void prepare(ColorSpinorField *&src, ColorSpinorField *&sol, ColorSpinorField &x, ColorSpinorField &b, const QudaSolutionType) const
Definition: dirac_coarse.cpp:210

quda::ColorSpinorField::Ndim
int Ndim() const
Definition: color_spinor_field.h:363

quda::DiracCoarse
Definition: dirac_quda.h:740

quda::DiracCoarse::createCoarseOp
void createCoarseOp(GaugeField &Y, GaugeField &X, GaugeField &Xinv, GaugeField &Yhat, const Transfer &T, double kappa, double mu, double mu_factor=0.) const
Create the coarse operator from this coarse operator.
Definition: dirac_coarse.cpp:229

QUDA_COARSE_LINKS
Definition: enum_quda.h:27

quda::DiracCoarse::MdagM
virtual void MdagM(ColorSpinorField &out, const ColorSpinorField &in) const
Definition: dirac_coarse.cpp:199

quda
Definition: blas_cublas.h:6

Y_h
cpuGaugeField * Y_h
Definition: multigrid_benchmark_test.cu:42

quda::DiracCoarsePC::DslashXpay
void DslashXpay(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity, const ColorSpinorField &x, const double &k) const
Apply DslashXpay out = (D * in + A * x)
Definition: dirac_coarse.cpp:264

param
QudaGaugeParam param
Definition: pack_test.cpp:17

quda::DiracCoarse::Y_d
cudaGaugeField * Y_d
Definition: dirac_quda.h:753

quda::Dirac::newTmp
bool newTmp(ColorSpinorField **, const ColorSpinorField &) const
Definition: dirac.cpp:53

b
#define b
Definition: dw_dslash4_core.h:83

x
p x
Definition: CMakeCUDACompilerId.cpp1.ii:3011

quda::DiracCoarse::enable_gpu
bool enable_gpu
Definition: dirac_quda.h:760

ndim
static int ndim
Definition: layout_hyper.c:53

quda::DiracCoarsePC::MdagM
void MdagM(ColorSpinorField &out, const ColorSpinorField &in) const
Definition: dirac_coarse.cpp:311

QUDA_MATPC_SOLUTION
Definition: enum_quda.h:132

quda::DiracCoarse::Dslash
virtual void Dslash(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Apply DslashXpay out = (D * in)
Definition: dirac_coarse.cpp:158

QUDA_MATPC_EVEN_EVEN_ASYMMETRIC
Definition: enum_quda.h:184

quda::GaugeFieldParam
Definition: gauge_field.h:10

quda::DiracParam
Definition: dirac_quda.h:19

multigrid.h

Xinv_d
cudaGaugeField * Xinv_d
Definition: multigrid_benchmark_test.cu:43

Yhat_h
cpuGaugeField * Yhat_h
Definition: multigrid_benchmark_test.cu:42

quda::DiracCoarsePC::reconstruct
void reconstruct(ColorSpinorField &x, const ColorSpinorField &b, const QudaSolutionType) const
Definition: dirac_coarse.cpp:372

quda::DiracCoarsePC::createCoarseOp
void createCoarseOp(GaugeField &Y, GaugeField &X, GaugeField &Xinv, GaugeField &Yhat, const Transfer &T, double kappa, double mu, double mu_factor=0.) const
Create the coarse even-odd preconditioned coarse operator. Unlike the Wilson operator, the coarsening of the preconditioned coarse operator differs from that of the unpreconditioned coarse operator, so we need to specialize it.
Definition: dirac_coarse.cpp:406

quda::Transfer::Vectors
const ColorSpinorField & Vectors(QudaFieldLocation location=QUDA_CPU_FIELD_LOCATION) const
Definition: transfer.h:195

kappa
VOLATILE spinorFloat kappa
Definition: dw_dslash5inv_core.h:153

quda::DiracCoarse::transfer
const Transfer * transfer
Definition: dirac_quda.h:745

quda::cpuGaugeField::copy
void copy(const GaugeField &src)
Definition: cpu_gauge_field.cpp:259

quda::Dirac::createCoarseOp
virtual void createCoarseOp(GaugeField &Y, GaugeField &X, GaugeField &Xinv, GaugeField &Yhat, const Transfer &T, double kappa, double mu=0., double mu_factor=0.) const
Create the coarse operator (virtual parent)
Definition: dirac_quda.h:167

Xinv_h
cpuGaugeField * Xinv_h
Definition: multigrid_benchmark_test.cu:42

in
cpuColorSpinorField * in
Definition: staggered_invert_test.cpp:44

quda::cpuGaugeField
Definition: gauge_field.h:464

quda::DiracCoarse::initializeCoarse
void initializeCoarse()
Definition: dirac_coarse.cpp:50

quda::ColorSpinorField::SiteSubset
QudaSiteSubset SiteSubset() const
Definition: color_spinor_field.h:435

QUDA_PERIODIC_T
Definition: enum_quda.h:54

fused_exterior_ndeg_tm_dslash_cuda_gen.i
int i
start here
Definition: fused_exterior_ndeg_tm_dslash_cuda_gen.py:816

quda::DiracCoarse::mu
double mu
Definition: dirac_quda.h:743

checkLocation
#define checkLocation(...)
Definition: lattice_field.h:561

quda::cudaGaugeField
Definition: gauge_field.h:298

QudaSolutionType
enum QudaSolutionType_s QudaSolutionType

QUDA_GHOST_EXCHANGE_NO
Definition: enum_quda.h:434

quda::Dirac::dagger
QudaDagType dagger
Definition: dirac_quda.h:99

quda::Transfer::Spin_bs
int Spin_bs() const
Definition: transfer.h:209

quda::DiracCoarse::X_d
cudaGaugeField * X_d
Definition: dirac_quda.h:754

QudaParity
enum QudaParity_s QudaParity

quda::ApplyCoarse
void ApplyCoarse(ColorSpinorField &out, const ColorSpinorField &inA, const ColorSpinorField &inB, const GaugeField &Y, const GaugeField &X, double kappa, int parity=QUDA_INVALID_PARITY, bool dslash=true, bool clover=true, bool dagger=false)
Definition: dslash_coarse.cu:1096

quda::DiracCoarse::Mu
double Mu() const
Definition: dirac_quda.h:764

quda::CoarseCoarseOp
void CoarseCoarseOp(GaugeField &Y, GaugeField &X, GaugeField &Xinv, GaugeField &Yhat, const Transfer &T, const GaugeField &gauge, const GaugeField &clover, const GaugeField &cloverInv, double kappa, double mu, double mu_factor, QudaDiracType dirac, QudaMatPCType matpc)
Coarse operator construction from an intermediate-grid operator (Coarse)
Definition: coarsecoarse_op.cu:169

memcpy
void * memcpy(void *__dst, const void *__src, size_t __n)

quda::Dirac::kappa
double kappa
Definition: dirac_quda.h:96

quda::Dirac::matpcType
QudaMatPCType matpcType
Definition: dirac_quda.h:98

X_d
cudaGaugeField * X_d
Definition: multigrid_benchmark_test.cu:43

quda::Transfer::Geo_bs
const int * Geo_bs() const
Definition: transfer.h:215

X
int X
Definition: asym_wilson_clover_dslash_dagger_fermi_core.h:394

quda::Dirac::Mdag
void Mdag(ColorSpinorField &out, const ColorSpinorField &in) const
Definition: dirac.cpp:73

quda::DiracCoarse::Xinv_d
cudaGaugeField * Xinv_d
Definition: dirac_quda.h:755

dirac
GaugeCovDev * dirac
Definition: covdev_test.cpp:75

out
cpuColorSpinorField * out
Definition: staggered_invert_test.cpp:45

QUDA_MATPC_ODD_ODD_ASYMMETRIC
Definition: enum_quda.h:185

gParam
GaugeFieldParam gParam
Definition: hisq_paths_force_test.cpp:64

quda::DiracCoarse::reconstruct
virtual void reconstruct(ColorSpinorField &x, const ColorSpinorField &b, const QudaSolutionType) const
Definition: dirac_coarse.cpp:222

quda::DiracCoarse::Yhat_d
cudaGaugeField * Yhat_d
Definition: dirac_quda.h:756

quda::DiracCoarse::Xinv_h
cpuGaugeField * Xinv_h
Definition: dirac_quda.h:750

X_h
cpuGaugeField * X_h
Definition: multigrid_benchmark_test.cu:42

quda::DiracCoarse::Y_h
cpuGaugeField * Y_h
Definition: dirac_quda.h:748

QUDA_COARSEPC_DIRAC
Definition: enum_quda.h:287

n
int n
Definition: CMakeCUDACompilerId.cpp1.ii:8086

Y_d
cudaGaugeField * Y_d
Definition: multigrid_benchmark_test.cu:43

quda::ColorSpinorField::TwistFlavor
QudaTwistFlavorType TwistFlavor() const
Definition: color_spinor_field.h:362

transfer
int transfer
Definition: covdev_test.cpp:55

quda::DiracCoarse::Yhat_h
cpuGaugeField * Yhat_h
Definition: dirac_quda.h:751

quda::ColorSpinorField::X
const int * X() const
Definition: color_spinor_field.h:364

QUDA_EVEN_PARITY
Definition: enum_quda.h:259

QUDA_COARSE_GEOMETRY
Definition: enum_quda.h:429

QUDA_MAX_DIM
#define QUDA_MAX_DIM
Maximum number of dimensions supported by QUDA. In practice, no routines make use of more than 5...
Definition: quda_constants.h:17

quda::DiracCoarse::MuFactor
double MuFactor() const
Definition: dirac_quda.h:765

QUDA_SCALAR_GEOMETRY
Definition: enum_quda.h:426

QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:331

QUDA_MATPC_INVALID
Definition: enum_quda.h:186

quda::DiracCoarse::M
virtual void M(ColorSpinorField &out, const ColorSpinorField &in) const
Apply the full operator.
Definition: dirac_coarse.cpp:187

quda::DiracCoarse::dirac
const Dirac * dirac
Definition: dirac_quda.h:746

quda::cudaGaugeField::copy
void copy(const GaugeField &src)
Definition: cuda_gauge_field.cu:587

QUDA_GHOST_EXCHANGE_PAD
Definition: enum_quda.h:435

QUDA_MATPCDAG_MATPC_SOLUTION
Definition: enum_quda.h:134

quda::LatticeField::Precision
QudaPrecision Precision() const
Definition: lattice_field.h:462

QUDA_MATPC_EVEN_EVEN
Definition: enum_quda.h:182

parity
QudaParity parity
Definition: covdev_test.cpp:53

quda::DiracCoarse::DiracCoarse
DiracCoarse(const DiracParam &param, bool enable_gpu=true)
Definition: dirac_coarse.cpp:7

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:296

quda::Dirac::tmp2
ColorSpinorField * tmp2
Definition: dirac_quda.h:102

prec
QudaPrecision prec
Definition: test_util.cpp:1615

a
#define a
Definition: dw_dslash4_core.h:82

QUDA_COARSE_DIRAC
Definition: enum_quda.h:286

quda::Dirac
Definition: dirac_quda.h:86

quda::DiracCoarsePC::DiracCoarsePC
DiracCoarsePC(const DiracParam &param, bool enable_gpu=true)
Definition: dirac_coarse.cpp:239

quda::Dirac::tmp1
ColorSpinorField * tmp1
Definition: dirac_quda.h:101

quda::GaugeField
Definition: gauge_field.h:123