quda-ref/v1.0.0/dirac__staggered_8cpp_source.html

 #include <dirac_quda.h>
 #include <blas_quda.h>

 namespace quda {

   DiracStaggered::DiracStaggered(const DiracParam &param) : Dirac(param) { }

   DiracStaggered::DiracStaggered(const DiracStaggered &dirac) : Dirac(dirac) { }

   DiracStaggered::~DiracStaggered() { }

   DiracStaggered& DiracStaggered::operator=(const DiracStaggered &dirac)
   {
     if (&dirac != this) {
       Dirac::operator=(dirac);
     }
     return *this;
   }

   void DiracStaggered::checkParitySpinor(const ColorSpinorField &in, const ColorSpinorField &out) const
   {
     if (in.Ndim() != 5 || out.Ndim() != 5) {
       errorQuda("Staggered dslash requires 5-d fermion fields");
     }

     if (in.Precision() != out.Precision()) {
       errorQuda("Input and output spinor precisions don't match in dslash_quda");
     }

     if (in.Stride() != out.Stride()) {
       errorQuda("Input %d and output %d spinor strides don't match in dslash_quda", in.Stride(), out.Stride());
     }

     if (in.SiteSubset() != QUDA_PARITY_SITE_SUBSET || out.SiteSubset() != QUDA_PARITY_SITE_SUBSET) {
       errorQuda("ColorSpinorFields are not single parity, in = %d, out = %d",
     in.SiteSubset(), out.SiteSubset());
     }

     if ((out.Volume()/out.X(4) != 2*gauge->VolumeCB() && out.SiteSubset() == QUDA_FULL_SITE_SUBSET) ||
   (out.Volume()/out.X(4) != gauge->VolumeCB() && out.SiteSubset() == QUDA_PARITY_SITE_SUBSET) ) {
       errorQuda("Spinor volume %d doesn't match gauge volume %d", out.Volume(), gauge->VolumeCB());
     }
   }


   void DiracStaggered::Dslash(ColorSpinorField &out, const ColorSpinorField &in,
             const QudaParity parity) const
   {
     checkParitySpinor(in, out);

     ApplyStaggered(out, in, *gauge, 0., in, parity, dagger, commDim, profile);
     flops += 570ll*in.Volume();
   }

   void DiracStaggered::DslashXpay(ColorSpinorField &out, const ColorSpinorField &in,
           const QudaParity parity, const ColorSpinorField &x,
           const double &k) const
   {
     checkParitySpinor(in, out);

     // Need to catch the zero mass case.
     if (k == 0.0) {
       // There's a sign convention difference for Dslash vs DslashXpay, which is
       // triggered by looking for k == 0. We need to hack around this.
       if (dagger == QUDA_DAG_YES) {
         ApplyStaggered(out, in, *gauge, 0., x, parity, QUDA_DAG_NO, commDim, profile);
       } else {
         ApplyStaggered(out, in, *gauge, 0., x, parity, QUDA_DAG_YES, commDim, profile);
       }
       flops += 570ll * in.Volume();
     } else {
       ApplyStaggered(out, in, *gauge, k, x, parity, dagger, commDim, profile);
       flops += 582ll * in.Volume();
     }
   }

   // Full staggered operator
   void DiracStaggered::M(ColorSpinorField &out, const ColorSpinorField &in) const
   {
     // Due to the staggered convention, this is applying
     // (  2m     -D_eo ) (x_e) = (b_e)
     // ( -D_oe   2m    ) (x_o) = (b_o)
     // ... but under the hood we need to catch the zero mass case.

     checkFullSpinor(out, in);

     if (mass == 0.) {
       if (dagger == QUDA_DAG_YES) {
         ApplyStaggered(out, in, *gauge, 0., in, QUDA_INVALID_PARITY, QUDA_DAG_NO, commDim, profile);
       } else {
         ApplyStaggered(out, in, *gauge, 0., in, QUDA_INVALID_PARITY, QUDA_DAG_YES, commDim, profile);
       }
       flops += 570ll * in.Volume();
     } else {
       ApplyStaggered(out, in, *gauge, 2. * mass, in, QUDA_INVALID_PARITY, dagger, commDim, profile);
       flops += 582ll * in.Volume();
     }
   }

   void DiracStaggered::MdagM(ColorSpinorField &out, const ColorSpinorField &in) const
   {
     bool reset = newTmp(&tmp1, in);

     //even
     Dslash(tmp1->Even(), in.Even(), QUDA_ODD_PARITY);
     DslashXpay(out.Even(), tmp1->Even(), QUDA_EVEN_PARITY, in.Even(), 4*mass*mass);

     //odd
     Dslash(tmp1->Even(), in.Odd(), QUDA_EVEN_PARITY);
     DslashXpay(out.Odd(), tmp1->Even(), QUDA_ODD_PARITY, in.Odd(), 4*mass*mass);

     deleteTmp(&tmp1, reset);
   }

   void DiracStaggered::prepare(ColorSpinorField* &src, ColorSpinorField* &sol,
              ColorSpinorField &x, ColorSpinorField &b,
              const QudaSolutionType solType) const
   {
     if (solType == QUDA_MATPC_SOLUTION || solType == QUDA_MATPCDAG_MATPC_SOLUTION) {
       errorQuda("Preconditioned solution requires a preconditioned solve_type");
     }

     src = &b;
     sol = &x;
   }

   void DiracStaggered::reconstruct(ColorSpinorField &x, const ColorSpinorField &b,
            const QudaSolutionType solType) const
   {
     // do nothing
   }

   void DiracStaggered::createCoarseOp(GaugeField &Y, GaugeField &X, const Transfer &T,
            double kappa, double mass, double mu, double mu_factor) const {
     errorQuda("Cannot coarsen a staggered operator (yet!), we're just getting the functions in place.");
     //CoarseStaggeredOp(Y, X, T, *gauge, mass, QUDA_STAGGERED_DIRAC, QUDA_MATPC_INVALID);
   }


   DiracStaggeredPC::DiracStaggeredPC(const DiracParam &param)
     : DiracStaggered(param)
   {

   }

   DiracStaggeredPC::DiracStaggeredPC(const DiracStaggeredPC &dirac)
     : DiracStaggered(dirac)
   {

   }

   DiracStaggeredPC::~DiracStaggeredPC()
   {

   }

   DiracStaggeredPC& DiracStaggeredPC::operator=(const DiracStaggeredPC &dirac)
   {
     if (&dirac != this) {
       DiracStaggered::operator=(dirac);
     }

     return *this;
   }

   // Unlike with clover, for ex, we don't need a custom Dslash or DslashXpay.
   // That's because the convention for preconditioned staggered is to
   // NOT divide out the factor of "2m", i.e., for the even system we invert
   // (4m^2 - D_eo D_oe), not (1 - (1/(4m^2)) D_eo D_oe).

   void DiracStaggeredPC::M(ColorSpinorField &out, const ColorSpinorField &in) const
   {
     bool reset = newTmp(&tmp1, in);

     QudaParity parity = QUDA_INVALID_PARITY;
     QudaParity other_parity = QUDA_INVALID_PARITY;
     if (matpcType == QUDA_MATPC_EVEN_EVEN) {
       parity = QUDA_EVEN_PARITY;
       other_parity = QUDA_ODD_PARITY;
     } else if (matpcType == QUDA_MATPC_ODD_ODD) {
       parity = QUDA_ODD_PARITY;
       other_parity = QUDA_EVEN_PARITY;
     } else {
       errorQuda("Invalid matpcType(%d) in function\n", matpcType);
     }

     // Convention note: Dslash applies D_eo, DslashXpay applies 4m^2 - D_oe!
     // Note the minus sign convention in the Xpay version.
     // This applies equally for the e <-> o permutation.

     Dslash(*tmp1, in, other_parity);
     DslashXpay(out, *tmp1, parity, in, 4*mass*mass);

     deleteTmp(&tmp1, reset);
   }

   void DiracStaggeredPC::MdagM(ColorSpinorField &out, const ColorSpinorField &in) const
   {
     errorQuda("MdagM is no longer defined for DiracStaggeredPC. Use M instead.\n");
     /*
     // need extra temporary because for multi-gpu the input
     // and output fields cannot alias
     bool reset = newTmp(&tmp2, in);
     M(*tmp2, in);
     M(out, *tmp2); // doesn't need to be Mdag b/c M is normal!
     deleteTmp(&tmp2, reset);
     */
   }

   void DiracStaggeredPC::prepare(ColorSpinorField* &src, ColorSpinorField* &sol,
          ColorSpinorField &x, ColorSpinorField &b,
          const QudaSolutionType solType) const
   {
     // we desire solution to preconditioned system
     if (solType == QUDA_MATPC_SOLUTION || solType == QUDA_MATPCDAG_MATPC_SOLUTION) {
       src = &b;
       sol = &x;
       return;
     }

     // we desire solution to full system.
     // See sign convention comment in DiracStaggeredPC::M().
     if (matpcType == QUDA_MATPC_EVEN_EVEN) {
       // With the convention given in DiracStaggered::M(),
       // the source is src = 2m b_e + D_eo b_o
       // But remember, DslashXpay actually applies
       // -D_eo. Flip the sign on 2m to compensate, and
       // then flip the overall sign.
       src = &(x.Odd());
       DslashXpay(*src, b.Odd(), QUDA_EVEN_PARITY, b.Even(), -2*mass);
       blas::ax(-1.0, *src);
       sol = &(x.Even());
     } else if (matpcType == QUDA_MATPC_ODD_ODD) {
       // See above, permute e <-> o
       src = &(x.Even());
       DslashXpay(*src, b.Even(), QUDA_ODD_PARITY, b.Odd(), -2*mass);
       blas::ax(-1.0, *src);
       sol = &(x.Odd());
     } else {
       errorQuda("MatPCType %d not valid for DiracStaggeredPC", matpcType);
     }

     // here we use final solution to store parity solution and parity source
     // b is now up for grabs if we want

   }

   void DiracStaggeredPC::reconstruct(ColorSpinorField &x, const ColorSpinorField &b,
              const QudaSolutionType solType) const
   {

     if (solType == QUDA_MATPC_SOLUTION || solType == QUDA_MATPCDAG_MATPC_SOLUTION) {
       return;
     }

     checkFullSpinor(x, b);

     // create full solution
     // See sign convention comment in DiracStaggeredPC::M()
     if (matpcType == QUDA_MATPC_EVEN_EVEN) {

       // With the convention given in DiracStaggered::M(),
       // the reconstruct is x_o = 1/(2m) (b_o + D_oe x_e)
       // But remember: DslashXpay actually applies -D_oe,
       // so just like above we need to flip the sign
       // on b_o. We then correct this by applying an additional
       // minus sign when we rescale by 2m.
       DslashXpay(x.Odd(), x.Even(), QUDA_ODD_PARITY, b.Odd(), -1.0);
       blas::ax(-0.5/mass, x.Odd());
     } else if (matpcType == QUDA_MATPC_ODD_ODD) {
       // See above, permute e <-> o
       DslashXpay(x.Even(), x.Odd(), QUDA_EVEN_PARITY, b.Even(), -1.0);
       blas::ax(-0.5/mass, x.Even());
     } else {
       errorQuda("MatPCType %d not valid for DiracStaggeredPC", matpcType);
     }

   }


 } // namespace quda
quda::blas::ax
void ax(double a, ColorSpinorField &x)
Definition: blas_quda.cu:508

quda::Dirac::flops
unsigned long long flops
Definition: dirac_quda.h:121

mu
double mu
Definition: test_util.cpp:1648

QUDA_INVALID_PARITY
Definition: enum_quda.h:289

QUDA_MATPC_ODD_ODD
Definition: enum_quda.h:211

quda::ColorSpinorField
Definition: color_spinor_field.h:311

quda::Transfer
Definition: transfer.h:29

quda::DiracStaggered::prepare
virtual void prepare(ColorSpinorField *&src, ColorSpinorField *&sol, ColorSpinorField &x, ColorSpinorField &b, const QudaSolutionType) const
Definition: dirac_staggered.cpp:115

errorQuda
#define errorQuda(...)
Definition: util_quda.h:121

quda::Dirac::gauge
cudaGaugeField * gauge
Definition: dirac_quda.h:115

quda::DiracStaggeredPC::DiracStaggeredPC
DiracStaggeredPC(const DiracParam &param)
Definition: dirac_staggered.cpp:140

quda::DiracStaggered::~DiracStaggered
virtual ~DiracStaggered()
Definition: dirac_staggered.cpp:10

QUDA_ODD_PARITY
Definition: enum_quda.h:288

quda::Dirac::checkFullSpinor
virtual void checkFullSpinor(const ColorSpinorField &, const ColorSpinorField &) const
Definition: dirac.cpp:146

QUDA_FULL_SITE_SUBSET
Definition: enum_quda.h:333

quda::ColorSpinorField::Even
const ColorSpinorField & Even() const
Definition: color_spinor_field.cpp:608

quda::Dirac::deleteTmp
void deleteTmp(ColorSpinorField **, const bool &reset) const
Definition: dirac.cpp:81

quda::ColorSpinorField::Odd
const ColorSpinorField & Odd() const
Definition: color_spinor_field.cpp:616

quda::Dirac::profile
TimeProfile profile
Definition: dirac_quda.h:132

quda::DiracStaggered::MdagM
virtual void MdagM(ColorSpinorField &out, const ColorSpinorField &in) const
Definition: dirac_staggered.cpp:100

quda::ColorSpinorField::Ndim
int Ndim() const
Definition: color_spinor_field.h:409

quda::ColorSpinorField::Volume
int Volume() const
Definition: color_spinor_field.h:415

QUDA_DAG_YES
Definition: enum_quda.h:219

quda::DiracStaggeredPC::reconstruct
virtual void reconstruct(ColorSpinorField &x, const ColorSpinorField &b, const QudaSolutionType) const
Definition: dirac_staggered.cpp:248

quda
Definition: blas_cublas.h:5

dirac_quda.h

param
QudaGaugeParam param
Definition: pack_test.cpp:17

quda::Dirac::newTmp
bool newTmp(ColorSpinorField **, const ColorSpinorField &) const
Definition: dirac.cpp:70

quda::DiracStaggered::operator=
DiracStaggered & operator=(const DiracStaggered &dirac)
Definition: dirac_staggered.cpp:12

QUDA_MATPC_SOLUTION
Definition: enum_quda.h:153

quda::Dirac::commDim
int commDim[QUDA_MAX_DIM]
Definition: dirac_quda.h:130

quda::DiracParam
Definition: dirac_quda.h:19

quda::DiracStaggeredPC
Definition: dirac_quda.h:735

quda::DiracStaggeredPC::operator=
DiracStaggeredPC & operator=(const DiracStaggeredPC &dirac)
Definition: dirac_staggered.cpp:157

quda::DiracStaggeredPC::prepare
virtual void prepare(ColorSpinorField *&src, ColorSpinorField *&sol, ColorSpinorField &x, ColorSpinorField &b, const QudaSolutionType) const
Definition: dirac_staggered.cpp:210

in
cpuColorSpinorField * in
Definition: staggered_invert_test.cpp:98

quda::ColorSpinorField::SiteSubset
QudaSiteSubset SiteSubset() const
Definition: color_spinor_field.h:481

quda::Dirac::mass
double mass
Definition: dirac_quda.h:117

quda::DiracStaggered::reconstruct
virtual void reconstruct(ColorSpinorField &x, const ColorSpinorField &b, const QudaSolutionType) const
Definition: dirac_staggered.cpp:127

QudaSolutionType
enum QudaSolutionType_s QudaSolutionType

QUDA_PARITY_SITE_SUBSET
Definition: enum_quda.h:332

quda::DiracStaggered::checkParitySpinor
virtual void checkParitySpinor(const ColorSpinorField &, const ColorSpinorField &) const
Definition: dirac_staggered.cpp:20

quda::Dirac::dagger
QudaDagType dagger
Definition: dirac_quda.h:120

X
int X[4]
Definition: covdev_test.cpp:70

QudaParity
enum QudaParity_s QudaParity

quda::DiracStaggered
Definition: dirac_quda.h:694

quda::Dirac::kappa
double kappa
Definition: dirac_quda.h:116

quda::Dirac::matpcType
QudaMatPCType matpcType
Definition: dirac_quda.h:119

quda::DiracStaggeredPC::M
virtual void M(ColorSpinorField &out, const ColorSpinorField &in) const
Definition: dirac_staggered.cpp:171

blas_quda.h

quda::Dirac::operator=
Dirac & operator=(const Dirac &dirac)
Definition: dirac.cpp:49

dirac
GaugeCovDev * dirac
Definition: covdev_test.cpp:73

out
cpuColorSpinorField * out
Definition: staggered_invert_test.cpp:99

quda::DiracStaggered::createCoarseOp
void createCoarseOp(GaugeField &Y, GaugeField &X, const Transfer &T, double kappa, double mass, double mu=0., double mu_factor=0.) const
Create the coarse staggered operator. Unlike the Wilson operator, we assume a mass normalization...
Definition: dirac_staggered.cpp:133

quda::DiracStaggered::Dslash
virtual void Dslash(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Definition: dirac_staggered.cpp:46

QUDA_DAG_NO
Definition: enum_quda.h:218

quda::LatticeField::VolumeCB
int VolumeCB() const
Definition: lattice_field.h:509

quda::DiracStaggeredPC::MdagM
virtual void MdagM(ColorSpinorField &out, const ColorSpinorField &in) const
Definition: dirac_staggered.cpp:197

quda::ColorSpinorField::Stride
int Stride() const
Definition: color_spinor_field.h:414

quda::ApplyStaggered
void ApplyStaggered(ColorSpinorField &out, const ColorSpinorField &in, const GaugeField &U, double a, const ColorSpinorField &x, int parity, bool dagger, const int *comm_override, TimeProfile &profile)
Apply the staggered dslash operator to a color-spinor field.
Definition: dslash_staggered.cu:112

mu_factor
double mu_factor[QUDA_MAX_MG_LEVEL]
Definition: test_util.cpp:1674

quda::ColorSpinorField::X
const int * X() const
Definition: color_spinor_field.h:410

QUDA_EVEN_PARITY
Definition: enum_quda.h:287

quda::DiracStaggered::DiracStaggered
DiracStaggered(const DiracParam &param)
Definition: dirac_staggered.cpp:6

QUDA_MATPCDAG_MATPC_SOLUTION
Definition: enum_quda.h:155

quda::LatticeField::Precision
QudaPrecision Precision() const
Definition: lattice_field.h:546

quda::DiracStaggeredPC::~DiracStaggeredPC
virtual ~DiracStaggeredPC()
Definition: dirac_staggered.cpp:152

QUDA_MATPC_EVEN_EVEN
Definition: enum_quda.h:210

parity
QudaParity parity
Definition: covdev_test.cpp:54

quda::DiracStaggered::DslashXpay
virtual void DslashXpay(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity, const ColorSpinorField &x, const double &k) const
Definition: dirac_staggered.cpp:55

quda::DiracStaggered::M
virtual void M(ColorSpinorField &out, const ColorSpinorField &in) const
Definition: dirac_staggered.cpp:78

quda::Dirac
Definition: dirac_quda.h:106

quda::Dirac::tmp1
ColorSpinorField * tmp1
Definition: dirac_quda.h:122

quda::GaugeField
Definition: gauge_field.h:164