quda-ref/v1.0.0/dirac__coarse_8cpp_source.html

 #include <string.h>
 #include <multigrid.h>
 #include <algorithm>

 namespace quda {

   DiracCoarse::DiracCoarse(const DiracParam &param, bool gpu_setup, bool mapped) :
     Dirac(param),
     mu(param.mu),
     mu_factor(param.mu_factor),
     transfer(param.transfer),
     dirac(param.dirac),
     need_bidirectional(param.need_bidirectional),
     Y_h(nullptr),
     X_h(nullptr),
     Xinv_h(nullptr),
     Yhat_h(nullptr),
     Y_d(nullptr),
     X_d(nullptr),
     Xinv_d(nullptr),
     Yhat_d(nullptr),
     enable_gpu(false),
     enable_cpu(false),
     gpu_setup(gpu_setup),
     init_gpu(gpu_setup),
     init_cpu(!gpu_setup),
     mapped(mapped)
   {
     initializeCoarse();
   }

   DiracCoarse::DiracCoarse(const DiracParam &param, cpuGaugeField *Y_h, cpuGaugeField *X_h, cpuGaugeField *Xinv_h,
                            cpuGaugeField *Yhat_h, // cpu link fields
                            cudaGaugeField *Y_d, cudaGaugeField *X_d, cudaGaugeField *Xinv_d,
                            cudaGaugeField *Yhat_d) // gpu link field
     :
     Dirac(param),
     mu(param.mu),
     mu_factor(param.mu_factor),
     transfer(nullptr),
     dirac(nullptr),
     need_bidirectional(false),
     Y_h(Y_h),
     X_h(X_h),
     Xinv_h(Xinv_h),
     Yhat_h(Yhat_h),
     Y_d(Y_d),
     X_d(X_d),
     Xinv_d(Xinv_d),
     Yhat_d(Yhat_d),
     enable_gpu(Y_d ? true : false),
     enable_cpu(Y_h ? true : false),
     gpu_setup(true),
     init_gpu(enable_gpu ? false : true),
     init_cpu(enable_cpu ? false : true),
     mapped(Y_d->MemType() == QUDA_MEMORY_MAPPED)
   {

   }

   DiracCoarse::DiracCoarse(const DiracCoarse &dirac, const DiracParam &param) :
     Dirac(param),
     mu(param.mu),
     mu_factor(param.mu_factor),
     transfer(param.transfer),
     dirac(param.dirac),
     need_bidirectional(param.need_bidirectional),
     Y_h(dirac.Y_h),
     X_h(dirac.X_h),
     Xinv_h(dirac.Xinv_h),
     Yhat_h(dirac.Yhat_h),
     Y_d(dirac.Y_d),
     X_d(dirac.X_d),
     Xinv_d(dirac.Xinv_d),
     Yhat_d(dirac.Yhat_d),
     enable_gpu(dirac.enable_gpu),
     enable_cpu(dirac.enable_cpu),
     gpu_setup(dirac.gpu_setup),
     init_gpu(enable_gpu ? false : true),
     init_cpu(enable_cpu ? false : true),
     mapped(dirac.mapped)
   {

   }

   DiracCoarse::~DiracCoarse()
   {
     if (init_cpu) {
       if (Y_h) delete Y_h;
       if (X_h) delete X_h;
       if (Xinv_h) delete Xinv_h;
       if (Yhat_h) delete Yhat_h;
     }
     if (init_gpu) {
       if (Y_d) delete Y_d;
       if (X_d) delete X_d;
       if (Xinv_d) delete Xinv_d;
       if (Yhat_d) delete Yhat_d;
     }
   }

   void DiracCoarse::createY(bool gpu, bool mapped) const
   {
     int ndim = transfer->Vectors().Ndim();
     int x[QUDA_MAX_DIM];
     const int *geo_bs = transfer->Geo_bs(); // Number of coarse sites.
     for (int i = 0; i < ndim; i++) x[i] = transfer->Vectors().X(i)/geo_bs[i];
     int Nc_c = transfer->nvec();     // Coarse Color
     int Ns_c = transfer->Vectors().Nspin()/transfer->Spin_bs(); // Coarse Spin
     GaugeFieldParam gParam;
     memcpy(gParam.x, x, QUDA_MAX_DIM*sizeof(int));
     gParam.nColor = Nc_c*Ns_c;
     gParam.reconstruct = QUDA_RECONSTRUCT_NO;
     gParam.order = gpu ? QUDA_FLOAT2_GAUGE_ORDER : QUDA_QDP_GAUGE_ORDER;
     gParam.link_type = QUDA_COARSE_LINKS;
     gParam.t_boundary = QUDA_PERIODIC_T;
     gParam.create = QUDA_ZERO_FIELD_CREATE;
     // use null-space precision for coarse links on gpu
     gParam.setPrecision( transfer->NullPrecision(gpu ? QUDA_CUDA_FIELD_LOCATION : QUDA_CPU_FIELD_LOCATION) );
     gParam.nDim = ndim;
     gParam.siteSubset = QUDA_FULL_SITE_SUBSET;
     gParam.ghostExchange = QUDA_GHOST_EXCHANGE_PAD;
     gParam.nFace = 1;
     gParam.geometry = QUDA_COARSE_GEOMETRY;
     if (mapped) gParam.mem_type = QUDA_MEMORY_MAPPED;

     int pad = std::max( { (x[0]*x[1]*x[2])/2, (x[1]*x[2]*x[3])/2, (x[0]*x[2]*x[3])/2, (x[0]*x[1]*x[3])/2 } );
     gParam.pad = gpu ? gParam.nFace * pad * 2 : 0; // factor of 2 since we have to store bi-directional ghost zone

     if (gpu) Y_d = new cudaGaugeField(gParam);
     else     Y_h = new cpuGaugeField(gParam);

     gParam.ghostExchange = QUDA_GHOST_EXCHANGE_NO;
     gParam.nFace = 0;
     gParam.geometry = QUDA_SCALAR_GEOMETRY;
     gParam.pad = 0;

     if (gpu) X_d = new cudaGaugeField(gParam);
     else     X_h = new cpuGaugeField(gParam);
   }

   void DiracCoarse::createYhat(bool gpu) const
   {
     int ndim = transfer->Vectors().Ndim();
     int x[QUDA_MAX_DIM];
     const int *geo_bs = transfer->Geo_bs(); // Number of coarse sites.
     for (int i = 0; i < ndim; i++) x[i] = transfer->Vectors().X(i)/geo_bs[i];
     int Nc_c = transfer->nvec();     // Coarse Color
     int Ns_c = transfer->Vectors().Nspin()/transfer->Spin_bs(); // Coarse Spin

     GaugeFieldParam gParam;
     memcpy(gParam.x, x, QUDA_MAX_DIM*sizeof(int));
     gParam.nColor = Nc_c*Ns_c;
     gParam.reconstruct = QUDA_RECONSTRUCT_NO;
     gParam.order = gpu ? QUDA_FLOAT2_GAUGE_ORDER : QUDA_QDP_GAUGE_ORDER;
     gParam.link_type = QUDA_COARSE_LINKS;
     gParam.t_boundary = QUDA_PERIODIC_T;
     gParam.create = QUDA_ZERO_FIELD_CREATE;
     // use null-space precision for preconditioned links on gpu
     gParam.setPrecision( transfer->NullPrecision(gpu ? QUDA_CUDA_FIELD_LOCATION : QUDA_CPU_FIELD_LOCATION) );
     gParam.nDim = ndim;
     gParam.siteSubset = QUDA_FULL_SITE_SUBSET;
     gParam.ghostExchange = QUDA_GHOST_EXCHANGE_PAD;
     gParam.nFace = 1;
     gParam.geometry = QUDA_COARSE_GEOMETRY;

     int pad = std::max( { (x[0]*x[1]*x[2])/2, (x[1]*x[2]*x[3])/2, (x[0]*x[2]*x[3])/2, (x[0]*x[1]*x[3])/2 } );
     gParam.pad = gpu ? gParam.nFace * pad * 2 : 0; // factor of 2 since we have to store bi-directional ghost zone

     if (gpu) Yhat_d = new cudaGaugeField(gParam);
     else     Yhat_h = new cpuGaugeField(gParam);

     gParam.setPrecision(gpu ? X_d->Precision() : X_h->Precision());
     gParam.ghostExchange = QUDA_GHOST_EXCHANGE_NO;
     gParam.nFace = 0;
     gParam.geometry = QUDA_SCALAR_GEOMETRY;
     gParam.pad = 0;

     if (gpu) Xinv_d = new cudaGaugeField(gParam);
     else     Xinv_h = new cpuGaugeField(gParam);
   }

   void DiracCoarse::initializeCoarse()
   {
     createY(gpu_setup, mapped);

     if (gpu_setup) dirac->createCoarseOp(*Y_d,*X_d,*transfer,kappa,mass,Mu(),MuFactor());
     else dirac->createCoarseOp(*Y_h,*X_h,*transfer,kappa,mass,Mu(),MuFactor());

     createYhat(gpu_setup);

     if (gpu_setup) createPreconditionedCoarseOp(*Yhat_d,*Xinv_d,*Y_d,*X_d);
     else createPreconditionedCoarseOp(*Yhat_h,*Xinv_h,*Y_h,*X_h);

     if (gpu_setup) {
       enable_gpu = true;
       init_gpu = true;
     } else {
       enable_cpu = true;
       init_cpu = true;
     }
   }

   // we only copy to host or device lazily on demand
   void DiracCoarse::initializeLazy(QudaFieldLocation location) const
   {
     if (!enable_cpu && !enable_gpu) errorQuda("Neither CPU or GPU coarse fields initialized");
     switch(location) {
     case QUDA_CUDA_FIELD_LOCATION:
       if (enable_gpu) return;
       createY(true, mapped);
       createYhat(true);
       Y_d->copy(*Y_h);
       Yhat_d->copy(*Yhat_h);
       X_d->copy(*X_h);
       Xinv_d->copy(*Xinv_h);
       enable_gpu = true;
       init_gpu = true;
       break;
     case QUDA_CPU_FIELD_LOCATION:
       if (enable_cpu) return;
       createY(false);
       createYhat(false);
       Y_h->copy(*Y_d);
       Yhat_h->copy(*Yhat_d);
       X_h->copy(*X_d);
       Xinv_h->copy(*Xinv_d);
       enable_cpu = true;
       init_cpu = true;
       break;
     default:
       errorQuda("Unknown location");
     }
   }

   void DiracCoarse::createPreconditionedCoarseOp(GaugeField &Yhat, GaugeField &Xinv, const GaugeField &Y, const GaugeField &X) {
     calculateYhat(Yhat, Xinv, Y, X);
   }

   void DiracCoarse::Clover(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
   {
     if (&in == &out) errorQuda("Fields cannot alias");
     QudaFieldLocation location = checkLocation(out,in);
     initializeLazy(location);
     if (location == QUDA_CUDA_FIELD_LOCATION) {
       ApplyCoarse(out, in, in, *Y_d, *X_d, kappa, parity, false, true, dagger, commDim);
     } else if (location == QUDA_CPU_FIELD_LOCATION) {
       ApplyCoarse(out, in, in, *Y_h, *X_h, kappa, parity, false, true, dagger, commDim);
     }
     int n = in.Nspin()*in.Ncolor();
     flops += (8*n*n-2*n)*(long long)in.VolumeCB();
   }

   void DiracCoarse::CloverInv(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
   {
     if (&in == &out) errorQuda("Fields cannot alias");
     QudaFieldLocation location = checkLocation(out,in);
     initializeLazy(location);
     if ( location  == QUDA_CUDA_FIELD_LOCATION ) {
       ApplyCoarse(out, in, in, *Y_d, *Xinv_d, kappa, parity, false, true, dagger, commDim);
     } else if ( location == QUDA_CPU_FIELD_LOCATION ) {
       ApplyCoarse(out, in, in, *Y_h, *Xinv_h, kappa, parity, false, true, dagger, commDim);
     }
     int n = in.Nspin()*in.Ncolor();
     flops += (8*n*n-2*n)*(long long)in.VolumeCB();
   }

   void DiracCoarse::Dslash(ColorSpinorField &out, const ColorSpinorField &in,
          const QudaParity parity) const
   {
     QudaFieldLocation location = checkLocation(out,in);
     initializeLazy(location);
     if ( location == QUDA_CUDA_FIELD_LOCATION ) {
       ApplyCoarse(out, in, in, *Y_d, *X_d, kappa, parity, true, false, dagger, commDim, halo_precision);
     } else if ( location == QUDA_CPU_FIELD_LOCATION ) {
       ApplyCoarse(out, in, in, *Y_h, *X_h, kappa, parity, true, false, dagger, commDim, halo_precision);
     }
     int n = in.Nspin()*in.Ncolor();
     flops += (8*(8*n*n)-2*n)*(long long)in.VolumeCB()*in.SiteSubset();
   }

   void DiracCoarse::DslashXpay(ColorSpinorField &out, const ColorSpinorField &in,
              const QudaParity parity, const ColorSpinorField &x,
              const double &k) const
   {
     if (k!=1.0) errorQuda("%s not supported for k!=1.0", __func__);

     QudaFieldLocation location = checkLocation(out,in);
     initializeLazy(location);
     if ( location == QUDA_CUDA_FIELD_LOCATION ) {
       ApplyCoarse(out, in, x, *Y_d, *X_d, kappa, parity, true, true, dagger, commDim, halo_precision);
     } else if ( location == QUDA_CPU_FIELD_LOCATION ) {
       ApplyCoarse(out, in, x, *Y_h, *X_h, kappa, parity, true, true, dagger, commDim, halo_precision);
     }
     int n = in.Nspin()*in.Ncolor();
     flops += (9*(8*n*n)-2*n)*(long long)in.VolumeCB()*in.SiteSubset();
   }

   void DiracCoarse::M(ColorSpinorField &out, const ColorSpinorField &in) const
   {
     QudaFieldLocation location = checkLocation(out,in);
     initializeLazy(location);
     if ( location == QUDA_CUDA_FIELD_LOCATION ) {
       ApplyCoarse(out, in, in, *Y_d, *X_d, kappa, QUDA_INVALID_PARITY, true, true, dagger, commDim, halo_precision);
     } else if ( location == QUDA_CPU_FIELD_LOCATION ) {
       ApplyCoarse(out, in, in, *Y_h, *X_h, kappa, QUDA_INVALID_PARITY, true, true, dagger, commDim, halo_precision);
     }
     int n = in.Nspin()*in.Ncolor();
     flops += (9*(8*n*n)-2*n)*(long long)in.VolumeCB()*in.SiteSubset();
   }

   void DiracCoarse::MdagM(ColorSpinorField &out, const ColorSpinorField &in) const
   {
     bool reset1 = newTmp(&tmp1, in);
     if (tmp1->SiteSubset() != QUDA_FULL_SITE_SUBSET) errorQuda("Temporary vector is not full-site vector");

     M(*tmp1, in);
     Mdag(out, *tmp1);

     deleteTmp(&tmp1, reset1);
   }

   void DiracCoarse::prepare(ColorSpinorField* &src, ColorSpinorField* &sol,
           ColorSpinorField &x, ColorSpinorField &b,
           const QudaSolutionType solType) const
   {
     if (solType == QUDA_MATPC_SOLUTION || solType == QUDA_MATPCDAG_MATPC_SOLUTION) {
       errorQuda("Preconditioned solution requires a preconditioned solve_type");
     }

     src = &b;
     sol = &x;
   }

   void DiracCoarse::reconstruct(ColorSpinorField &x, const ColorSpinorField &b,
         const QudaSolutionType solType) const
   {
     /* do nothing */
   }

   //Make the coarse operator one level down.  Pass both the coarse gauge field and coarse clover field.
   void DiracCoarse::createCoarseOp(GaugeField &Y, GaugeField &X, const Transfer &T, double kappa, double mass, double mu, double mu_factor) const
   {
     double a = 2.0 * kappa * mu * T.Vectors().TwistFlavor();
     if (checkLocation(Y, X) == QUDA_CPU_FIELD_LOCATION) {
       initializeLazy(QUDA_CPU_FIELD_LOCATION);
       CoarseCoarseOp(Y, X, T, *(this->Y_h), *(this->X_h), *(this->Xinv_h), kappa, a, mu_factor, QUDA_COARSE_DIRAC,
                      QUDA_MATPC_INVALID, need_bidirectional);
     } else {
       initializeLazy(QUDA_CUDA_FIELD_LOCATION);
       CoarseCoarseOp(Y, X, T, *(this->Y_d), *(this->X_d), *(this->Xinv_d), kappa, a, mu_factor, QUDA_COARSE_DIRAC,
                      QUDA_MATPC_INVALID, need_bidirectional);
     }
   }

   DiracCoarsePC::DiracCoarsePC(const DiracParam &param, bool gpu_setup) : DiracCoarse(param, gpu_setup)
   {
     /* do nothing */
   }

   DiracCoarsePC::DiracCoarsePC(const DiracCoarse &dirac, const DiracParam &param) : DiracCoarse(dirac, param)
   {
     /* do nothing */
   }

   DiracCoarsePC::~DiracCoarsePC() { }

   void DiracCoarsePC::Dslash(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
   {
     QudaFieldLocation location = checkLocation(out,in);
     initializeLazy(location);
     if ( location == QUDA_CUDA_FIELD_LOCATION) {
       ApplyCoarse(out, in, in, *Yhat_d, *X_d, kappa, parity, true, false, dagger, commDim, halo_precision);
     } else if ( location == QUDA_CPU_FIELD_LOCATION ) {
       ApplyCoarse(out, in, in, *Yhat_h, *X_h, kappa, parity, true, false, dagger, commDim, halo_precision);
     }

     int n = in.Nspin()*in.Ncolor();
     flops += (8*(8*n*n)-2*n)*in.VolumeCB()*in.SiteSubset();
   }

   void DiracCoarsePC::DslashXpay(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity,
          const ColorSpinorField &x, const double &k) const
   {
     // emulated for now
     Dslash(out, in, parity);
     blas::xpay(const_cast<ColorSpinorField&>(x), k, out);

     int n = in.Nspin()*in.Ncolor();
     flops += (8*(8*n*n)-2*n)*in.VolumeCB(); // blas flops counted separately so only need to count dslash flops
   }

   void DiracCoarsePC::M(ColorSpinorField &out, const ColorSpinorField &in) const
   {
     bool reset1 = newTmp(&tmp1, in);

     if (in.SiteSubset() == QUDA_FULL_SITE_SUBSET || out.SiteSubset() == QUDA_FULL_SITE_SUBSET ||
   tmp1->SiteSubset() == QUDA_FULL_SITE_SUBSET)
       errorQuda("Cannot apply preconditioned operator to full field (subsets = %d %d %d)",
     in.SiteSubset(), out.SiteSubset(), tmp1->SiteSubset());

     if (matpcType == QUDA_MATPC_EVEN_EVEN_ASYMMETRIC) {
       // DiracCoarsePC::Dslash applies A^{-1}Dslash
       Dslash(*tmp1, in, QUDA_ODD_PARITY);
       // DiracCoarse::DslashXpay applies (A - D) // FIXME this ignores the -1
       DiracCoarse::Dslash(out, *tmp1, QUDA_EVEN_PARITY);
       Clover(*tmp1, in, QUDA_EVEN_PARITY);
       blas::xpay(*tmp1, -1.0, out);
     } else if (matpcType == QUDA_MATPC_ODD_ODD_ASYMMETRIC) {
       // DiracCoarsePC::Dslash applies A^{-1}Dslash
       Dslash(*tmp1, in, QUDA_EVEN_PARITY);
       // DiracCoarse::DslashXpay applies (A - D) // FIXME this ignores the -1
       DiracCoarse::Dslash(out, *tmp1, QUDA_ODD_PARITY);
       Clover(*tmp1, in, QUDA_ODD_PARITY);
       blas::xpay(*tmp1, -1.0, out);
     } else if (matpcType == QUDA_MATPC_EVEN_EVEN) {
       Dslash(*tmp1, in, QUDA_ODD_PARITY);
       DslashXpay(out, *tmp1, QUDA_EVEN_PARITY, in, -1.0);
     } else if (matpcType == QUDA_MATPC_ODD_ODD) {
       Dslash(*tmp1, in, QUDA_EVEN_PARITY);
       DslashXpay(out, *tmp1, QUDA_ODD_PARITY, in, -1.0);
     } else {
       errorQuda("MatPCType %d not valid for DiracCoarsePC", matpcType);
     }

     deleteTmp(&tmp1, reset1);
   }

   void DiracCoarsePC::MdagM(ColorSpinorField &out, const ColorSpinorField &in) const
   {
     bool reset1 = newTmp(&tmp2, in);
     M(*tmp2, in);
     Mdag(out, *tmp2);
     deleteTmp(&tmp2, reset1);
   }

   void DiracCoarsePC::prepare(ColorSpinorField* &src, ColorSpinorField* &sol, ColorSpinorField &x, ColorSpinorField &b,
             const QudaSolutionType solType) const
   {
     // we desire solution to preconditioned system
     if (solType == QUDA_MATPC_SOLUTION || solType == QUDA_MATPCDAG_MATPC_SOLUTION) {
       src = &b;
       sol = &x;
       return;
     }

     bool reset = newTmp(&tmp1, b.Even());

     // we desire solution to full system
     if (matpcType == QUDA_MATPC_EVEN_EVEN) {
       // src = A_ee^-1 (b_e - D_eo A_oo^-1 b_o)
       src = &(x.Odd());
       CloverInv(*src, b.Odd(), QUDA_ODD_PARITY);
       DiracCoarse::Dslash(*tmp1, *src, QUDA_EVEN_PARITY);
       blas::xpay(const_cast<ColorSpinorField&>(b.Even()), -1.0, *tmp1);
       CloverInv(*src, *tmp1, QUDA_EVEN_PARITY);
       sol = &(x.Even());
     } else if (matpcType == QUDA_MATPC_ODD_ODD) {
       // src = A_oo^-1 (b_o - D_oe A_ee^-1 b_e)
       src = &(x.Even());
       CloverInv(*src, b.Even(), QUDA_EVEN_PARITY);
       DiracCoarse::Dslash(*tmp1, *src, QUDA_ODD_PARITY);
       blas::xpay(const_cast<ColorSpinorField&>(b.Odd()), -1.0, *tmp1);
       CloverInv(*src, *tmp1, QUDA_ODD_PARITY);
       sol = &(x.Odd());
     } else if (matpcType == QUDA_MATPC_EVEN_EVEN_ASYMMETRIC) {
       // src = b_e - D_eo A_oo^-1 b_o
       src = &(x.Odd());
       CloverInv(*tmp1, b.Odd(), QUDA_ODD_PARITY);
       DiracCoarse::Dslash(*src, *tmp1, QUDA_EVEN_PARITY);
       blas::xpay(const_cast<ColorSpinorField&>(b.Even()), -1.0, *src);
       sol = &(x.Even());
     } else if (matpcType == QUDA_MATPC_ODD_ODD_ASYMMETRIC) {
       // src = b_o - D_oe A_ee^-1 b_e
       src = &(x.Even());
       CloverInv(*tmp1, b.Even(), QUDA_EVEN_PARITY);
       DiracCoarse::Dslash(*src, *tmp1, QUDA_ODD_PARITY);
       blas::xpay(const_cast<ColorSpinorField&>(b.Odd()), -1.0, *src);
       sol = &(x.Odd());
     } else {
       errorQuda("MatPCType %d not valid for DiracCloverPC", matpcType);
     }

     // here we use final solution to store parity solution and parity source
     // b is now up for grabs if we want

     deleteTmp(&tmp1, reset);
   }

   void DiracCoarsePC::reconstruct(ColorSpinorField &x, const ColorSpinorField &b, const QudaSolutionType solType) const
   {
     if (solType == QUDA_MATPC_SOLUTION || solType == QUDA_MATPCDAG_MATPC_SOLUTION) {
       return;
     }

     checkFullSpinor(x, b);

     bool reset = newTmp(&tmp1, b.Even());

     // create full solution

     if (matpcType == QUDA_MATPC_EVEN_EVEN ||
   matpcType == QUDA_MATPC_EVEN_EVEN_ASYMMETRIC) {
       // x_o = A_oo^-1 (b_o - D_oe x_e)
       DiracCoarse::Dslash(*tmp1, x.Even(), QUDA_ODD_PARITY);
       blas::xpay(const_cast<ColorSpinorField&>(b.Odd()), -1.0, *tmp1);
       CloverInv(x.Odd(), *tmp1, QUDA_ODD_PARITY);
     } else if (matpcType == QUDA_MATPC_ODD_ODD ||
          matpcType == QUDA_MATPC_ODD_ODD_ASYMMETRIC) {
       // x_e = A_ee^-1 (b_e - D_eo x_o)
       DiracCoarse::Dslash(*tmp1, x.Odd(), QUDA_EVEN_PARITY);
       blas::xpay(const_cast<ColorSpinorField&>(b.Even()), -1.0, *tmp1);
       CloverInv(x.Even(), *tmp1, QUDA_EVEN_PARITY);
     } else {
       errorQuda("MatPCType %d not valid for DiracCoarsePC", matpcType);
     }

     deleteTmp(&tmp1, reset);
   }

   //Make the coarse operator one level down.  For the preconditioned
   //operator we are coarsening the Yhat links, not the Y links.  We
   //pass the fine clover fields, though they are actually ignored.
   void DiracCoarsePC::createCoarseOp(GaugeField &Y, GaugeField &X, const Transfer &T, double kappa, double mass, double mu, double mu_factor) const
   {
     double a = -2.0 * kappa * mu * T.Vectors().TwistFlavor();
     if (checkLocation(Y, X) == QUDA_CPU_FIELD_LOCATION) {
       initializeLazy(QUDA_CPU_FIELD_LOCATION);
       CoarseCoarseOp(Y, X, T, *(this->Yhat_h), *(this->X_h), *(this->Xinv_h), kappa, a, -mu_factor, QUDA_COARSEPC_DIRAC,
                      matpcType, true);
     } else {
       initializeLazy(QUDA_CUDA_FIELD_LOCATION);
       CoarseCoarseOp(Y, X, T, *(this->Yhat_d), *(this->X_d), *(this->Xinv_d), kappa, a, -mu_factor, QUDA_COARSEPC_DIRAC,
                      matpcType, true);
     }
   }

 }
quda::DiracCoarse::~DiracCoarse
virtual ~DiracCoarse()
Definition: dirac_coarse.cpp:86

quda::GaugeFieldParam::t_boundary
QudaTboundary t_boundary
Definition: gauge_field.h:20

QUDA_RECONSTRUCT_NO
Definition: enum_quda.h:67

quda::ColorSpinorField::Nspin
int Nspin() const
Definition: color_spinor_field.h:406

quda::LatticeFieldParam::ghostExchange
QudaGhostExchange ghostExchange
Definition: lattice_field.h:76

quda::Dirac::flops
unsigned long long flops
Definition: dirac_quda.h:121

quda::ApplyCoarse
void ApplyCoarse(ColorSpinorField &out, const ColorSpinorField &inA, const ColorSpinorField &inB, const GaugeField &Y, const GaugeField &X, double kappa, int parity=QUDA_INVALID_PARITY, bool dslash=true, bool clover=true, bool dagger=false, const int *commDim=0, QudaPrecision halo_precision=QUDA_INVALID_PRECISION)
Apply the coarse dslash stencil. This single driver accounts for all variations with and without the ...
Definition: dslash_coarse.cu:772

mu
double mu
Definition: test_util.cpp:1648

quda::DiracCoarsePC::prepare
void prepare(ColorSpinorField *&src, ColorSpinorField *&sol, ColorSpinorField &x, ColorSpinorField &b, const QudaSolutionType) const
Definition: dirac_coarse.cpp:437

QUDA_INVALID_PARITY
Definition: enum_quda.h:289

QUDA_MATPC_ODD_ODD
Definition: enum_quda.h:211

quda::CoarseCoarseOp
void CoarseCoarseOp(GaugeField &Y, GaugeField &X, const Transfer &T, const GaugeField &gauge, const GaugeField &clover, const GaugeField &cloverInv, double kappa, double mu, double mu_factor, QudaDiracType dirac, QudaMatPCType matpc, bool need_bidirectional)
Coarse operator construction from an intermediate-grid operator (Coarse)
Definition: coarsecoarse_op.cu:192

quda::ColorSpinorField
Definition: color_spinor_field.h:311

quda::Transfer
Definition: transfer.h:29

quda::DiracCoarse::init_cpu
bool init_cpu
Definition: dirac_quda.h:845

quda::DiracCoarse::X_h
cpuGaugeField * X_h
Definition: dirac_quda.h:819

quda::Dirac::createCoarseOp
virtual void createCoarseOp(GaugeField &Y, GaugeField &X, const Transfer &T, double kappa, double mass=0., double mu=0., double mu_factor=0.) const
Create the coarse operator (virtual parent)
Definition: dirac_quda.h:196

quda::DiracCoarsePC::~DiracCoarsePC
virtual ~DiracCoarsePC()
Definition: dirac_coarse.cpp:366

errorQuda
#define errorQuda(...)
Definition: util_quda.h:121

QUDA_CUDA_FIELD_LOCATION
Definition: enum_quda.h:326

quda::ColorSpinorField::VolumeCB
int VolumeCB() const
Definition: color_spinor_field.h:416

quda::DiracCoarse::CloverInv
void CloverInv(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Apply the inverse coarse clover operator.
Definition: dirac_coarse.cpp:254

QUDA_ODD_PARITY
Definition: enum_quda.h:288

quda::Dirac::checkFullSpinor
virtual void checkFullSpinor(const ColorSpinorField &, const ColorSpinorField &) const
Definition: dirac.cpp:146

QUDA_QDP_GAUGE_ORDER
Definition: enum_quda.h:41

quda::DiracCoarsePC::M
void M(ColorSpinorField &out, const ColorSpinorField &in) const
Apply the full operator.
Definition: dirac_coarse.cpp:393

quda::DiracCoarsePC::Dslash
void Dslash(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Apply DslashXpay out = (D * in)
Definition: dirac_coarse.cpp:368

QUDA_FLOAT2_GAUGE_ORDER
Definition: enum_quda.h:39

QUDA_FULL_SITE_SUBSET
Definition: enum_quda.h:333

quda::ColorSpinorField::Even
const ColorSpinorField & Even() const
Definition: color_spinor_field.cpp:608

quda::Dirac::deleteTmp
void deleteTmp(ColorSpinorField **, const bool &reset) const
Definition: dirac.cpp:81

quda::ColorSpinorField::Odd
const ColorSpinorField & Odd() const
Definition: color_spinor_field.cpp:616

Yhat_d
cudaGaugeField * Yhat_d
Definition: multigrid_benchmark_test.cu:46

quda::DiracCoarse::DslashXpay
virtual void DslashXpay(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity, const ColorSpinorField &x, const double &k) const
Apply DslashXpay out = (D * in + A * x)
Definition: dirac_coarse.cpp:282

quda::DiracCoarse::need_bidirectional
const bool need_bidirectional
Definition: dirac_quda.h:816

quda::DiracCoarse::createPreconditionedCoarseOp
void createPreconditionedCoarseOp(GaugeField &Yhat, GaugeField &Xinv, const GaugeField &Y, const GaugeField &X)
Create the precondtioned coarse operator.
Definition: dirac_coarse.cpp:236

quda::DiracCoarse::createY
void createY(bool gpu=true, bool mapped=false) const
Allocate the Y and X fields.
Definition: dirac_coarse.cpp:102

quda::Transfer::nvec
int nvec() const
Definition: transfer.h:218

quda::DiracCoarse::mu_factor
double mu_factor
Definition: dirac_quda.h:813

quda::DiracCoarse::createCoarseOp
void createCoarseOp(GaugeField &Y, GaugeField &X, const Transfer &T, double kappa, double mass, double mu, double mu_factor=0.) const
Create the coarse operator from this coarse operator.
Definition: dirac_coarse.cpp:342

quda::DiracCoarse::Clover
void Clover(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Apply the coarse clover operator.
Definition: dirac_coarse.cpp:240

quda::DiracCoarse::prepare
virtual void prepare(ColorSpinorField *&src, ColorSpinorField *&sol, ColorSpinorField &x, ColorSpinorField &b, const QudaSolutionType) const
Definition: dirac_coarse.cpp:323

quda::ColorSpinorField::Ncolor
int Ncolor() const
Definition: color_spinor_field.h:405

quda::ColorSpinorField::Ndim
int Ndim() const
Definition: color_spinor_field.h:409

quda::DiracCoarse
Definition: dirac_quda.h:809

QUDA_COARSE_LINKS
Definition: enum_quda.h:27

quda::DiracCoarse::MdagM
virtual void MdagM(ColorSpinorField &out, const ColorSpinorField &in) const
Definition: dirac_coarse.cpp:312

quda
Definition: blas_cublas.h:5

quda::LatticeFieldParam::siteSubset
QudaSiteSubset siteSubset
Definition: lattice_field.h:71

Y_h
cpuGaugeField * Y_h
Definition: multigrid_benchmark_test.cu:45

quda::DiracCoarsePC::createCoarseOp
void createCoarseOp(GaugeField &Y, GaugeField &X, const Transfer &T, double kappa, double mass, double mu, double mu_factor=0.) const
Create the coarse even-odd preconditioned coarse operator. Unlike the Wilson operator, the coarsening of the preconditioned coarse operator differs from that of the unpreconditioned coarse operator, so we need to specialize it.
Definition: dirac_coarse.cpp:524

quda::blas::xpay
void xpay(ColorSpinorField &x, double a, ColorSpinorField &y)
Definition: blas_quda.h:37

quda::DiracCoarsePC::DslashXpay
void DslashXpay(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity, const ColorSpinorField &x, const double &k) const
Apply DslashXpay out = (D * in + A * x)
Definition: dirac_coarse.cpp:382

param
QudaGaugeParam param
Definition: pack_test.cpp:17

quda::DiracCoarse::Y_d
cudaGaugeField * Y_d
Definition: dirac_quda.h:823

quda::Dirac::newTmp
bool newTmp(ColorSpinorField **, const ColorSpinorField &) const
Definition: dirac.cpp:70

quda::DiracCoarse::enable_gpu
bool enable_gpu
Definition: dirac_quda.h:841

ndim
static int ndim
Definition: layout_hyper.c:53

quda::DiracCoarsePC::MdagM
void MdagM(ColorSpinorField &out, const ColorSpinorField &in) const
Definition: dirac_coarse.cpp:429

QUDA_MATPC_SOLUTION
Definition: enum_quda.h:153

quda::LatticeFieldParam::x
int x[QUDA_MAX_DIM]
Definition: lattice_field.h:67

quda::Dirac::commDim
int commDim[QUDA_MAX_DIM]
Definition: dirac_quda.h:130

quda::DiracCoarse::Dslash
virtual void Dslash(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Apply DslashXpay out = (D * in)
Definition: dirac_coarse.cpp:268

QUDA_MATPC_EVEN_EVEN_ASYMMETRIC
Definition: enum_quda.h:212

quda::GaugeFieldParam
Definition: gauge_field.h:10

quda::DiracCoarse::init_gpu
bool init_gpu
Definition: dirac_quda.h:844

quda::DiracParam
Definition: dirac_quda.h:19

multigrid.h

Xinv_d
cudaGaugeField * Xinv_d
Definition: multigrid_benchmark_test.cu:46

Yhat_h
cpuGaugeField * Yhat_h
Definition: multigrid_benchmark_test.cu:45

quda::DiracCoarsePC::reconstruct
void reconstruct(ColorSpinorField &x, const ColorSpinorField &b, const QudaSolutionType) const
Definition: dirac_coarse.cpp:490

quda::DiracCoarse::transfer
const Transfer * transfer
Definition: dirac_quda.h:814

quda::cpuGaugeField::copy
void copy(const GaugeField &src)
Definition: cpu_gauge_field.cpp:261

Xinv_h
cpuGaugeField * Xinv_h
Definition: multigrid_benchmark_test.cu:45

quda::DiracCoarse::gpu_setup
const bool gpu_setup
Definition: dirac_quda.h:843

in
cpuColorSpinorField * in
Definition: staggered_invert_test.cpp:98

quda::cpuGaugeField
Definition: gauge_field.h:580

quda::DiracCoarse::initializeCoarse
void initializeCoarse()
Initialize the coarse gauge fields. Location is determined by gpu_setup variable. ...
Definition: dirac_coarse.cpp:183

quda::ColorSpinorField::SiteSubset
QudaSiteSubset SiteSubset() const
Definition: color_spinor_field.h:481

quda::Dirac::mass
double mass
Definition: dirac_quda.h:117

QUDA_PERIODIC_T
Definition: enum_quda.h:54

quda::GaugeFieldParam::order
QudaGaugeFieldOrder order
Definition: gauge_field.h:17

quda::DiracCoarse::mu
double mu
Definition: dirac_quda.h:812

checkLocation
#define checkLocation(...)
Definition: lattice_field.h:664

quda::cudaGaugeField
Definition: gauge_field.h:404

QudaSolutionType
enum QudaSolutionType_s QudaSolutionType

QUDA_GHOST_EXCHANGE_NO
Definition: enum_quda.h:482

quda::Dirac::dagger
QudaDagType dagger
Definition: dirac_quda.h:120

quda::Transfer::Spin_bs
int Spin_bs() const
Definition: transfer.h:224

X
int X[4]
Definition: covdev_test.cpp:70

quda::DiracCoarse::X_d
cudaGaugeField * X_d
Definition: dirac_quda.h:824

QudaParity
enum QudaParity_s QudaParity

quda::DiracCoarse::Mu
double Mu() const
Definition: dirac_quda.h:862

quda::GaugeFieldParam::nFace
int nFace
Definition: gauge_field.h:14

quda::LatticeFieldParam::nDim
int nDim
Definition: lattice_field.h:64

quda::Dirac::kappa
double kappa
Definition: dirac_quda.h:116

quda::Dirac::matpcType
QudaMatPCType matpcType
Definition: dirac_quda.h:119

quda::calculateYhat
void calculateYhat(GaugeField &Yhat, GaugeField &Xinv, const GaugeField &Y, const GaugeField &X)
Calculate preconditioned coarse links and coarse clover inverse field.
Definition: coarse_op_preconditioned.cu:245

X_d
cudaGaugeField * X_d
Definition: multigrid_benchmark_test.cu:46

quda::Dirac::halo_precision
QudaPrecision halo_precision
Definition: dirac_quda.h:125

quda::DiracCoarsePC::DiracCoarsePC
DiracCoarsePC(const DiracParam &param, bool gpu_setup=true)
Definition: dirac_coarse.cpp:356

quda::Transfer::Geo_bs
const int * Geo_bs() const
Definition: transfer.h:230

quda::Dirac::Mdag
void Mdag(ColorSpinorField &out, const ColorSpinorField &in) const
Definition: dirac.cpp:90

quda::GaugeFieldParam::nColor
int nColor
Definition: gauge_field.h:13

quda::Transfer::NullPrecision
QudaPrecision NullPrecision(QudaFieldLocation location) const
The precision of the packed null-space vectors.
Definition: transfer.h:195

QudaFieldLocation
enum QudaFieldLocation_s QudaFieldLocation

quda::GaugeFieldParam::setPrecision
void setPrecision(QudaPrecision precision, bool force_native=false)
Helper function for setting the precision and corresponding field order for QUDA internal fields...
Definition: gauge_field.h:131

quda::DiracCoarse::Xinv_d
cudaGaugeField * Xinv_d
Definition: dirac_quda.h:825

dirac
GaugeCovDev * dirac
Definition: covdev_test.cpp:73

out
cpuColorSpinorField * out
Definition: staggered_invert_test.cpp:99

QUDA_MATPC_ODD_ODD_ASYMMETRIC
Definition: enum_quda.h:213

gParam
GaugeFieldParam gParam
Definition: hisq_paths_force_test.cpp:64

quda::DiracCoarse::reconstruct
virtual void reconstruct(ColorSpinorField &x, const ColorSpinorField &b, const QudaSolutionType) const
Definition: dirac_coarse.cpp:335

quda::DiracCoarse::Yhat_d
cudaGaugeField * Yhat_d
Definition: dirac_quda.h:826

quda::DiracCoarse::Xinv_h
cpuGaugeField * Xinv_h
Definition: dirac_quda.h:820

X_h
cpuGaugeField * X_h
Definition: multigrid_benchmark_test.cu:45

quda::GaugeFieldParam::link_type
QudaLinkType link_type
Definition: gauge_field.h:19

quda::DiracCoarse::Y_h
cpuGaugeField * Y_h
Definition: dirac_quda.h:818

QUDA_COARSEPC_DIRAC
Definition: enum_quda.h:316

quda::LatticeFieldParam::mem_type
QudaMemoryType mem_type
Definition: lattice_field.h:73

Y_d
cudaGaugeField * Y_d
Definition: multigrid_benchmark_test.cu:46

quda::ColorSpinorField::TwistFlavor
QudaTwistFlavorType TwistFlavor() const
Definition: color_spinor_field.h:408

mu_factor
double mu_factor[QUDA_MAX_MG_LEVEL]
Definition: test_util.cpp:1674

transfer
int transfer
Definition: covdev_test.cpp:55

quda::DiracCoarse::Yhat_h
cpuGaugeField * Yhat_h
Definition: dirac_quda.h:821

quda::GaugeFieldParam::reconstruct
QudaReconstructType reconstruct
Definition: gauge_field.h:16

quda::GaugeFieldParam::create
QudaFieldCreate create
Definition: gauge_field.h:26

quda::DiracCoarse::initializeLazy
void initializeLazy(QudaFieldLocation location) const
Create the CPU or GPU coarse gauge fields on demand (requires that the fields have been created in th...
Definition: dirac_coarse.cpp:205

quda::ColorSpinorField::X
const int * X() const
Definition: color_spinor_field.h:410

QUDA_EVEN_PARITY
Definition: enum_quda.h:287

QUDA_COARSE_GEOMETRY
Definition: enum_quda.h:477

QUDA_MAX_DIM
#define QUDA_MAX_DIM
Maximum number of dimensions supported by QUDA. In practice, no routines make use of more than 5...
Definition: quda_constants.h:17

quda::DiracCoarse::MuFactor
double MuFactor() const
Definition: dirac_quda.h:863

quda::GaugeFieldParam::geometry
QudaFieldGeometry geometry
Definition: gauge_field.h:28

QUDA_SCALAR_GEOMETRY
Definition: enum_quda.h:474

QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:360

QUDA_MATPC_INVALID
Definition: enum_quda.h:214

quda::DiracCoarse::M
virtual void M(ColorSpinorField &out, const ColorSpinorField &in) const
Apply the full operator.
Definition: dirac_coarse.cpp:299

quda::DiracCoarse::dirac
const Dirac * dirac
Definition: dirac_quda.h:815

quda::DiracCoarse::createYhat
void createYhat(bool gpu=true) const
Allocate the Yhat and Xinv fields.
Definition: dirac_coarse.cpp:142

quda::cudaGaugeField::copy
void copy(const GaugeField &src)
Definition: cuda_gauge_field.cpp:630

QUDA_GHOST_EXCHANGE_PAD
Definition: enum_quda.h:483

QUDA_MATPCDAG_MATPC_SOLUTION
Definition: enum_quda.h:155

quda::LatticeField::Precision
QudaPrecision Precision() const
Definition: lattice_field.h:546

QUDA_MATPC_EVEN_EVEN
Definition: enum_quda.h:210

parity
QudaParity parity
Definition: covdev_test.cpp:54

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:325

quda::Dirac::tmp2
ColorSpinorField * tmp2
Definition: dirac_quda.h:123

quda::Transfer::Vectors
const ColorSpinorField & Vectors(QudaFieldLocation location=QUDA_INVALID_FIELD_LOCATION) const
Definition: transfer.h:205

quda::DiracCoarse::DiracCoarse
DiracCoarse(const DiracParam &param, bool gpu_setup=true, bool mapped=false)
Definition: dirac_coarse.cpp:7

QUDA_COARSE_DIRAC
Definition: enum_quda.h:315

quda::DiracCoarse::mapped
const bool mapped
Definition: dirac_quda.h:846

quda::DiracCoarse::enable_cpu
bool enable_cpu
Definition: dirac_quda.h:842

quda::Dirac
Definition: dirac_quda.h:106

quda::Dirac::tmp1
ColorSpinorField * tmp1
Definition: dirac_quda.h:122

quda::LatticeFieldParam::pad
int pad
Definition: lattice_field.h:69

quda::GaugeField
Definition: gauge_field.h:164

QUDA_MEMORY_MAPPED
Definition: enum_quda.h:14