quda-ref/v1.1.0/dirac__coarse_8cpp_source.html

 #include <string.h>

 #include <multigrid.h>

 #include <algorithm>


 namespace quda {


   DiracCoarse::DiracCoarse(const DiracParam &param, bool gpu_setup, bool mapped) :

     Dirac(param),

     mass(param.mass),

     mu(param.mu),

     mu_factor(param.mu_factor),

     transfer(param.transfer),

     dirac(param.dirac),

     need_bidirectional(param.need_bidirectional),

     use_mma(param.use_mma),

     Y_h(nullptr),

     X_h(nullptr),

     Xinv_h(nullptr),

     Yhat_h(nullptr),

     Y_d(nullptr),

     X_d(nullptr),

     Xinv_d(nullptr),

     Yhat_d(nullptr),

     enable_gpu(false),

     enable_cpu(false),

     gpu_setup(gpu_setup),

     init_gpu(gpu_setup),

     init_cpu(!gpu_setup),

     mapped(mapped)

   {

     if (gpu_setup == false) errorQuda("CPU setup of the coarse Dirac operator is disabled");

     initializeCoarse();

   }


   DiracCoarse::DiracCoarse(const DiracParam &param, cpuGaugeField *Y_h, cpuGaugeField *X_h, cpuGaugeField *Xinv_h,

                            cpuGaugeField *Yhat_h, // cpu link fields

                            cudaGaugeField *Y_d, cudaGaugeField *X_d, cudaGaugeField *Xinv_d,

                            cudaGaugeField *Yhat_d) // gpu link field

     :

     Dirac(param),

     mass(param.mass),

     mu(param.mu),

     mu_factor(param.mu_factor),

     transfer(nullptr),

     dirac(nullptr),

     need_bidirectional(false),

     use_mma(param.use_mma),

     Y_h(Y_h),

     X_h(X_h),

     Xinv_h(Xinv_h),

     Yhat_h(Yhat_h),

     Y_d(Y_d),

     X_d(X_d),

     Xinv_d(Xinv_d),

     Yhat_d(Yhat_d),

     enable_gpu(Y_d ? true : false),

     enable_cpu(Y_h ? true : false),

     gpu_setup(true),

     init_gpu(enable_gpu ? false : true),

     init_cpu(enable_cpu ? false : true),

     mapped(Y_d->MemType() == QUDA_MEMORY_MAPPED)

   {


   }


   DiracCoarse::DiracCoarse(const DiracCoarse &dirac, const DiracParam &param) :

     Dirac(param),

     mass(param.mass),

     mu(param.mu),

     mu_factor(param.mu_factor),

     transfer(param.transfer),

     dirac(param.dirac),

     need_bidirectional(param.need_bidirectional),

     use_mma(param.use_mma),

     Y_h(dirac.Y_h),

     X_h(dirac.X_h),

     Xinv_h(dirac.Xinv_h),

     Yhat_h(dirac.Yhat_h),

     Y_d(dirac.Y_d),

     X_d(dirac.X_d),

     Xinv_d(dirac.Xinv_d),

     Yhat_d(dirac.Yhat_d),

     enable_gpu(dirac.enable_gpu),

     enable_cpu(dirac.enable_cpu),

     gpu_setup(dirac.gpu_setup),

     init_gpu(enable_gpu ? false : true),

     init_cpu(enable_cpu ? false : true),

     mapped(dirac.mapped)

   {

   }


   DiracCoarse::~DiracCoarse()

   {

     if (init_cpu) {

       if (Y_h) delete Y_h;

       if (X_h) delete X_h;

       if (Xinv_h) delete Xinv_h;

       if (Yhat_h) delete Yhat_h;

     }

     if (init_gpu) {

       if (Y_d) delete Y_d;

       if (X_d) delete X_d;

       if (Xinv_d) delete Xinv_d;

       if (Yhat_d) delete Yhat_d;

     }

   }


   void DiracCoarse::createY(bool gpu, bool mapped) const

   {

     int ndim = transfer->Vectors().Ndim();

     // FIXME MRHS NDIM hack

     if (ndim == 5 && transfer->Vectors().Nspin() != 4) ndim = 4; // forced case for staggered, coarsened staggered

     int x[QUDA_MAX_DIM];

     const int *geo_bs = transfer->Geo_bs(); // Number of coarse sites.

     for (int i = 0; i < ndim; i++) x[i] = transfer->Vectors().X(i)/geo_bs[i];

     int Nc_c = transfer->nvec(); // Coarse Color

     // Coarse Spin

     int Ns_c = (transfer->Spin_bs() == 0) ? 2 : transfer->Vectors().Nspin() / transfer->Spin_bs();

     GaugeFieldParam gParam;

     memcpy(gParam.x, x, QUDA_MAX_DIM*sizeof(int));

     gParam.nColor = Nc_c*Ns_c;

     gParam.reconstruct = QUDA_RECONSTRUCT_NO;

     gParam.order = gpu ? QUDA_FLOAT2_GAUGE_ORDER : QUDA_QDP_GAUGE_ORDER;

     gParam.link_type = QUDA_COARSE_LINKS;

     gParam.t_boundary = QUDA_PERIODIC_T;

     gParam.create = QUDA_ZERO_FIELD_CREATE;

     // use null-space precision for coarse links on gpu

     gParam.setPrecision( transfer->NullPrecision(gpu ? QUDA_CUDA_FIELD_LOCATION : QUDA_CPU_FIELD_LOCATION) );

     gParam.nDim = ndim;

     gParam.siteSubset = QUDA_FULL_SITE_SUBSET;

     gParam.ghostExchange = QUDA_GHOST_EXCHANGE_PAD;

     gParam.nFace = 1;

     gParam.geometry = QUDA_COARSE_GEOMETRY;

     if (mapped) gParam.mem_type = QUDA_MEMORY_MAPPED;


     int pad = std::max( { (x[0]*x[1]*x[2])/2, (x[1]*x[2]*x[3])/2, (x[0]*x[2]*x[3])/2, (x[0]*x[1]*x[3])/2 } );

     gParam.pad = gpu ? gParam.nFace * pad * 2 : 0; // factor of 2 since we have to store bi-directional ghost zone


     if (gpu) Y_d = new cudaGaugeField(gParam);

     else     Y_h = new cpuGaugeField(gParam);


     gParam.ghostExchange = QUDA_GHOST_EXCHANGE_NO;

     gParam.nFace = 0;

     gParam.geometry = QUDA_SCALAR_GEOMETRY;

     gParam.pad = 0;


     if (gpu) X_d = new cudaGaugeField(gParam);

     else     X_h = new cpuGaugeField(gParam);

   }


   void DiracCoarse::createYhat(bool gpu) const

   {

     int ndim = transfer->Vectors().Ndim();

     if (ndim == 5 && transfer->Vectors().Nspin() != 4) ndim = 4; // forced case for staggered, coarsened staggered

     int x[QUDA_MAX_DIM];

     const int *geo_bs = transfer->Geo_bs(); // Number of coarse sites.

     for (int i = 0; i < ndim; i++) x[i] = transfer->Vectors().X(i)/geo_bs[i];

     int Nc_c = transfer->nvec();     // Coarse Color

     int Ns_c = (transfer->Spin_bs() == 0) ? 2 : transfer->Vectors().Nspin() / transfer->Spin_bs();


     GaugeFieldParam gParam;

     memcpy(gParam.x, x, QUDA_MAX_DIM*sizeof(int));

     gParam.nColor = Nc_c*Ns_c;

     gParam.reconstruct = QUDA_RECONSTRUCT_NO;

     gParam.order = gpu ? QUDA_FLOAT2_GAUGE_ORDER : QUDA_QDP_GAUGE_ORDER;

     gParam.link_type = QUDA_COARSE_LINKS;

     gParam.t_boundary = QUDA_PERIODIC_T;

     gParam.create = QUDA_ZERO_FIELD_CREATE;

     // use null-space precision for preconditioned links on gpu

     gParam.setPrecision( transfer->NullPrecision(gpu ? QUDA_CUDA_FIELD_LOCATION : QUDA_CPU_FIELD_LOCATION) );

     gParam.nDim = ndim;

     gParam.siteSubset = QUDA_FULL_SITE_SUBSET;

     gParam.ghostExchange = QUDA_GHOST_EXCHANGE_PAD;

     gParam.nFace = 1;

     gParam.geometry = QUDA_COARSE_GEOMETRY;


     int pad = std::max( { (x[0]*x[1]*x[2])/2, (x[1]*x[2]*x[3])/2, (x[0]*x[2]*x[3])/2, (x[0]*x[1]*x[3])/2 } );

     gParam.pad = gpu ? gParam.nFace * pad * 2 : 0; // factor of 2 since we have to store bi-directional ghost zone


     if (gpu) Yhat_d = new cudaGaugeField(gParam);

     else     Yhat_h = new cpuGaugeField(gParam);


     gParam.setPrecision(gpu ? X_d->Precision() : X_h->Precision());

     gParam.ghostExchange = QUDA_GHOST_EXCHANGE_NO;

     gParam.nFace = 0;

     gParam.geometry = QUDA_SCALAR_GEOMETRY;

     gParam.pad = 0;


     if (gpu) Xinv_d = new cudaGaugeField(gParam);

     else     Xinv_h = new cpuGaugeField(gParam);

   }


   void DiracCoarse::initializeCoarse()

   {

     createY(gpu_setup, mapped);


     if (!gpu_setup) {


       dirac->createCoarseOp(*Y_h, *X_h, *transfer, kappa, mass, Mu(), MuFactor());

       // save the intermediate tunecache after the UV and VUV tune

       saveTuneCache();

       if (getVerbosity() >= QUDA_VERBOSE) printfQuda("About to build the preconditioned coarse clover\n");


       createYhat(gpu_setup);


       if (getVerbosity() >= QUDA_VERBOSE) printfQuda("Finished building the preconditioned coarse clover\n");

       if (getVerbosity() >= QUDA_VERBOSE) printfQuda("About to create the preconditioned coarse op\n");


       calculateYhat(*Yhat_h, *Xinv_h, *Y_h, *X_h, use_mma);


     } else {


       // The following fancy copies reduce the number of gauge field

       // copies (from and to QUDA_MILC_GAUGE_ORDER) by 2: one for X

       // and one for Y, both to QUDA_MILC_GAUGE_ORDER.

       if (use_mma && dirac->isCoarse()) {


         constexpr QudaGaugeFieldOrder gOrder = QUDA_MILC_GAUGE_ORDER;


         GaugeFieldParam Y_param(*Y_d);

         GaugeFieldParam X_param(*X_d);


         Y_param.order = gOrder;

         X_param.order = gOrder;


         GaugeField *Y_order = cudaGaugeField::Create(Y_param);

         GaugeField *X_order = cudaGaugeField::Create(X_param);


         dirac->createCoarseOp(*Y_order, *X_order, *transfer, kappa, mass, Mu(), MuFactor());


         // save the intermediate tunecache after the UV and VUV tune

         saveTuneCache();


         X_d->copy(*X_order);


         if (getVerbosity() >= QUDA_VERBOSE) printfQuda("About to build the preconditioned coarse clover\n");


         createYhat(gpu_setup);


         if (getVerbosity() >= QUDA_VERBOSE) printfQuda("Finished building the preconditioned coarse clover\n");

         if (getVerbosity() >= QUDA_VERBOSE) printfQuda("About to create the preconditioned coarse op\n");


         calculateYhat(*Yhat_d, *Xinv_d, *Y_order, *X_order, use_mma);


         Y_d->copy(*Y_order);


         // this extra exchange shouldn't be needed, but at present the

         // copy from Y_order to Y_d doesn't preserve the

         // bi-directional halo (in_offset isn't set in the copy

         // routine)

         Y_d->exchangeGhost(QUDA_LINK_BIDIRECTIONAL);


         delete Y_order;

         delete X_order;


       } else {

         dirac->createCoarseOp(*Y_d, *X_d, *transfer, kappa, mass, Mu(), MuFactor());


         // save the intermediate tunecache after the UV and VUV tune

         saveTuneCache();


         if (getVerbosity() >= QUDA_VERBOSE) printfQuda("About to build the preconditioned coarse clover\n");


         createYhat(gpu_setup);


         if (getVerbosity() >= QUDA_VERBOSE) printfQuda("Finished building the preconditioned coarse clover\n");

         if (getVerbosity() >= QUDA_VERBOSE) printfQuda("About to create the preconditioned coarse op\n");


         calculateYhat(*Yhat_d, *Xinv_d, *Y_d, *X_d, use_mma);

       }

     }


     if (getVerbosity() >= QUDA_VERBOSE) printfQuda("Finished creating the preconditioned coarse op\n");


     // save the intermediate tunecache after the Yhat tune

     saveTuneCache();


     if (gpu_setup) {

       enable_gpu = true;

       init_gpu = true;

     } else {

       enable_cpu = true;

       init_cpu = true;

     }

   }


   // we only copy to host or device lazily on demand

   void DiracCoarse::initializeLazy(QudaFieldLocation location) const

   {

     if (!enable_cpu && !enable_gpu) errorQuda("Neither CPU or GPU coarse fields initialized");

     switch(location) {

     case QUDA_CUDA_FIELD_LOCATION:

       if (enable_gpu) return;

       createY(true, mapped);

       createYhat(true);

       Y_d->copy(*Y_h);

       Yhat_d->copy(*Yhat_h);

       X_d->copy(*X_h);

       Xinv_d->copy(*Xinv_h);

       enable_gpu = true;

       init_gpu = true;

       break;

     case QUDA_CPU_FIELD_LOCATION:

       if (enable_cpu) return;

       createY(false);

       createYhat(false);

       Y_h->copy(*Y_d);

       Yhat_h->copy(*Yhat_d);

       X_h->copy(*X_d);

       Xinv_h->copy(*Xinv_d);

       enable_cpu = true;

       init_cpu = true;

       break;

     default:

       errorQuda("Unknown location");

     }

   }


   void DiracCoarse::createPreconditionedCoarseOp(GaugeField &Yhat, GaugeField &Xinv, const GaugeField &Y, const GaugeField &X) {

     calculateYhat(Yhat, Xinv, Y, X, use_mma);

   }


   void DiracCoarse::Clover(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const

   {

     if (&in == &out) errorQuda("Fields cannot alias");

     QudaFieldLocation location = checkLocation(out,in);

     initializeLazy(location);

     if (location == QUDA_CUDA_FIELD_LOCATION) {

       ApplyCoarse(out, in, in, *Y_d, *X_d, kappa, parity, false, true, dagger, commDim);

     } else if (location == QUDA_CPU_FIELD_LOCATION) {

       ApplyCoarse(out, in, in, *Y_h, *X_h, kappa, parity, false, true, dagger, commDim);

     }

     int n = in.Nspin()*in.Ncolor();

     flops += (8*n*n-2*n)*(long long)in.VolumeCB();

   }


   void DiracCoarse::CloverInv(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const

   {

     if (&in == &out) errorQuda("Fields cannot alias");

     QudaFieldLocation location = checkLocation(out,in);

     initializeLazy(location);

     if ( location  == QUDA_CUDA_FIELD_LOCATION ) {

       ApplyCoarse(out, in, in, *Y_d, *Xinv_d, kappa, parity, false, true, dagger, commDim);

     } else if ( location == QUDA_CPU_FIELD_LOCATION ) {

       ApplyCoarse(out, in, in, *Y_h, *Xinv_h, kappa, parity, false, true, dagger, commDim);

     }

     int n = in.Nspin()*in.Ncolor();

     flops += (8*n*n-2*n)*(long long)in.VolumeCB();

   }


   void DiracCoarse::Dslash(ColorSpinorField &out, const ColorSpinorField &in,

                            const QudaParity parity) const

   {

     QudaFieldLocation location = checkLocation(out,in);

     initializeLazy(location);

     if ( location == QUDA_CUDA_FIELD_LOCATION ) {

       ApplyCoarse(out, in, in, *Y_d, *X_d, kappa, parity, true, false, dagger, commDim, halo_precision);

     } else if ( location == QUDA_CPU_FIELD_LOCATION ) {

       ApplyCoarse(out, in, in, *Y_h, *X_h, kappa, parity, true, false, dagger, commDim, halo_precision);

     }

     int n = in.Nspin()*in.Ncolor();

     flops += (8*(8*n*n)-2*n)*(long long)in.VolumeCB()*in.SiteSubset();

   }


   void DiracCoarse::DslashXpay(ColorSpinorField &out, const ColorSpinorField &in,

                                const QudaParity parity, const ColorSpinorField &x,

                                const double &k) const

   {

     if (k!=1.0) errorQuda("%s not supported for k!=1.0", __func__);


     QudaFieldLocation location = checkLocation(out,in);

     initializeLazy(location);

     if ( location == QUDA_CUDA_FIELD_LOCATION ) {

       ApplyCoarse(out, in, x, *Y_d, *X_d, kappa, parity, true, true, dagger, commDim, halo_precision);

     } else if ( location == QUDA_CPU_FIELD_LOCATION ) {

       ApplyCoarse(out, in, x, *Y_h, *X_h, kappa, parity, true, true, dagger, commDim, halo_precision);

     }

     int n = in.Nspin()*in.Ncolor();

     flops += (9*(8*n*n)-2*n)*(long long)in.VolumeCB()*in.SiteSubset();

   }


   void DiracCoarse::M(ColorSpinorField &out, const ColorSpinorField &in) const

   {

     QudaFieldLocation location = checkLocation(out,in);

     initializeLazy(location);

     if ( location == QUDA_CUDA_FIELD_LOCATION ) {

       ApplyCoarse(out, in, in, *Y_d, *X_d, kappa, QUDA_INVALID_PARITY, true, true, dagger, commDim, halo_precision);

     } else if ( location == QUDA_CPU_FIELD_LOCATION ) {

       ApplyCoarse(out, in, in, *Y_h, *X_h, kappa, QUDA_INVALID_PARITY, true, true, dagger, commDim, halo_precision);

     }

     int n = in.Nspin()*in.Ncolor();

     flops += (9*(8*n*n)-2*n)*(long long)in.VolumeCB()*in.SiteSubset();

   }


   void DiracCoarse::MdagM(ColorSpinorField &out, const ColorSpinorField &in) const

   {

     bool reset1 = newTmp(&tmp1, in);

     if (tmp1->SiteSubset() != QUDA_FULL_SITE_SUBSET) errorQuda("Temporary vector is not full-site vector");


     M(*tmp1, in);

     Mdag(out, *tmp1);


     deleteTmp(&tmp1, reset1);

   }


   void DiracCoarse::prepare(ColorSpinorField* &src, ColorSpinorField* &sol,

                             ColorSpinorField &x, ColorSpinorField &b,

                             const QudaSolutionType solType) const

   {

     if (solType == QUDA_MATPC_SOLUTION || solType == QUDA_MATPCDAG_MATPC_SOLUTION) {

       errorQuda("Preconditioned solution requires a preconditioned solve_type");

     }


     src = &b;

     sol = &x;

   }


   void DiracCoarse::reconstruct(ColorSpinorField &x, const ColorSpinorField &b,

                                 const QudaSolutionType solType) const

   {

     /* do nothing */

   }


   //Make the coarse operator one level down.  Pass both the coarse gauge field and coarse clover field.

   void DiracCoarse::createCoarseOp(GaugeField &Y, GaugeField &X, const Transfer &T, double kappa, double mass, double mu, double mu_factor) const

   {

     if (T.getTransferType() != QUDA_TRANSFER_AGGREGATE)

       errorQuda("Coarse operators only support aggregation coarsening");


     double a = 2.0 * kappa * mu * T.Vectors().TwistFlavor();

     if (checkLocation(Y, X) == QUDA_CPU_FIELD_LOCATION) {

       initializeLazy(QUDA_CPU_FIELD_LOCATION);

       CoarseCoarseOp(Y, X, T, *(this->Y_h), *(this->X_h), *(this->Xinv_h), kappa, mass, a, mu_factor, QUDA_COARSE_DIRAC,

                      QUDA_MATPC_INVALID, need_bidirectional);

     } else {

       initializeLazy(QUDA_CUDA_FIELD_LOCATION);

       CoarseCoarseOp(Y, X, T, *(this->Y_d), *(this->X_d), *(this->Xinv_d), kappa, mass, a, mu_factor, QUDA_COARSE_DIRAC,

                      QUDA_MATPC_INVALID, need_bidirectional, use_mma);

     }

   }


   void DiracCoarse::prefetch(QudaFieldLocation mem_space, qudaStream_t stream) const

   {

     Dirac::prefetch(mem_space, stream);

     if (Y_d) Y_d->prefetch(mem_space, stream);

     if (X_d) X_d->prefetch(mem_space, stream);

   }


   DiracCoarsePC::DiracCoarsePC(const DiracParam &param, bool gpu_setup) : DiracCoarse(param, gpu_setup)

   {

     /* do nothing */

   }


   DiracCoarsePC::DiracCoarsePC(const DiracCoarse &dirac, const DiracParam &param) : DiracCoarse(dirac, param)

   {

     /* do nothing */

   }


   DiracCoarsePC::~DiracCoarsePC() { }


   void DiracCoarsePC::Dslash(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const

   {

     QudaFieldLocation location = checkLocation(out,in);

     initializeLazy(location);

     if ( location == QUDA_CUDA_FIELD_LOCATION) {

       ApplyCoarse(out, in, in, *Yhat_d, *X_d, kappa, parity, true, false, dagger, commDim, halo_precision);

     } else if ( location == QUDA_CPU_FIELD_LOCATION ) {

       ApplyCoarse(out, in, in, *Yhat_h, *X_h, kappa, parity, true, false, dagger, commDim, halo_precision);

     }


     int n = in.Nspin()*in.Ncolor();

     flops += (8*(8*n*n)-2*n)*in.VolumeCB()*in.SiteSubset();

   }


   void DiracCoarsePC::DslashXpay(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity,

                                  const ColorSpinorField &x, const double &k) const

   {

     // emulated for now

     Dslash(out, in, parity);

     blas::xpay(const_cast<ColorSpinorField&>(x), k, out);


     int n = in.Nspin()*in.Ncolor();

     flops += (8*(8*n*n)-2*n)*in.VolumeCB(); // blas flops counted separately so only need to count dslash flops

   }


   void DiracCoarsePC::M(ColorSpinorField &out, const ColorSpinorField &in) const

   {

     bool reset1 = newTmp(&tmp1, in);


     if (in.SiteSubset() == QUDA_FULL_SITE_SUBSET || out.SiteSubset() == QUDA_FULL_SITE_SUBSET ||

         tmp1->SiteSubset() == QUDA_FULL_SITE_SUBSET)

       errorQuda("Cannot apply preconditioned operator to full field (subsets = %d %d %d)",

                 in.SiteSubset(), out.SiteSubset(), tmp1->SiteSubset());


     if (matpcType == QUDA_MATPC_EVEN_EVEN_ASYMMETRIC) {

       // DiracCoarsePC::Dslash applies A^{-1}Dslash

       Dslash(*tmp1, in, QUDA_ODD_PARITY);

       // DiracCoarse::DslashXpay applies (A - D) // FIXME this ignores the -1

       DiracCoarse::Dslash(out, *tmp1, QUDA_EVEN_PARITY);

       Clover(*tmp1, in, QUDA_EVEN_PARITY);

       blas::xpay(*tmp1, -1.0, out);

     } else if (matpcType == QUDA_MATPC_ODD_ODD_ASYMMETRIC) {

       // DiracCoarsePC::Dslash applies A^{-1}Dslash

       Dslash(*tmp1, in, QUDA_EVEN_PARITY);

       // DiracCoarse::DslashXpay applies (A - D) // FIXME this ignores the -1

       DiracCoarse::Dslash(out, *tmp1, QUDA_ODD_PARITY);

       Clover(*tmp1, in, QUDA_ODD_PARITY);

       blas::xpay(*tmp1, -1.0, out);

     } else if (matpcType == QUDA_MATPC_EVEN_EVEN) {

       Dslash(*tmp1, in, QUDA_ODD_PARITY);

       DslashXpay(out, *tmp1, QUDA_EVEN_PARITY, in, -1.0);

     } else if (matpcType == QUDA_MATPC_ODD_ODD) {

       Dslash(*tmp1, in, QUDA_EVEN_PARITY);

       DslashXpay(out, *tmp1, QUDA_ODD_PARITY, in, -1.0);

     } else {

       errorQuda("MatPCType %d not valid for DiracCoarsePC", matpcType);

     }


     deleteTmp(&tmp1, reset1);

   }


   void DiracCoarsePC::MdagM(ColorSpinorField &out, const ColorSpinorField &in) const

   {

     bool reset1 = newTmp(&tmp2, in);

     M(*tmp2, in);

     Mdag(out, *tmp2);

     deleteTmp(&tmp2, reset1);

   }


   void DiracCoarsePC::prepare(ColorSpinorField* &src, ColorSpinorField* &sol, ColorSpinorField &x, ColorSpinorField &b,

                               const QudaSolutionType solType) const

   {

     // we desire solution to preconditioned system

     if (solType == QUDA_MATPC_SOLUTION || solType == QUDA_MATPCDAG_MATPC_SOLUTION) {

       src = &b;

       sol = &x;

       return;

     }


     bool reset = newTmp(&tmp1, b.Even());


     // we desire solution to full system

     if (matpcType == QUDA_MATPC_EVEN_EVEN) {

       // src = A_ee^-1 (b_e - D_eo A_oo^-1 b_o)

       src = &(x.Odd());

 #if 0

       CloverInv(*src, b.Odd(), QUDA_ODD_PARITY);

       DiracCoarse::Dslash(*tmp1, *src, QUDA_EVEN_PARITY);

       blas::xpay(const_cast<ColorSpinorField&>(b.Even()), -1.0, *tmp1);

       CloverInv(*src, *tmp1, QUDA_EVEN_PARITY);

 #endif

       // src = A_ee^{-1} b_e - (A_ee^{-1} D_eo) A_oo^{-1} b_o

       CloverInv(*src, b.Odd(), QUDA_ODD_PARITY);

       Dslash(*tmp1, *src, QUDA_EVEN_PARITY);

       CloverInv(*src, b.Even(), QUDA_EVEN_PARITY);

       blas::axpy(-1.0, *tmp1, *src);


       sol = &(x.Even());

     } else if (matpcType == QUDA_MATPC_ODD_ODD) {

       // src = A_oo^-1 (b_o - D_oe A_ee^-1 b_e)

       src = &(x.Even());

 #if 0

       CloverInv(*src, b.Even(), QUDA_EVEN_PARITY);

       DiracCoarse::Dslash(*tmp1, *src, QUDA_ODD_PARITY);

       blas::xpay(const_cast<ColorSpinorField&>(b.Odd()), -1.0, *tmp1);

       CloverInv(*src, *tmp1, QUDA_ODD_PARITY);

 #endif

       // src = A_oo^{-1} b_o - (A_oo^{-1} D_oe) A_ee^{-1} b_e

       CloverInv(*src, b.Even(), QUDA_EVEN_PARITY);

       Dslash(*tmp1, *src, QUDA_ODD_PARITY);

       CloverInv(*src, b.Odd(), QUDA_ODD_PARITY);

       blas::axpy(-1.0, *tmp1, *src);


       sol = &(x.Odd());

     } else if (matpcType == QUDA_MATPC_EVEN_EVEN_ASYMMETRIC) {

       // src = b_e - D_eo A_oo^-1 b_o

       src = &(x.Odd());

       CloverInv(*tmp1, b.Odd(), QUDA_ODD_PARITY);

       DiracCoarse::Dslash(*src, *tmp1, QUDA_EVEN_PARITY);

       blas::xpay(const_cast<ColorSpinorField&>(b.Even()), -1.0, *src);

       sol = &(x.Even());

     } else if (matpcType == QUDA_MATPC_ODD_ODD_ASYMMETRIC) {

       // src = b_o - D_oe A_ee^-1 b_e

       src = &(x.Even());

       CloverInv(*tmp1, b.Even(), QUDA_EVEN_PARITY);

       DiracCoarse::Dslash(*src, *tmp1, QUDA_ODD_PARITY);

       blas::xpay(const_cast<ColorSpinorField&>(b.Odd()), -1.0, *src);

       sol = &(x.Odd());

     } else {

       errorQuda("MatPCType %d not valid for DiracCloverPC", matpcType);

     }


     // here we use final solution to store parity solution and parity source

     // b is now up for grabs if we want


     deleteTmp(&tmp1, reset);

   }


   void DiracCoarsePC::reconstruct(ColorSpinorField &x, const ColorSpinorField &b, const QudaSolutionType solType) const

   {

     if (solType == QUDA_MATPC_SOLUTION || solType == QUDA_MATPCDAG_MATPC_SOLUTION) {

       return;

     }


     checkFullSpinor(x, b);


     bool reset = newTmp(&tmp1, b.Even());


     // create full solution


     if (matpcType == QUDA_MATPC_EVEN_EVEN ||

         matpcType == QUDA_MATPC_EVEN_EVEN_ASYMMETRIC) {

 #if 0

       // x_o = A_oo^-1 (b_o - D_oe x_e)

       DiracCoarse::Dslash(*tmp1, x.Even(), QUDA_ODD_PARITY);

       blas::xpay(const_cast<ColorSpinorField&>(b.Odd()), -1.0, *tmp1);

       CloverInv(x.Odd(), *tmp1, QUDA_ODD_PARITY);

 #endif

       // x_o = A_oo^{-1} b_o - (A_oo^{-1} D_oe) x_e

       Dslash(*tmp1, x.Even(), QUDA_ODD_PARITY);

       CloverInv(x.Odd(), b.Odd(), QUDA_ODD_PARITY);

       blas::axpy(-1.0, const_cast<ColorSpinorField &>(*tmp1), x.Odd());


     } else if (matpcType == QUDA_MATPC_ODD_ODD ||

                matpcType == QUDA_MATPC_ODD_ODD_ASYMMETRIC) {

 #if 0

       // x_e = A_ee^-1 (b_e - D_eo x_o)

       DiracCoarse::Dslash(*tmp1, x.Odd(), QUDA_EVEN_PARITY);

       blas::xpay(const_cast<ColorSpinorField&>(b.Even()), -1.0, *tmp1);

       CloverInv(x.Even(), *tmp1, QUDA_EVEN_PARITY);

 #endif

       // x_e = A_ee^{-1} b_e - (A_ee^{-1} D_eo) x_o

       Dslash(*tmp1, x.Odd(), QUDA_EVEN_PARITY);

       CloverInv(x.Even(), b.Even(), QUDA_EVEN_PARITY);

       blas::axpy(-1.0, const_cast<ColorSpinorField &>(*tmp1), x.Even());


     } else {

       errorQuda("MatPCType %d not valid for DiracCoarsePC", matpcType);

     }


     deleteTmp(&tmp1, reset);

   }


   //Make the coarse operator one level down.  For the preconditioned

   //operator we are coarsening the Yhat links, not the Y links.  We

   //pass the fine clover fields, though they are actually ignored.

   void DiracCoarsePC::createCoarseOp(GaugeField &Y, GaugeField &X, const Transfer &T, double kappa, double mass, double mu, double mu_factor) const

   {

     if (T.getTransferType() != QUDA_TRANSFER_AGGREGATE)

       errorQuda("Coarse operators only support aggregation coarsening");


     double a = -2.0 * kappa * mu * T.Vectors().TwistFlavor();

     if (checkLocation(Y, X) == QUDA_CPU_FIELD_LOCATION) {

       initializeLazy(QUDA_CPU_FIELD_LOCATION);

       CoarseCoarseOp(Y, X, T, *(this->Yhat_h), *(this->X_h), *(this->Xinv_h), kappa, mass, a, -mu_factor,

                      QUDA_COARSEPC_DIRAC, matpcType, true);

     } else {

       initializeLazy(QUDA_CUDA_FIELD_LOCATION);

       CoarseCoarseOp(Y, X, T, *(this->Yhat_d), *(this->X_d), *(this->Xinv_d), kappa, mass, a, -mu_factor,

                      QUDA_COARSEPC_DIRAC, matpcType, true, use_mma);

     }

   }


   void DiracCoarsePC::prefetch(QudaFieldLocation mem_space, qudaStream_t stream) const

   {

     Dirac::prefetch(mem_space, stream);

     if (Xinv_d) Xinv_d->prefetch(mem_space, stream);

     if (Yhat_d) Yhat_d->prefetch(mem_space, stream);

   }

 }

quda::ColorSpinorField
Definition: color_spinor_field.h:379

quda::ColorSpinorField::Ndim
int Ndim() const
Definition: color_spinor_field.h:483

quda::ColorSpinorField::Odd
const ColorSpinorField & Odd() const
Definition: color_spinor_field.cpp:578

quda::ColorSpinorField::TwistFlavor
QudaTwistFlavorType TwistFlavor() const
Definition: color_spinor_field.h:482

quda::ColorSpinorField::Nspin
int Nspin() const
Definition: color_spinor_field.h:480

quda::ColorSpinorField::Ncolor
int Ncolor() const
Definition: color_spinor_field.h:479

quda::ColorSpinorField::SiteSubset
QudaSiteSubset SiteSubset() const
Definition: color_spinor_field.h:566

quda::ColorSpinorField::Even
const ColorSpinorField & Even() const
Definition: color_spinor_field.cpp:570

quda::ColorSpinorField::VolumeCB
size_t VolumeCB() const
Definition: color_spinor_field.h:490

quda::ColorSpinorField::X
const int * X() const
Definition: color_spinor_field.h:484

quda::DiracCoarse
Definition: dirac_quda.h:1559

quda::DiracCoarse::Yhat_d
cudaGaugeField * Yhat_d
Definition: dirac_quda.h:1578

quda::DiracCoarse::Clover
void Clover(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Apply the coarse clover operator.
Definition: dirac_coarse.cpp:323

quda::DiracCoarse::MuFactor
double MuFactor() const
accessor for mu factoo for MG/ – override can return a better value
Definition: dirac_quda.h:1616

quda::DiracCoarse::mu_factor
double mu_factor
Definition: dirac_quda.h:1564

quda::DiracCoarse::init_cpu
bool init_cpu
Definition: dirac_quda.h:1597

quda::DiracCoarse::~DiracCoarse
virtual ~DiracCoarse()
Definition: dirac_coarse.cpp:92

quda::DiracCoarse::Dslash
virtual void Dslash(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Apply DslashXpay out = (D * in)
Definition: dirac_coarse.cpp:351

quda::DiracCoarse::createPreconditionedCoarseOp
void createPreconditionedCoarseOp(GaugeField &Yhat, GaugeField &Xinv, const GaugeField &Y, const GaugeField &X)
Create the precondtioned coarse operator.
Definition: dirac_coarse.cpp:319

quda::DiracCoarse::Yhat_h
cpuGaugeField * Yhat_h
Definition: dirac_quda.h:1573

quda::DiracCoarse::createYhat
void createYhat(bool gpu=true) const
Allocate the Yhat and Xinv fields.
Definition: dirac_coarse.cpp:151

quda::DiracCoarse::mapped
const bool mapped
Definition: dirac_quda.h:1598

quda::DiracCoarse::Xinv_h
cpuGaugeField * Xinv_h
Definition: dirac_quda.h:1572

quda::DiracCoarse::reconstruct
virtual void reconstruct(ColorSpinorField &x, const ColorSpinorField &b, const QudaSolutionType) const
Definition: dirac_coarse.cpp:418

quda::DiracCoarse::Y_h
cpuGaugeField * Y_h
Definition: dirac_quda.h:1570

quda::DiracCoarse::init_gpu
bool init_gpu
Definition: dirac_quda.h:1596

quda::DiracCoarse::gpu_setup
const bool gpu_setup
Definition: dirac_quda.h:1595

quda::DiracCoarse::prepare
virtual void prepare(ColorSpinorField *&src, ColorSpinorField *&sol, ColorSpinorField &x, ColorSpinorField &b, const QudaSolutionType) const
Definition: dirac_coarse.cpp:406

quda::DiracCoarse::enable_cpu
bool enable_cpu
Definition: dirac_quda.h:1594

quda::DiracCoarse::transfer
const Transfer * transfer
Definition: dirac_quda.h:1565

quda::DiracCoarse::enable_gpu
bool enable_gpu
Definition: dirac_quda.h:1593

quda::DiracCoarse::Xinv_d
cudaGaugeField * Xinv_d
Definition: dirac_quda.h:1577

quda::DiracCoarse::createY
void createY(bool gpu=true, bool mapped=false) const
Allocate the Y and X fields.
Definition: dirac_coarse.cpp:108

quda::DiracCoarse::Mu
double Mu() const
accessor for twist parameter – overrride can return better value
Definition: dirac_quda.h:1615

quda::DiracCoarse::mu
double mu
Definition: dirac_quda.h:1563

quda::DiracCoarse::M
virtual void M(ColorSpinorField &out, const ColorSpinorField &in) const
Apply the full operator.
Definition: dirac_coarse.cpp:382

quda::DiracCoarse::initializeLazy
void initializeLazy(QudaFieldLocation location) const
Create the CPU or GPU coarse gauge fields on demand (requires that the fields have been created in th...
Definition: dirac_coarse.cpp:288

quda::DiracCoarse::use_mma
const bool use_mma
Definition: dirac_quda.h:1568

quda::DiracCoarse::X_h
cpuGaugeField * X_h
Definition: dirac_quda.h:1571

quda::DiracCoarse::prefetch
virtual void prefetch(QudaFieldLocation mem_space, qudaStream_t stream=0) const
If managed memory and prefetch is enabled, prefetch all relevant memory fields (X,...
Definition: dirac_coarse.cpp:442

quda::DiracCoarse::CloverInv
void CloverInv(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Apply the inverse coarse clover operator.
Definition: dirac_coarse.cpp:337

quda::DiracCoarse::mass
double mass
Definition: dirac_quda.h:1562

quda::DiracCoarse::dirac
const Dirac * dirac
Definition: dirac_quda.h:1566

quda::DiracCoarse::MdagM
virtual void MdagM(ColorSpinorField &out, const ColorSpinorField &in) const
Apply MdagM operator which may be optimized.
Definition: dirac_coarse.cpp:395

quda::DiracCoarse::X_d
cudaGaugeField * X_d
Definition: dirac_quda.h:1576

quda::DiracCoarse::createCoarseOp
void createCoarseOp(GaugeField &Y, GaugeField &X, const Transfer &T, double kappa, double mass, double mu, double mu_factor=0.) const
Create the coarse operator from this coarse operator.
Definition: dirac_coarse.cpp:425

quda::DiracCoarse::need_bidirectional
const bool need_bidirectional
Definition: dirac_quda.h:1567

quda::DiracCoarse::DslashXpay
virtual void DslashXpay(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity, const ColorSpinorField &x, const double &k) const
Apply DslashXpay out = (D * in + A * x)
Definition: dirac_coarse.cpp:365

quda::DiracCoarse::Y_d
cudaGaugeField * Y_d
Definition: dirac_quda.h:1575

quda::DiracCoarse::initializeCoarse
void initializeCoarse()
Initialize the coarse gauge fields. Location is determined by gpu_setup variable.
Definition: dirac_coarse.cpp:193

quda::DiracCoarse::DiracCoarse
DiracCoarse(const DiracParam &param, bool gpu_setup=true, bool mapped=false)
Definition: dirac_coarse.cpp:7

quda::DiracCoarsePC::M
void M(ColorSpinorField &out, const ColorSpinorField &in) const
Apply the full operator.
Definition: dirac_coarse.cpp:486

quda::DiracCoarsePC::DslashXpay
void DslashXpay(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity, const ColorSpinorField &x, const double &k) const
Apply DslashXpay out = (D * in + A * x)
Definition: dirac_coarse.cpp:475

quda::DiracCoarsePC::DiracCoarsePC
DiracCoarsePC(const DiracParam &param, bool gpu_setup=true)
Definition: dirac_coarse.cpp:449

quda::DiracCoarsePC::prepare
void prepare(ColorSpinorField *&src, ColorSpinorField *&sol, ColorSpinorField &x, ColorSpinorField &b, const QudaSolutionType) const
Definition: dirac_coarse.cpp:530

quda::DiracCoarsePC::Dslash
void Dslash(ColorSpinorField &out, const ColorSpinorField &in, const QudaParity parity) const
Apply DslashXpay out = (D * in)
Definition: dirac_coarse.cpp:461

quda::DiracCoarsePC::~DiracCoarsePC
virtual ~DiracCoarsePC()
Definition: dirac_coarse.cpp:459

quda::DiracCoarsePC::prefetch
virtual void prefetch(QudaFieldLocation mem_space, qudaStream_t stream=0) const
If managed memory and prefetch is enabled, prefetch all relevant memory fields (Xhat,...
Definition: dirac_coarse.cpp:664

quda::DiracCoarsePC::MdagM
void MdagM(ColorSpinorField &out, const ColorSpinorField &in) const
Apply MdagM operator which may be optimized.
Definition: dirac_coarse.cpp:522

quda::DiracCoarsePC::reconstruct
void reconstruct(ColorSpinorField &x, const ColorSpinorField &b, const QudaSolutionType) const
Definition: dirac_coarse.cpp:599

quda::DiracCoarsePC::createCoarseOp
void createCoarseOp(GaugeField &Y, GaugeField &X, const Transfer &T, double kappa, double mass, double mu, double mu_factor=0.) const
Create the coarse even-odd preconditioned coarse operator. Unlike the Wilson operator,...
Definition: dirac_coarse.cpp:647

quda::Dirac
Definition: dirac_quda.h:133

quda::Dirac::flops
unsigned long long flops
Definition: dirac_quda.h:150

quda::Dirac::newTmp
bool newTmp(ColorSpinorField **, const ColorSpinorField &) const
Definition: dirac.cpp:72

quda::Dirac::kappa
double kappa
Definition: dirac_quda.h:145

quda::Dirac::isCoarse
virtual bool isCoarse() const
Whether the Dirac object is the DiracCoarse.
Definition: dirac_quda.h:181

quda::Dirac::prefetch
virtual void prefetch(QudaFieldLocation mem_space, qudaStream_t stream=0) const
If managed memory and prefetch is enabled, prefetch the gauge field and temporary spinors to the CPU ...
Definition: dirac.cpp:305

quda::Dirac::halo_precision
QudaPrecision halo_precision
Definition: dirac_quda.h:154

quda::Dirac::matpcType
QudaMatPCType matpcType
Definition: dirac_quda.h:148

quda::Dirac::deleteTmp
void deleteTmp(ColorSpinorField **, const bool &reset) const
Definition: dirac.cpp:83

quda::Dirac::tmp1
ColorSpinorField * tmp1
Definition: dirac_quda.h:151

quda::Dirac::createCoarseOp
virtual void createCoarseOp(GaugeField &Y, GaugeField &X, const Transfer &T, double kappa, double mass=0., double mu=0., double mu_factor=0.) const
Create the coarse operator (virtual parent)
Definition: dirac_quda.h:377

quda::Dirac::dagger
QudaDagType dagger
Definition: dirac_quda.h:149

quda::Dirac::checkFullSpinor
virtual void checkFullSpinor(const ColorSpinorField &, const ColorSpinorField &) const
check full spinors are compatible (check geometry ?)
Definition: dirac.cpp:138

quda::Dirac::tmp2
ColorSpinorField * tmp2
Definition: dirac_quda.h:152

quda::Dirac::commDim
int commDim[QUDA_MAX_DIM]
Definition: dirac_quda.h:159

quda::Dirac::Mdag
void Mdag(ColorSpinorField &out, const ColorSpinorField &in) const
Apply Mdag (daggered operator of M.
Definition: dirac.cpp:92

quda::DiracParam
Definition: dirac_quda.h:21

quda::GaugeField
Definition: gauge_field.h:200

quda::GaugeField::Create
static GaugeField * Create(const GaugeFieldParam &param)
Create the gauge field, with meta data specified in the parameter struct.
Definition: gauge_field.cpp:349

quda::LatticeField::Precision
QudaPrecision Precision() const
Definition: lattice_field.h:567

quda::Transfer
Definition: transfer.h:29

quda::Transfer::nvec
int nvec() const
Definition: transfer.h:222

quda::Transfer::Geo_bs
const int * Geo_bs() const
Definition: transfer.h:234

quda::Transfer::NullPrecision
QudaPrecision NullPrecision(QudaFieldLocation location) const
The precision of the packed null-space vectors.
Definition: transfer.h:199

quda::Transfer::getTransferType
QudaTransferType getTransferType() const
Definition: transfer.h:240

quda::Transfer::Spin_bs
int Spin_bs() const
Definition: transfer.h:228

quda::Transfer::Vectors
const ColorSpinorField & Vectors(QudaFieldLocation location=QUDA_INVALID_FIELD_LOCATION) const
Definition: transfer.h:209

quda::cpuGaugeField
Definition: gauge_field.h:626

quda::cpuGaugeField::copy
void copy(const GaugeField &src)
Definition: cpu_gauge_field.cpp:261

quda::cudaGaugeField
Definition: gauge_field.h:449

quda::cudaGaugeField::copy
void copy(const GaugeField &src)
Definition: cuda_gauge_field.cpp:531

quda::cudaGaugeField::prefetch
void prefetch(QudaFieldLocation mem_space, qudaStream_t stream=0) const
If managed memory and prefetch is enabled, prefetch the gauge field and buffers to the CPU or the GPU...
Definition: cuda_gauge_field.cpp:736

quda::cudaGaugeField::exchangeGhost
void exchangeGhost(QudaLinkDirection link_direction=QUDA_LINK_BACKWARDS)
Exchange the ghost and store store in the padded region.
Definition: cuda_gauge_field.cpp:113

kappa
double kappa
Definition: command_line_params.cpp:72

mass
double mass
Definition: command_line_params.cpp:71

mu
double mu
Definition: command_line_params.cpp:73

mu_factor
quda::mgarray< double > mu_factor
Definition: command_line_params.cpp:103

dirac
GaugeCovDev * dirac
Definition: covdev_test.cpp:42

parity
QudaParity parity
Definition: covdev_test.cpp:40

QUDA_COARSEPC_DIRAC
@ QUDA_COARSEPC_DIRAC
Definition: enum_quda.h:316

QUDA_COARSE_DIRAC
@ QUDA_COARSE_DIRAC
Definition: enum_quda.h:315

QUDA_CUDA_FIELD_LOCATION
@ QUDA_CUDA_FIELD_LOCATION
Definition: enum_quda.h:326

QUDA_CPU_FIELD_LOCATION
@ QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:325

QUDA_VERBOSE
@ QUDA_VERBOSE
Definition: enum_quda.h:267

QUDA_FULL_SITE_SUBSET
@ QUDA_FULL_SITE_SUBSET
Definition: enum_quda.h:333

QUDA_LINK_BIDIRECTIONAL
@ QUDA_LINK_BIDIRECTIONAL
Definition: enum_quda.h:497

QudaGaugeFieldOrder
enum QudaGaugeFieldOrder_s QudaGaugeFieldOrder

QUDA_RECONSTRUCT_NO
@ QUDA_RECONSTRUCT_NO
Definition: enum_quda.h:70

QUDA_PERIODIC_T
@ QUDA_PERIODIC_T
Definition: enum_quda.h:57

QUDA_EVEN_PARITY
@ QUDA_EVEN_PARITY
Definition: enum_quda.h:284

QUDA_ODD_PARITY
@ QUDA_ODD_PARITY
Definition: enum_quda.h:284

QUDA_INVALID_PARITY
@ QUDA_INVALID_PARITY
Definition: enum_quda.h:284

QUDA_MEMORY_MAPPED
@ QUDA_MEMORY_MAPPED
Definition: enum_quda.h:15

QUDA_SCALAR_GEOMETRY
@ QUDA_SCALAR_GEOMETRY
Definition: enum_quda.h:500

QUDA_COARSE_GEOMETRY
@ QUDA_COARSE_GEOMETRY
Definition: enum_quda.h:503

QUDA_TRANSFER_AGGREGATE
@ QUDA_TRANSFER_AGGREGATE
Definition: enum_quda.h:453

QudaSolutionType
enum QudaSolutionType_s QudaSolutionType

QudaFieldLocation
enum QudaFieldLocation_s QudaFieldLocation

QUDA_GHOST_EXCHANGE_NO
@ QUDA_GHOST_EXCHANGE_NO
Definition: enum_quda.h:508

QUDA_GHOST_EXCHANGE_PAD
@ QUDA_GHOST_EXCHANGE_PAD
Definition: enum_quda.h:509

QUDA_MATPC_ODD_ODD_ASYMMETRIC
@ QUDA_MATPC_ODD_ODD_ASYMMETRIC
Definition: enum_quda.h:219

QUDA_MATPC_EVEN_EVEN_ASYMMETRIC
@ QUDA_MATPC_EVEN_EVEN_ASYMMETRIC
Definition: enum_quda.h:218

QUDA_MATPC_ODD_ODD
@ QUDA_MATPC_ODD_ODD
Definition: enum_quda.h:217

QUDA_MATPC_EVEN_EVEN
@ QUDA_MATPC_EVEN_EVEN
Definition: enum_quda.h:216

QUDA_MATPC_INVALID
@ QUDA_MATPC_INVALID
Definition: enum_quda.h:220

QUDA_MATPC_SOLUTION
@ QUDA_MATPC_SOLUTION
Definition: enum_quda.h:159

QUDA_MATPCDAG_MATPC_SOLUTION
@ QUDA_MATPCDAG_MATPC_SOLUTION
Definition: enum_quda.h:161

QUDA_FLOAT2_GAUGE_ORDER
@ QUDA_FLOAT2_GAUGE_ORDER
Definition: enum_quda.h:40

QUDA_QDP_GAUGE_ORDER
@ QUDA_QDP_GAUGE_ORDER
Definition: enum_quda.h:44

QUDA_MILC_GAUGE_ORDER
@ QUDA_MILC_GAUGE_ORDER
Definition: enum_quda.h:47

QUDA_ZERO_FIELD_CREATE
@ QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:361

QudaParity
enum QudaParity_s QudaParity

QUDA_COARSE_LINKS
@ QUDA_COARSE_LINKS
Definition: enum_quda.h:28

gParam
GaugeFieldParam gParam
Definition: hisq_paths_force_test.cpp:58

checkLocation
#define checkLocation(...)
Definition: lattice_field.h:760

multigrid.h

Xinv_d
cudaGaugeField * Xinv_d
Definition: multigrid_benchmark_test.cpp:27

Xinv_h
cpuGaugeField * Xinv_h
Definition: multigrid_benchmark_test.cpp:26

X_d
cudaGaugeField * X_d
Definition: multigrid_benchmark_test.cpp:27

Y_d
cudaGaugeField * Y_d
Definition: multigrid_benchmark_test.cpp:27

X_h
cpuGaugeField * X_h
Definition: multigrid_benchmark_test.cpp:26

Yhat_h
cpuGaugeField * Yhat_h
Definition: multigrid_benchmark_test.cpp:26

Y_h
cpuGaugeField * Y_h
Definition: multigrid_benchmark_test.cpp:26

Yhat_d
cudaGaugeField * Yhat_d
Definition: multigrid_benchmark_test.cpp:27

quda::blas::xpay
void xpay(ColorSpinorField &x, double a, ColorSpinorField &y)
Definition: blas_quda.h:45

quda::blas::axpy
void axpy(double a, ColorSpinorField &x, ColorSpinorField &y)
Definition: blas_quda.h:43

quda
Definition: blas_lapack.h:24

quda::saveTuneCache
void saveTuneCache(bool error=false)
Definition: tune.cpp:439

quda::calculateYhat
void calculateYhat(GaugeField &Yhat, GaugeField &Xinv, const GaugeField &Y, const GaugeField &X, bool use_mma=false)
Calculate preconditioned coarse links and coarse clover inverse field.

quda::CoarseCoarseOp
void CoarseCoarseOp(GaugeField &Y, GaugeField &X, const Transfer &T, const GaugeField &gauge, const GaugeField &clover, const GaugeField &cloverInv, double kappa, double mass, double mu, double mu_factor, QudaDiracType dirac, QudaMatPCType matpc, bool need_bidirectional, bool use_mma=false)
Coarse operator construction from an intermediate-grid operator (Coarse)

quda::ApplyCoarse
void ApplyCoarse(ColorSpinorField &out, const ColorSpinorField &inA, const ColorSpinorField &inB, const GaugeField &Y, const GaugeField &X, double kappa, int parity=QUDA_INVALID_PARITY, bool dslash=true, bool clover=true, bool dagger=false, const int *commDim=0, QudaPrecision halo_precision=QUDA_INVALID_PRECISION)
Apply the coarse dslash stencil. This single driver accounts for all variations with and without the ...

quda::stream
qudaStream_t * stream
Definition: cuda_color_spinor_field.cpp:644

param
QudaGaugeParam param
Definition: pack_test.cpp:18

qudaStream_t
cudaStream_t qudaStream_t
Definition: quda_api.h:9

QUDA_MAX_DIM
#define QUDA_MAX_DIM
Maximum number of dimensions supported by QUDA. In practice, no routines make use of more than 5.
Definition: quda_constants.h:17

quda::GaugeFieldParam
Definition: gauge_field.h:44

quda::GaugeFieldParam::order
QudaGaugeFieldOrder order
Definition: gauge_field.h:51

printfQuda
#define printfQuda(...)
Definition: util_quda.h:114

getVerbosity
QudaVerbosity getVerbosity()
Definition: util_quda.cpp:21

errorQuda
#define errorQuda(...)
Definition: util_quda.h:120