quda-ref/v1.0.0/coarsecoarse__op_8cu_source.html

 #include <transfer.h>
 #include <color_spinor_field.h>
 #include <gauge_field.h>

 #define COARSECOARSE
 #ifdef GPU_MULTIGRID
 #include <coarse_op.cuh>
 #endif
 namespace quda {

 #ifdef GPU_MULTIGRID

   template <typename Float, typename vFloat, int fineColor, int fineSpin, int coarseColor, int coarseSpin>
   void calculateYcoarse(GaugeField &Y, GaugeField &X, GaugeField &Yatomic, GaugeField &Xatomic,
       ColorSpinorField &uv, const Transfer &T, const GaugeField &g, const GaugeField &clover,
       const GaugeField &cloverInv, double kappa, double mu, double mu_factor, QudaDiracType dirac, QudaMatPCType matpc,
                         bool need_bidirectional) {

     if (Y.Location() == QUDA_CPU_FIELD_LOCATION) {

       constexpr QudaFieldOrder csOrder = QUDA_SPACE_SPIN_COLOR_FIELD_ORDER;
       constexpr QudaGaugeFieldOrder gOrder = QUDA_QDP_GAUGE_ORDER;

       if (T.Vectors(Y.Location()).FieldOrder() != csOrder)
   errorQuda("Unsupported field order %d\n", T.Vectors(Y.Location()).FieldOrder());
       if (g.FieldOrder() != gOrder) errorQuda("Unsupported field order %d\n", g.FieldOrder());

       typedef typename colorspinor::FieldOrderCB<Float,fineSpin,fineColor,coarseColor,csOrder,vFloat> V;
       typedef typename colorspinor::FieldOrderCB<Float,2*fineSpin,fineColor,coarseColor,csOrder,vFloat> F;
       typedef typename gauge::FieldOrder<Float,fineColor*fineSpin,fineSpin,gOrder,true,vFloat> gFine;
       typedef typename gauge::FieldOrder<Float,fineColor*fineSpin,fineSpin,gOrder,true,vFloat> cFine;
       typedef typename gauge::FieldOrder<Float,coarseColor*coarseSpin,coarseSpin,gOrder,true,vFloat> gCoarse;
       typedef typename gauge::FieldOrder<Float,coarseColor*coarseSpin,coarseSpin,gOrder,true,storeType> gCoarseAtomic;

       const ColorSpinorField &v = T.Vectors(Y.Location());

       V vAccessor(const_cast<ColorSpinorField&>(v));
       F uvAccessor(const_cast<ColorSpinorField&>(uv));
       gFine gAccessor(const_cast<GaugeField&>(g));
       cFine cAccessor(const_cast<GaugeField&>(clover));
       cFine cInvAccessor(const_cast<GaugeField&>(cloverInv));
       gCoarse yAccessor(const_cast<GaugeField&>(Y));
       gCoarse xAccessor(const_cast<GaugeField&>(X));
       gCoarseAtomic yAccessorAtomic(const_cast<GaugeField&>(Yatomic));
       gCoarseAtomic xAccessorAtomic(const_cast<GaugeField&>(Xatomic));

       calculateY<true,Float,fineSpin,fineColor,coarseSpin,coarseColor>
   (yAccessor, xAccessor, yAccessorAtomic, xAccessorAtomic,
    uvAccessor, vAccessor, vAccessor, gAccessor, cAccessor, cInvAccessor,
    Y, X, Yatomic, Xatomic, uv, const_cast<ColorSpinorField&>(v), v, kappa, mu, mu_factor, dirac, matpc, need_bidirectional,
    T.fineToCoarse(Y.Location()), T.coarseToFine(Y.Location()));

     } else {

       constexpr QudaFieldOrder csOrder = QUDA_FLOAT2_FIELD_ORDER;
       constexpr QudaGaugeFieldOrder gOrder = QUDA_FLOAT2_GAUGE_ORDER;

       if (T.Vectors(Y.Location()).FieldOrder() != csOrder)
   errorQuda("Unsupported field order %d\n", T.Vectors(Y.Location()).FieldOrder());
       if (g.FieldOrder() != gOrder) errorQuda("Unsupported field order %d\n", g.FieldOrder());

       typedef typename colorspinor::FieldOrderCB<Float,fineSpin,fineColor,coarseColor,csOrder,vFloat> V;
       typedef typename colorspinor::FieldOrderCB<Float,2*fineSpin,fineColor,coarseColor,csOrder,vFloat> F;
       typedef typename gauge::FieldOrder<Float,fineColor*fineSpin,fineSpin,gOrder,true,vFloat> gFine;
       typedef typename gauge::FieldOrder<Float,fineColor*fineSpin,fineSpin,gOrder,true,vFloat> cFine;
       typedef typename gauge::FieldOrder<Float,coarseColor*coarseSpin,coarseSpin,gOrder,true,vFloat> gCoarse;
       typedef typename gauge::FieldOrder<Float,coarseColor*coarseSpin,coarseSpin,gOrder,true,storeType> gCoarseAtomic;

       const ColorSpinorField &v = T.Vectors(Y.Location());

       V vAccessor(const_cast<ColorSpinorField&>(v));
       F uvAccessor(const_cast<ColorSpinorField&>(uv));
       gFine gAccessor(const_cast<GaugeField&>(g));
       cFine cAccessor(const_cast<GaugeField&>(clover));
       cFine cInvAccessor(const_cast<GaugeField&>(cloverInv));
       gCoarse yAccessor(const_cast<GaugeField&>(Y));
       gCoarse xAccessor(const_cast<GaugeField&>(X));
       gCoarseAtomic yAccessorAtomic(const_cast<GaugeField&>(Yatomic));
       gCoarseAtomic xAccessorAtomic(const_cast<GaugeField&>(Xatomic));

       calculateY<true,Float,fineSpin,fineColor,coarseSpin,coarseColor>
   (yAccessor, xAccessor, yAccessorAtomic, xAccessorAtomic,
    uvAccessor, vAccessor, vAccessor, gAccessor, cAccessor, cInvAccessor,
    Y, X, Yatomic, Xatomic, uv, const_cast<ColorSpinorField&>(v), v, kappa, mu, mu_factor, dirac, matpc, need_bidirectional,
    T.fineToCoarse(Y.Location()), T.coarseToFine(Y.Location()));

     }

   }

   // template on the number of coarse degrees of freedom
   template <typename Float, typename vFloat, int fineColor, int fineSpin>
   void calculateYcoarse(GaugeField &Y, GaugeField &X, GaugeField &Yatomic, GaugeField &Xatomic,
       ColorSpinorField &uv, const Transfer &T, const GaugeField &g, const GaugeField &clover,
       const GaugeField &cloverInv, double kappa, double mu, double mu_factor, QudaDiracType dirac, QudaMatPCType matpc, bool need_bidirectional) {
     if (T.Vectors().Nspin()/T.Spin_bs() != 2)
       errorQuda("Unsupported number of coarse spins %d\n",T.Vectors().Nspin()/T.Spin_bs());
     const int coarseSpin = 2;
     const int coarseColor = Y.Ncolor() / coarseSpin;

     if (coarseColor == 6) {
       calculateYcoarse<Float,vFloat,fineColor,fineSpin,6,coarseSpin>(Y, X, Yatomic, Xatomic, uv, T, g, clover, cloverInv, kappa, mu, mu_factor, dirac, matpc, need_bidirectional);
 #if 0
     } else if (coarseColor == 8) {
       calculateYcoarse<Float,vFloat,fineColor,fineSpin,8,coarseSpin>(Y, X, Yatomic, Xatomic, uv, T, g, clover, cloverInv, kappa, mu, mu_factor, dirac, matpc, need_bidirectional);
     } else if (coarseColor == 16) {
       calculateYcoarse<Float,vFloat,fineColor,fineSpin,16,coarseSpin>(Y, X, Yatomic, Xatomic, uv, T, g, clover, cloverInv, kappa, mu, mu_factor, dirac, matpc, need_bidirectional);
 #endif
     } else if (coarseColor == 24) {
       calculateYcoarse<Float,vFloat,fineColor,fineSpin,24,coarseSpin>(Y, X, Yatomic, Xatomic, uv, T, g, clover, cloverInv, kappa, mu, mu_factor, dirac, matpc, need_bidirectional);
     } else if (coarseColor == 32) {
       calculateYcoarse<Float,vFloat,fineColor,fineSpin,32,coarseSpin>(Y, X, Yatomic, Xatomic, uv, T, g, clover, cloverInv, kappa, mu, mu_factor, dirac, matpc, need_bidirectional);
     } else {
       errorQuda("Unsupported number of coarse dof %d\n", Y.Ncolor());
     }
   }

   // template on fine spin
   template <typename Float, typename vFloat, int fineColor>
   void calculateYcoarse(GaugeField &Y, GaugeField &X, GaugeField &Yatomic, GaugeField &Xatomic,
       ColorSpinorField &uv, const Transfer &T, const GaugeField &g, const GaugeField &clover,
       const GaugeField &cloverInv, double kappa, double mu, double mu_factor, QudaDiracType dirac, QudaMatPCType matpc, bool need_bidirectional) {
     if (T.Vectors().Nspin() == 2) {
       calculateYcoarse<Float,vFloat,fineColor,2>(Y, X, Yatomic, Xatomic, uv, T, g, clover, cloverInv, kappa, mu, mu_factor, dirac, matpc, need_bidirectional);
     } else {
       errorQuda("Unsupported number of spins %d\n", T.Vectors().Nspin());
     }
   }

   // template on fine colors
   template <typename Float, typename vFloat>
   void calculateYcoarse(GaugeField &Y, GaugeField &X, GaugeField &Yatomic, GaugeField &Xatomic,
       ColorSpinorField &uv, const Transfer &T, const GaugeField &g, const GaugeField &clover,
       const GaugeField &cloverInv, double kappa, double mu, double mu_factor, QudaDiracType dirac, QudaMatPCType matpc, bool need_bidirectional) {
     if (g.Ncolor()/T.Vectors().Nspin() == 6) { // free field Wilson
       calculateYcoarse<Float,vFloat,6>(Y, X, Yatomic, Xatomic, uv, T, g, clover, cloverInv, kappa, mu, mu_factor, dirac, matpc, need_bidirectional);
 #if 0
     } else if (g.Ncolor()/T.Vectors().Nspin() == 8) {
       calculateYcoarse<Float,vFloat,8>(Y, X, Yatomic, Xatomic, uv, T, g, clover, cloverInv, kappa, mu, mu_factor, dirac, matpc, need_bidirectional);
     } else if (g.Ncolor()/T.Vectors().Nspin() == 16) {
       calculateYcoarse<Float,vFloat,16>(Y, X, Yatomic, Xatomic, uv, T, g, clover, cloverInv, kappa, mu, mu_factor, dirac, matpc, need_bidirectional);
 #endif
     } else if (g.Ncolor()/T.Vectors().Nspin() == 24) {
       calculateYcoarse<Float,vFloat,24>(Y, X, Yatomic, Xatomic, uv, T, g, clover, cloverInv, kappa, mu, mu_factor, dirac, matpc, need_bidirectional);
     } else if (g.Ncolor()/T.Vectors().Nspin() == 32) {
       calculateYcoarse<Float,vFloat,32>(Y, X, Yatomic, Xatomic, uv, T, g, clover, cloverInv, kappa, mu, mu_factor, dirac, matpc, need_bidirectional);
     } else {
       errorQuda("Unsupported number of colors %d\n", g.Ncolor());
     }
   }

   //Does the heavy lifting of creating the coarse color matrices Y
   void calculateYcoarse(GaugeField &Y, GaugeField &X, GaugeField &Yatomic, GaugeField &Xatomic, ColorSpinorField &uv,
       const Transfer &T, const GaugeField &g, const GaugeField &clover, const GaugeField &cloverInv,
       double kappa, double mu, double mu_factor, QudaDiracType dirac, QudaMatPCType matpc, bool need_bidirectional) {
     checkPrecision(X, Y, g, clover, cloverInv, uv, T.Vectors(X.Location()));
     checkPrecision(Xatomic, Yatomic);

     if (getVerbosity() >= QUDA_SUMMARIZE) printfQuda("Computing Y field......\n");
     if (Y.Precision() == QUDA_DOUBLE_PRECISION) {
 #ifdef GPU_MULTIGRID_DOUBLE
       if (T.Vectors(X.Location()).Precision() == QUDA_DOUBLE_PRECISION) {
   calculateYcoarse<double,double>(Y, X, Yatomic, Xatomic, uv, T, g, clover, cloverInv, kappa, mu, mu_factor, dirac, matpc, need_bidirectional);
       } else {
   errorQuda("Unsupported precision %d\n", Y.Precision());
       }
 #else
       errorQuda("Double precision multigrid has not been enabled");
 #endif
     } else if (Y.Precision() == QUDA_SINGLE_PRECISION) {
       if (T.Vectors(X.Location()).Precision() == QUDA_SINGLE_PRECISION) {
   calculateYcoarse<float,float>(Y, X, Yatomic, Xatomic, uv, T, g, clover, cloverInv, kappa, mu, mu_factor, dirac, matpc, need_bidirectional);
       } else {
   errorQuda("Unsupported precision %d\n", T.Vectors(X.Location()).Precision());
       }
     } else if (Y.Precision() == QUDA_HALF_PRECISION) {
       if (T.Vectors(X.Location()).Precision() == QUDA_HALF_PRECISION) {
   calculateYcoarse<float,short>(Y, X, Yatomic, Xatomic, uv, T, g, clover, cloverInv, kappa, mu, mu_factor, dirac, matpc, need_bidirectional);
       } else {
   errorQuda("Unsupported precision %d\n", T.Vectors(X.Location()).Precision());
       }
     } else {
       errorQuda("Unsupported precision %d\n", Y.Precision());
     }
     if (getVerbosity() >= QUDA_SUMMARIZE) printfQuda("....done computing Y field\n");
   }

 #endif // GPU_MULTIGRID

   //Calculates the coarse color matrix and puts the result in Y.
   //N.B. Assumes Y, X have been allocated.
   void CoarseCoarseOp(GaugeField &Y, GaugeField &X, const Transfer &T,
           const GaugeField &gauge, const GaugeField &clover, const GaugeField &cloverInv,
           double kappa, double mu, double mu_factor, QudaDiracType dirac, QudaMatPCType matpc,
                       bool need_bidirectional) {

 #ifdef GPU_MULTIGRID
     QudaPrecision precision = Y.Precision();
     QudaFieldLocation location = checkLocation(X, Y, gauge, clover, cloverInv);

     //Create a field UV which holds U*V.  Has the same similar
     //structure to V but double the number of spins so we can store
     //the four distinct block chiral multiplications in a single UV
     //computation.
     ColorSpinorParam UVparam(T.Vectors(location));
     UVparam.create = QUDA_ZERO_FIELD_CREATE;
     UVparam.location = location;
     UVparam.nSpin *= 2; // so nSpin == 4
     UVparam.setPrecision(T.Vectors(location).Precision());
     UVparam.mem_type = Y.MemType(); // allocate temporaries to match coarse-grid link field

     ColorSpinorField *uv = ColorSpinorField::Create(UVparam);

     GaugeField *Yatomic = &Y;
     GaugeField *Xatomic = &X;
     if (Y.Precision() < QUDA_SINGLE_PRECISION) {
       // we need to coarsen into single precision fields (float or int), so we allocate temporaries for this purpose
       // else we can just coarsen directly into the original fields
       GaugeFieldParam param(X); // use X since we want scalar geometry
       param.location = location;
       param.setPrecision(QUDA_SINGLE_PRECISION, location == QUDA_CUDA_FIELD_LOCATION ? true : false);

       Yatomic = GaugeField::Create(param);
       Xatomic = GaugeField::Create(param);
     }

     calculateYcoarse(Y, X, *Yatomic, *Xatomic, *uv, T, gauge, clover, cloverInv, kappa, mu, mu_factor, dirac, matpc, need_bidirectional);

     if (Yatomic != &Y) delete Yatomic;
     if (Xatomic != &X) delete Xatomic;

     delete uv;
 #else
     errorQuda("Multigrid has not been built");
 #endif // GPU_MULTIGRID
   }

 } //namespace quda
mu
double mu
Definition: test_util.cpp:1648

QudaPrecision
enum QudaPrecision_s QudaPrecision

quda::CoarseCoarseOp
void CoarseCoarseOp(GaugeField &Y, GaugeField &X, const Transfer &T, const GaugeField &gauge, const GaugeField &clover, const GaugeField &cloverInv, double kappa, double mu, double mu_factor, QudaDiracType dirac, QudaMatPCType matpc, bool need_bidirectional)
Coarse operator construction from an intermediate-grid operator (Coarse)
Definition: coarsecoarse_op.cu:192

quda::ColorSpinorField
Definition: color_spinor_field.h:311

quda::Transfer
Definition: transfer.h:29

getVerbosity
QudaVerbosity getVerbosity()
Definition: util_quda.cpp:21

kappa
double kappa
Definition: test_util.cpp:1647

checkPrecision
#define checkPrecision(...)
Definition: lattice_field.h:695

errorQuda
#define errorQuda(...)
Definition: util_quda.h:121

color_spinor_field.h

QUDA_CUDA_FIELD_LOCATION
Definition: enum_quda.h:326

QUDA_SPACE_SPIN_COLOR_FIELD_ORDER
Definition: enum_quda.h:350

QUDA_HALF_PRECISION
Definition: enum_quda.h:60

QUDA_QDP_GAUGE_ORDER
Definition: enum_quda.h:41

QudaFieldOrder
enum QudaFieldOrder_s QudaFieldOrder

QUDA_SUMMARIZE
Definition: enum_quda.h:264

QUDA_FLOAT2_GAUGE_ORDER
Definition: enum_quda.h:39

quda::ColorSpinorField::Create
static ColorSpinorField * Create(const ColorSpinorParam &param)
Definition: color_spinor_field.cpp:752

quda
Definition: blas_cublas.h:5

param
QudaGaugeParam param
Definition: pack_test.cpp:17

matpc
void matpc(void *outEven, void **gauge, void *inEven, double kappa, QudaMatPCType matpc_type, int dagger_bit, QudaPrecision sPrecision, QudaPrecision gPrecision, double mferm)
Definition: domain_wall_dslash_reference.cpp:1032

quda::LatticeField::MemType
virtual QudaMemoryType MemType() const
Definition: lattice_field.h:572

quda::GaugeFieldParam
Definition: gauge_field.h:10

quda::GaugeField::Create
static GaugeField * Create(const GaugeFieldParam &param)
Create the gauge field, with meta data specified in the parameter struct.
Definition: gauge_field.cpp:359

quda::GaugeFieldParam::location
QudaFieldLocation location
Definition: gauge_field.h:12

QudaMatPCType
enum QudaMatPCType_s QudaMatPCType

checkLocation
#define checkLocation(...)
Definition: lattice_field.h:664

QUDA_FLOAT2_FIELD_ORDER
Definition: enum_quda.h:348

QudaGaugeFieldOrder
enum QudaGaugeFieldOrder_s QudaGaugeFieldOrder

X
int X[4]
Definition: covdev_test.cpp:70

V
int V
Definition: test_util.cpp:27

quda::ColorSpinorParam
Definition: color_spinor_field.h:80

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:62

QudaFieldLocation
enum QudaFieldLocation_s QudaFieldLocation

quda::GaugeFieldParam::setPrecision
void setPrecision(QudaPrecision precision, bool force_native=false)
Helper function for setting the precision and corresponding field order for QUDA internal fields...
Definition: gauge_field.h:131

dirac
GaugeCovDev * dirac
Definition: covdev_test.cpp:73

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:61

printfQuda
#define printfQuda(...)
Definition: util_quda.h:115

transfer.h

mu_factor
double mu_factor[QUDA_MAX_MG_LEVEL]
Definition: test_util.cpp:1674

QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:360

quda::ColorSpinorParam::create
QudaFieldCreate create
Definition: color_spinor_field.h:95

quda::LatticeField::Precision
QudaPrecision Precision() const
Definition: lattice_field.h:546

coarse_op.cuh

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:325

quda::Transfer::Vectors
const ColorSpinorField & Vectors(QudaFieldLocation location=QUDA_INVALID_FIELD_LOCATION) const
Definition: transfer.h:205

gauge_field.h

QudaDiracType
enum QudaDiracType_s QudaDiracType

quda::GaugeField
Definition: gauge_field.h:164