quda-ref/v1.1.0/coarse__op_8cu_source.html

#include <transfer.h>

#include <color_spinor_field.h>

#include <gauge_field.h>

#include <clover_field.h>


// This define controls which kernels get compiled in `coarse_op.cuh`.

// This ensures only kernels relevant for coarsening Wilson-type

// operators get built, saving compile time.

#define WILSONCOARSE

#include <coarse_op.cuh>


namespace quda {


  template <typename Float, typename vFloat, int fineColor, int fineSpin, int coarseColor, int coarseSpin>

  void calculateY(GaugeField &Y, GaugeField &X, GaugeField &Yatomic, GaugeField &Xatomic,

                  ColorSpinorField &uv, ColorSpinorField &av, const Transfer &T,

                  const GaugeField &g, const CloverField &c, double kappa, double mass, double mu, double mu_factor, QudaDiracType dirac, QudaMatPCType matpc)

  {

    QudaFieldLocation location = Y.Location();


    bool need_bidirectional = false;

    if (dirac == QUDA_CLOVERPC_DIRAC || dirac == QUDA_TWISTED_MASSPC_DIRAC || dirac == QUDA_TWISTED_CLOVERPC_DIRAC) { need_bidirectional = QUDA_BOOLEAN_TRUE; }


    if (location == QUDA_CPU_FIELD_LOCATION) {


      constexpr QudaFieldOrder csOrder = QUDA_SPACE_SPIN_COLOR_FIELD_ORDER;

      constexpr QudaGaugeFieldOrder gOrder = QUDA_QDP_GAUGE_ORDER;

      constexpr QudaCloverFieldOrder clOrder = QUDA_PACKED_CLOVER_ORDER;


      if (T.Vectors(Y.Location()).FieldOrder() != csOrder)

        errorQuda("Unsupported field order %d\n", T.Vectors(Y.Location()).FieldOrder());

      if (g.FieldOrder() != gOrder) errorQuda("Unsupported field order %d\n", g.FieldOrder());

      if (c.Order() != clOrder && c.Bytes()) errorQuda("Unsupported field order %d\n", c.Order());


      typedef typename colorspinor::FieldOrderCB<Float,fineSpin,fineColor,coarseColor,csOrder,vFloat> V;

      typedef typename colorspinor::FieldOrderCB<Float,fineSpin,fineColor,coarseColor,csOrder,vFloat> F;

      typedef typename gauge::FieldOrder<Float,fineColor,1,gOrder> gFine;

      typedef typename gauge::FieldOrder<Float,coarseColor*coarseSpin,coarseSpin,gOrder,true,vFloat> gCoarse;

      typedef typename gauge::FieldOrder<Float,coarseColor*coarseSpin,coarseSpin,gOrder,true,storeType> gCoarseAtomic;

      typedef typename clover::FieldOrder<Float,fineColor,fineSpin,clOrder> cFine;


      const ColorSpinorField &v = T.Vectors(g.Location());


      V vAccessor(const_cast<ColorSpinorField&>(v));

      F uvAccessor(const_cast<ColorSpinorField&>(uv));

      F avAccessor(const_cast<ColorSpinorField&>(av));

      gFine gAccessor(const_cast<GaugeField&>(g));

      gCoarse yAccessor(const_cast<GaugeField&>(Y));

      gCoarse xAccessor(const_cast<GaugeField&>(X));

      gCoarseAtomic yAccessorAtomic(const_cast<GaugeField&>(Yatomic));

      gCoarseAtomic xAccessorAtomic(const_cast<GaugeField&>(Xatomic));

      cFine cAccessor(const_cast<CloverField&>(c), false);

      cFine cInvAccessor(const_cast<CloverField&>(c), true);


      calculateY<QUDA_CPU_FIELD_LOCATION, false,Float,fineSpin,fineColor,coarseSpin,coarseColor>

        (yAccessor, xAccessor, yAccessorAtomic, xAccessorAtomic, uvAccessor,

         avAccessor, vAccessor, gAccessor, cAccessor, cInvAccessor, Y, X, Yatomic, Xatomic, uv, av, v, g, c,

         kappa, mass, mu, mu_factor, dirac, matpc, need_bidirectional,

         T.fineToCoarse(location), T.coarseToFine(location));


    } else {


      constexpr QudaFieldOrder csOrder = QUDA_FLOAT2_FIELD_ORDER;

      constexpr QudaGaugeFieldOrder gOrder = QUDA_FLOAT2_GAUGE_ORDER;

      constexpr QudaCloverFieldOrder clOrder = QUDA_FLOAT4_CLOVER_ORDER;


      if (T.Vectors(Y.Location()).FieldOrder() != csOrder)

        errorQuda("Unsupported field order %d\n", T.Vectors(Y.Location()).FieldOrder());

      if (g.FieldOrder() != gOrder) errorQuda("Unsupported field order %d\n", g.FieldOrder());

      if (c.Order() != clOrder && c.Bytes()) errorQuda("Unsupported field order %d\n", c.Order());


      typedef typename colorspinor::FieldOrderCB<Float,fineSpin,fineColor,coarseColor,csOrder,vFloat,vFloat,false,false> F;

      typedef typename gauge::FieldOrder<Float,fineColor,1,gOrder,true,Float> gFine;

      typedef typename gauge::FieldOrder<Float,coarseColor*coarseSpin,coarseSpin,gOrder,true,vFloat> gCoarse;

      typedef typename gauge::FieldOrder<Float,coarseColor*coarseSpin,coarseSpin,gOrder,true,storeType> gCoarseAtomic;

      typedef typename clover::FieldOrder<Float,fineColor,fineSpin,clOrder> cFine;


      const ColorSpinorField &v = T.Vectors(g.Location());


      F vAccessor(const_cast<ColorSpinorField&>(v));

      F uvAccessor(const_cast<ColorSpinorField&>(uv));

      F avAccessor(const_cast<ColorSpinorField&>(av));

      gFine gAccessor(const_cast<GaugeField&>(g));

      gCoarse yAccessor(const_cast<GaugeField&>(Y));

      gCoarse xAccessor(const_cast<GaugeField&>(X));

      gCoarseAtomic yAccessorAtomic(const_cast<GaugeField&>(Yatomic));

      gCoarseAtomic xAccessorAtomic(const_cast<GaugeField&>(Xatomic));

      cFine cAccessor(const_cast<CloverField&>(c), false);

      cFine cInvAccessor(const_cast<CloverField&>(c), true);


      calculateY<QUDA_CUDA_FIELD_LOCATION, false,Float,fineSpin,fineColor,coarseSpin,coarseColor>

        (yAccessor, xAccessor, yAccessorAtomic, xAccessorAtomic, uvAccessor,

         avAccessor, vAccessor, gAccessor, cAccessor, cInvAccessor, Y, X, Yatomic, Xatomic, uv, av, v, g, c,

         kappa, mass, mu, mu_factor, dirac, matpc, need_bidirectional,

         T.fineToCoarse(location), T.coarseToFine(location));

    }


  }


  // template on the number of coarse degrees of freedom

  template <typename Float, typename vFloat, int fineColor, int fineSpin>

  void calculateY(GaugeField &Y, GaugeField &X, GaugeField &Yatomic, GaugeField &Xatomic,

                  ColorSpinorField &uv, ColorSpinorField &av, const Transfer &T, const GaugeField &g, const CloverField &c,

                  double kappa, double mass, double mu, double mu_factor, QudaDiracType dirac, QudaMatPCType matpc)

  {

    if (T.Vectors().Nspin()/T.Spin_bs() != 2)

      errorQuda("Unsupported number of coarse spins %d\n",T.Vectors().Nspin()/T.Spin_bs());

    const int coarseSpin = 2;

    const int coarseColor = Y.Ncolor() / coarseSpin;


#ifdef NSPIN4

    if (coarseColor == 6) { // free field Wilson

      calculateY<Float,vFloat,fineColor,fineSpin,6,coarseSpin>(Y, X, Yatomic, Xatomic, uv, av, T, g, c, kappa, mass, mu, mu_factor, dirac, matpc);

    } else if (coarseColor == 24) {

      calculateY<Float,vFloat,fineColor,fineSpin,24,coarseSpin>(Y, X, Yatomic, Xatomic, uv, av, T, g, c, kappa, mass, mu, mu_factor, dirac, matpc);

    } else if (coarseColor == 32) {

      calculateY<Float,vFloat,fineColor,fineSpin,32,coarseSpin>(Y, X, Yatomic, Xatomic, uv, av, T, g, c, kappa, mass, mu, mu_factor, dirac, matpc);

    } else

#endif

    {

      errorQuda("Unsupported number of coarse dof %d\n", Y.Ncolor());

    }

  }


  // template on fine spin

  template <typename Float, typename vFloat, int fineColor>

  void calculateY(GaugeField &Y, GaugeField &X, GaugeField &Yatomic, GaugeField &Xatomic,

                  ColorSpinorField &uv, ColorSpinorField &av, const Transfer &T, const GaugeField &g, const CloverField &c,

                  double kappa, double mass, double mu, double mu_factor, QudaDiracType dirac, QudaMatPCType matpc)

  {

    if (uv.Nspin() == 4) {

      calculateY<Float,vFloat,fineColor,4>(Y, X, Yatomic, Xatomic, uv, av, T, g, c, kappa, mass, mu, mu_factor, dirac, matpc);

    } else {

      errorQuda("Unsupported number of spins %d\n", uv.Nspin());

    }

  }


  // template on fine colors

  template <typename Float, typename vFloat>

  void calculateY(GaugeField &Y, GaugeField &X, GaugeField &Yatomic, GaugeField &Xatomic,

                  ColorSpinorField &uv, ColorSpinorField &av, const Transfer &T, const GaugeField &g, const CloverField &c,

                  double kappa, double mass, double mu, double mu_factor, QudaDiracType dirac, QudaMatPCType matpc)

  {

    if (g.Ncolor() == 3) {

      calculateY<Float,vFloat,3>(Y, X, Yatomic, Xatomic, uv, av, T, g, c, kappa, mass, mu, mu_factor, dirac, matpc);

    } else {

      errorQuda("Unsupported number of colors %d\n", g.Ncolor());

    }

  }


  //Does the heavy lifting of creating the coarse color matrices Y

  void calculateY(GaugeField &Y, GaugeField &X, GaugeField &Yatomic, GaugeField &Xatomic,

                  ColorSpinorField &uv, ColorSpinorField &av, const Transfer &T, const GaugeField &g,

                  const CloverField &c, double kappa, double mass, double mu, double mu_factor, QudaDiracType dirac, QudaMatPCType matpc)

  {

#ifdef GPU_MULTIGRID

    checkPrecision(Xatomic, Yatomic, g);

    checkPrecision(uv, av, T.Vectors(X.Location()), X, Y);


    if (getVerbosity() >= QUDA_SUMMARIZE) printfQuda("Computing Y field......\n");


    if (Y.Precision() == QUDA_DOUBLE_PRECISION) {

#ifdef GPU_MULTIGRID_DOUBLE

      if (T.Vectors(X.Location()).Precision() == QUDA_DOUBLE_PRECISION) {

        calculateY<double,double>(Y, X, Yatomic, Xatomic, uv, av, T, g, c, kappa, mass, mu, mu_factor, dirac, matpc);

      } else {

        errorQuda("Unsupported precision %d\n", Y.Precision());

      }

#else

      errorQuda("Double precision multigrid has not been enabled");

#endif

    } else if (Y.Precision() == QUDA_SINGLE_PRECISION) {

#if QUDA_PRECISION & 4

      if (T.Vectors(X.Location()).Precision() == QUDA_SINGLE_PRECISION) {

        calculateY<float,float>(Y, X, Yatomic, Xatomic, uv, av, T, g, c, kappa, mass, mu, mu_factor, dirac, matpc);

      } else {

        errorQuda("Unsupported precision %d\n", T.Vectors(X.Location()).Precision());

      }

#else

      errorQuda("QUDA_PRECISION=%d does not enable single precision", QUDA_PRECISION);

#endif

    } else if (Y.Precision() == QUDA_HALF_PRECISION) {

#if QUDA_PRECISION & 2

      if (T.Vectors(X.Location()).Precision() == QUDA_HALF_PRECISION) {

        calculateY<float,short>(Y, X, Yatomic, Xatomic, uv, av, T, g, c, kappa, mass, mu, mu_factor, dirac, matpc);

      } else {

        errorQuda("Unsupported precision %d\n", T.Vectors(X.Location()).Precision());

      }

#else

      errorQuda("QUDA_PRECISION=%d does not enable half precision", QUDA_PRECISION);

#endif

    } else {

      errorQuda("Unsupported precision %d\n", Y.Precision());

    }

    if (getVerbosity() >= QUDA_SUMMARIZE) printfQuda("....done computing Y field\n");

#else

    errorQuda("Multigrid has not been built");

#endif // GPU_MULTIGRID

  }


  //Calculates the coarse color matrix and puts the result in Y.

  //N.B. Assumes Y, X have been allocated.

  void CoarseOp(GaugeField &Y, GaugeField &X, const Transfer &T,

                const cudaGaugeField &gauge, const cudaCloverField *clover,

                double kappa, double mass, double mu, double mu_factor, QudaDiracType dirac, QudaMatPCType matpc)

  {

    QudaPrecision precision = Y.Precision();

    QudaFieldLocation location = checkLocation(Y, X);


    GaugeField *U = location == QUDA_CUDA_FIELD_LOCATION ? const_cast<cudaGaugeField*>(&gauge) : nullptr;

    CloverField *C = location == QUDA_CUDA_FIELD_LOCATION ? const_cast<cudaCloverField*>(clover) : nullptr;


    if (location == QUDA_CPU_FIELD_LOCATION) {

      //First make a cpu gauge field from the cuda gauge field

      int pad = 0;

      GaugeFieldParam gf_param(gauge.X(), precision, QUDA_RECONSTRUCT_NO, pad, gauge.Geometry());

      gf_param.order = QUDA_QDP_GAUGE_ORDER;

      gf_param.fixed = gauge.GaugeFixed();

      gf_param.link_type = gauge.LinkType();

      gf_param.t_boundary = gauge.TBoundary();

      gf_param.anisotropy = gauge.Anisotropy();

      gf_param.gauge = NULL;

      gf_param.create = QUDA_NULL_FIELD_CREATE;

      gf_param.siteSubset = QUDA_FULL_SITE_SUBSET;

      gf_param.nFace = 1;

      gf_param.ghostExchange = QUDA_GHOST_EXCHANGE_PAD;


      U = new cpuGaugeField(gf_param);


      //Copy the cuda gauge field to the cpu

      gauge.saveCPUField(*static_cast<cpuGaugeField*>(U));

    } else if (location == QUDA_CUDA_FIELD_LOCATION && gauge.Reconstruct() != QUDA_RECONSTRUCT_NO) {

      //Create a copy of the gauge field with no reconstruction, required for fine-grained access

      GaugeFieldParam gf_param(gauge);

      gf_param.reconstruct = QUDA_RECONSTRUCT_NO;

      gf_param.order = QUDA_FLOAT2_GAUGE_ORDER;

      gf_param.setPrecision(gf_param.Precision());

      U = new cudaGaugeField(gf_param);


      U->copy(gauge);

    }


    CloverFieldParam cf_param;

    cf_param.nDim = 4;

    cf_param.pad = 0;

    cf_param.setPrecision(clover ? clover->Precision() : QUDA_SINGLE_PRECISION);


    // if we have no clover term then create an empty clover field

    for(int i = 0; i < cf_param.nDim; i++) cf_param.x[i] = clover ? clover->X()[i] : 0;


    cf_param.direct = true;

    cf_param.inverse = true;

    cf_param.clover = NULL;

    cf_param.norm = 0;

    cf_param.cloverInv = NULL;

    cf_param.invNorm = 0;

    cf_param.create = QUDA_NULL_FIELD_CREATE;

    cf_param.siteSubset = QUDA_FULL_SITE_SUBSET;


    if (location == QUDA_CUDA_FIELD_LOCATION && !clover) {

      // create a dummy cudaCloverField if one is not defined

      cf_param.order = QUDA_INVALID_CLOVER_ORDER;

      C = new cudaCloverField(cf_param);

    } else if (location == QUDA_CPU_FIELD_LOCATION) {

      //Create a cpuCloverField from the cudaCloverField

      cf_param.order = QUDA_PACKED_CLOVER_ORDER;

      C = new cpuCloverField(cf_param);

      if (clover) clover->saveCPUField(*static_cast<cpuCloverField*>(C));

    }


    //Create a field UV which holds U*V.  Has the same structure as V.

    ColorSpinorParam UVparam(T.Vectors(location));

    UVparam.create = QUDA_ZERO_FIELD_CREATE;

    UVparam.location = location;

    UVparam.setPrecision(T.Vectors(location).Precision());

    UVparam.mem_type = Y.MemType(); // allocate temporaries to match coarse-grid link field


    ColorSpinorField *uv = ColorSpinorField::Create(UVparam);


    // if we are coarsening a preconditioned clover or twisted-mass operator we need

    // an additional vector to store the cloverInv * V field, else just alias v

    ColorSpinorField *av = ((matpc != QUDA_MATPC_INVALID && clover) || (dirac == QUDA_TWISTED_MASSPC_DIRAC)) ?

      ColorSpinorField::Create(UVparam) : &const_cast<ColorSpinorField&>(T.Vectors(location));


    GaugeField *Yatomic = &Y;

    GaugeField *Xatomic = &X;

    if (Y.Precision() < QUDA_SINGLE_PRECISION) {

      // we need to coarsen into single precision fields (float or int), so we allocate temporaries for this purpose

      // else we can just coarsen directly into the original fields

      GaugeFieldParam param(X); // use X since we want scalar geometry

      param.location = location;

      param.setPrecision(QUDA_SINGLE_PRECISION, location == QUDA_CUDA_FIELD_LOCATION ? true : false);


      Yatomic = GaugeField::Create(param);

      Xatomic = GaugeField::Create(param);

    }


    calculateY(Y, X, *Yatomic, *Xatomic, *uv, *av, T, *U, *C, kappa, mass, mu, mu_factor, dirac, matpc);


    if (Yatomic != &Y) delete Yatomic;

    if (Xatomic != &X) delete Xatomic;


    if (&T.Vectors(location) != av) delete av;

    delete uv;


    if (C != clover) delete C;

    if (U != &gauge) delete U;

  }


} //namespace quda