quda-ref/v1.0.0/gauge__qcharge_8cu_source.html

 #include <quda_internal.h>
 #include <tune_quda.h>
 #include <gauge_field.h>

 #include <launch_kernel.cuh>
 #include <jitify_helper.cuh>
 #include <kernels/gauge_qcharge.cuh>

 namespace quda
 {

 #ifdef GPU_GAUGE_TOOLS

   template <typename Float, typename Arg> class QChargeCompute : TunableLocalParity
   {
     Arg &arg;
     const GaugeField &meta;

 private:
     bool tuneGridDim() const { return true; }
     unsigned int minThreads() const { return arg.threads; }

 public:
     QChargeCompute(Arg &arg, const GaugeField &meta) : arg(arg), meta(meta)
     {
 #ifdef JITIFY
       create_jitify_program("kernels/gauge_qcharge.cuh");
 #endif
     }
     virtual ~QChargeCompute() {}

     void apply(const cudaStream_t &stream)
     {
       if (meta.Location() == QUDA_CUDA_FIELD_LOCATION) {
         arg.result_h[0] = 0.;
         TuneParam tp = tuneLaunch(*this, getTuning(), getVerbosity());
 #ifdef JITIFY
         using namespace jitify::reflection;
         jitify_error = program->kernel("quda::qChargeComputeKernel")
                          .instantiate((int)tp.block.x, Type<Float>(), Type<Arg>())
                          .configure(tp.grid, tp.block, tp.shared_bytes, stream)
                          .launch(arg);
 #else
   LAUNCH_KERNEL(qChargeComputeKernel, tp, stream, arg, Float);
 #endif
         qudaDeviceSynchronize();
       } else { // run the CPU code
         errorQuda("qChargeComputeKernel not supported on CPU");
       }
     }

     TuneKey tuneKey() const
     {
       std::stringstream aux;
       aux << "threads=" << arg.threads << ",prec=" << sizeof(Float);
       return TuneKey(meta.VolString(), typeid(*this).name(), aux.str().c_str());
     }

     long long flops() const { return 2 * arg.threads * (3 * 198 + 9); }
     long long bytes() const { return 2 * arg.threads * ((6 * 18) + Arg::density) * sizeof(Float); }
   }; // QChargeCompute

   template <typename Float, typename Gauge, bool density>
   void computeQCharge(const Gauge data, const GaugeField &Fmunu, Float *qDensity, Float &qChg)
   {
     QChargeArg<Float, Gauge, density> arg(data, Fmunu, qDensity);
     QChargeCompute<Float, decltype(arg)> qChargeCompute(arg, Fmunu);
     qChargeCompute.apply(0);
     checkCudaError();
     comm_allreduce((double *)arg.result_h);
     qChg = arg.result_h[0];
   }

   template <typename Float, bool density> Float computeQCharge(const GaugeField &Fmunu, Float *qDensity = nullptr)
   {
     Float qChg = 0.0;

     if (!Fmunu.isNative()) errorQuda("Topological charge computation only supported on native ordered fields");

     if (Fmunu.Reconstruct() == QUDA_RECONSTRUCT_NO) {
       typedef typename gauge_mapper<Float, QUDA_RECONSTRUCT_NO>::type Gauge;
       computeQCharge<Float, Gauge, density>(Gauge(Fmunu), Fmunu, qDensity, qChg);
     } else if (Fmunu.Reconstruct() == QUDA_RECONSTRUCT_12) {
       typedef typename gauge_mapper<Float, QUDA_RECONSTRUCT_12>::type Gauge;
       computeQCharge<Float, Gauge, density>(Gauge(Fmunu), Fmunu, qDensity, qChg);
     } else if (Fmunu.Reconstruct() == QUDA_RECONSTRUCT_8) {
       typedef typename gauge_mapper<Float, QUDA_RECONSTRUCT_8>::type Gauge;
       computeQCharge<Float, Gauge, density>(Gauge(Fmunu), Fmunu, qDensity, qChg);
     } else {
       errorQuda("Reconstruction type %d of gauge field not supported", Fmunu.Reconstruct());
     }

     return qChg;
   }
 #endif // GPU_GAUGE_TOOLS

   double computeQCharge(const GaugeField &Fmunu)
   {
     double qChg = 0.0;
 #ifdef GPU_GAUGE_TOOLS
     if (!Fmunu.isNative()) errorQuda("Order %d with %d reconstruct not supported", Fmunu.Order(), Fmunu.Reconstruct());

     if (Fmunu.Precision() == QUDA_SINGLE_PRECISION) {
       qChg = computeQCharge<float, false>(Fmunu);
     } else if (Fmunu.Precision() == QUDA_DOUBLE_PRECISION) {
       qChg = computeQCharge<double, false>(Fmunu);
     } else {
       errorQuda("Precision %d not supported", Fmunu.Precision());
     }
 #else
     errorQuda("Gauge tools are not built");
 #endif // GPU_GAUGE_TOOLS
     return qChg;
   }

   double computeQChargeDensity(const GaugeField &Fmunu, void *qDensity)
   {
     double qChg = 0.0;
 #ifdef GPU_GAUGE_TOOLS
     if (!Fmunu.isNative()) errorQuda("Order %d with %d reconstruct not supported", Fmunu.Order(), Fmunu.Reconstruct());

     if (Fmunu.Precision() == QUDA_SINGLE_PRECISION) {
       qChg = computeQCharge<float, true>(Fmunu, (float *)qDensity);
     } else if (Fmunu.Precision() == QUDA_DOUBLE_PRECISION) {
       qChg = computeQCharge<double, true>(Fmunu, (double *)qDensity);
     } else {
       errorQuda("Precision %d not supported", Fmunu.Precision());
     }
 #else
     errorQuda("Gauge tools are not built");
 #endif // GPU_GAUGE_TOOLS
     return qChg;
   }
 } // namespace quda
QUDA_RECONSTRUCT_NO
Definition: enum_quda.h:67

quda::TuneParam
Definition: tune_quda.h:17

quda::computeQCharge
double computeQCharge(const GaugeField &Fmunu)
Compute the topological charge.
Definition: gauge_qcharge.cu:97

quda::TunableLocalParity
Definition: tune_quda.h:386

getVerbosity
QudaVerbosity getVerbosity()
Definition: util_quda.cpp:21

errorQuda
#define errorQuda(...)
Definition: util_quda.h:121

QUDA_CUDA_FIELD_LOCATION
Definition: enum_quda.h:326

jitify_helper.cuh
Helper file when using jitify run-time compilation. This file should be included in source code...

quda::QChargeArg
Definition: gauge_qcharge.cuh:12

quda::stream
cudaStream_t * stream
Definition: cuda_color_spinor_field.cpp:897

quda::LatticeField::VolString
const char * VolString() const
Definition: lattice_field.h:624

quda::TuneParam::shared_bytes
int shared_bytes
Definition: tune_quda.h:22

quda::computeQChargeDensity
double computeQChargeDensity(const GaugeField &Fmunu, void *result)
Compute the topological charge density per lattice site.
Definition: gauge_qcharge.cu:116

quda::TuneParam::grid
dim3 grid
Definition: tune_quda.h:21

quda
Definition: blas_cublas.h:5

qudaDeviceSynchronize
#define qudaDeviceSynchronize()
Definition: quda_cuda_api.h:145

gauge_qcharge.cuh

launch_kernel.cuh

QUDA_RECONSTRUCT_12
Definition: enum_quda.h:68

quda::TuneParam::block
dim3 block
Definition: tune_quda.h:20

quda::qChargeComputeKernel
__global__ void qChargeComputeKernel(Arg arg)
Definition: gauge_qcharge.cuh:28

quda::tuneLaunch
TuneParam & tuneLaunch(Tunable &tunable, QudaTune enabled, QudaVerbosity verbosity)
Definition: tune.cpp:643

tune_quda.h

quda::Arg
Definition: spinor_noise.cu:22

LAUNCH_KERNEL
#define LAUNCH_KERNEL(kernel, tp, stream, arg,...)
Definition: launch_kernel.cuh:1

quda::LatticeField::Location
QudaFieldLocation Location() const
Definition: lattice_field.cpp:660

QUDA_RECONSTRUCT_8
Definition: enum_quda.h:69

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:62

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:61

quda::gauge_mapper
Definition: gauge_field_order.h:3012

quda::blas::flops
unsigned long long flops
Definition: blas_quda.cu:22

quda::arg
__host__ __device__ ValueType arg(const complex< ValueType > &z)
Returns the phase angle of z.
Definition: complex_quda.h:1076

quda::GaugeField::Reconstruct
QudaReconstructType Reconstruct() const
Definition: gauge_field.h:250

quda::GaugeField::Order
QudaGaugeFieldOrder Order() const
Definition: gauge_field.h:251

checkCudaError
#define checkCudaError()
Definition: util_quda.h:161

comm_allreduce
void comm_allreduce(double *data)
Definition: comm_mpi.cpp:242

getTuning
QudaTune getTuning()
Query whether autotuning is enabled or not. Default is enabled but can be overridden by setting QUDA_...
Definition: util_quda.cpp:52

quda::LatticeField::Precision
QudaPrecision Precision() const
Definition: lattice_field.h:546

quda::GaugeField::isNative
bool isNative() const
Definition: gauge_field.cpp:167

gauge_field.h

quda::TuneKey
Definition: tune_key.h:8

quda::blas::bytes
unsigned long long bytes
Definition: blas_quda.cu:23

quda_internal.h

quda::GaugeField
Definition: gauge_field.h:164