quda-ref/v1.0.0/copy__gauge_8cuh_source.html

 #include <gauge_field_order.h>
 #include <quda_matrix.h>

 namespace quda {

   using namespace gauge;

   template <typename OutOrder, typename InOrder>
   struct CopyGaugeArg {
     OutOrder out;
     const InOrder in;
     int volume;
     int faceVolumeCB[QUDA_MAX_DIM];
     int_fastdiv nDim;
     int_fastdiv geometry;
     int out_offset;
     int in_offset;
     CopyGaugeArg(const OutOrder &out, const InOrder &in, const GaugeField &meta)
       : out(out), in(in), volume(meta.Volume()), nDim(meta.Ndim()),
         geometry(meta.Geometry()), out_offset(0), in_offset(0) {
       for (int d=0; d<nDim; d++) faceVolumeCB[d] = meta.SurfaceCB(d) * meta.Nface();
     }
   };

   template <typename FloatOut, typename FloatIn, int length, typename Arg>
   void copyGauge(Arg &arg) {
     typedef typename mapper<FloatIn>::type RegTypeIn;
     typedef typename mapper<FloatOut>::type RegTypeOut;
     constexpr int nColor = Ncolor(length);

     for (int parity=0; parity<2; parity++) {

       for (int d=0; d<arg.geometry; d++) {
   for (int x=0; x<arg.volume/2; x++) {
 #ifdef FINE_GRAINED_ACCESS
     for (int i=0; i<nColor; i++)
       for (int j=0; j<nColor; j++) {
         arg.out(d, parity, x, i, j) = arg.in(d, parity, x, i, j);
       }
 #else
     Matrix<complex<RegTypeIn>, nColor> in;
     Matrix<complex<RegTypeOut>, nColor> out;
           in = arg.in(d, x, parity);
           out = in;
     arg.out(d, x, parity) = out;
 #endif
   }
       }

     }
   }

   template <typename Float, int length, typename Arg>
   void checkNan(Arg &arg) {
     typedef typename mapper<Float>::type RegType;
     constexpr int nColor = Ncolor(length);

     for (int parity=0; parity<2; parity++) {

       for (int d=0; d<arg.geometry; d++) {
   for (int x=0; x<arg.volume/2; x++) {
 #ifdef FINE_GRAINED_ACCESS
     for (int i=0; i<nColor; i++)
       for (int j=0; j<nColor; j++) {
               complex<Float> u = arg.in(d, parity, x, i, j);
         if (isnan(u.real()))
           errorQuda("Nan detected at parity=%d, dir=%d, x=%d, i=%d", parity, d, x, 2*(i*Ncolor(length)+j));
         if (isnan(u.imag()))
     errorQuda("Nan detected at parity=%d, dir=%d, x=%d, i=%d", parity, d, x, 2*(i*Ncolor(length)+j+1));
             }
 #else
     Matrix<complex<RegType>, nColor> u = arg.in(d, x, parity);
     for (int i=0; i<length/2; i++)
       if (isnan(u(i).real()) || isnan(u(i).imag())) errorQuda("Nan detected at parity=%d, dir=%d, x=%d, i=%d", parity, d, x, i);
 #endif
   }
       }

     }
   }

   template <typename FloatOut, typename FloatIn, int length, typename Arg>
   __global__ void copyGaugeKernel(Arg arg) {
     typedef typename mapper<FloatIn>::type RegTypeIn;
     typedef typename mapper<FloatOut>::type RegTypeOut;
     constexpr int nColor = Ncolor(length);

     int x = blockIdx.x * blockDim.x + threadIdx.x;
     int parity_d = blockIdx.z * blockDim.z + threadIdx.z; //parity_d = parity*geometry + d
     int parity = parity_d / arg.geometry;
     int d = parity_d % arg.geometry;

     if (x >= arg.volume/2) return;
     if (parity_d >= 2 * arg.geometry) return;

 #ifdef FINE_GRAINED_ACCESS
     int i = blockIdx.y * blockDim.y + threadIdx.y;
     if (i >= nColor) return;
     for (int j=0; j<nColor; j++) arg.out(d, parity, x, i, j) = arg.in(d, parity, x, i, j);
 #else
     Matrix<complex<RegTypeIn>, nColor> in;
     Matrix<complex<RegTypeOut>, nColor> out;
     in = arg.in(d, x, parity);
     out = in;
     arg.out(d, x, parity) = out;
 #endif
   }

   template <typename FloatOut, typename FloatIn, int length, typename Arg>
   void copyGhost(Arg &arg) {
     typedef typename mapper<FloatIn>::type RegTypeIn;
     typedef typename mapper<FloatOut>::type RegTypeOut;
     constexpr int nColor = Ncolor(length);

     for (int parity=0; parity<2; parity++) {

       for (int d=0; d<arg.nDim; d++) {
         for (int x=0; x<arg.faceVolumeCB[d]; x++) {
 #ifdef FINE_GRAINED_ACCESS
           for (int i=0; i<nColor; i++)
             for (int j=0; j<nColor; j++)
               arg.out.Ghost(d+arg.out_offset, parity, x, i, j) = arg.in.Ghost(d+arg.in_offset, parity, x, i, j);
 #else
           Matrix<complex<RegTypeIn>, nColor> in;
           Matrix<complex<RegTypeOut>, nColor> out;
           in = arg.in.Ghost(d+arg.in_offset, x, parity);
           out = in;
           arg.out.Ghost(d+arg.out_offset, x, parity) = out;
 #endif
         }
       }

     }
   }

   template <typename FloatOut, typename FloatIn, int length, typename Arg>
   __global__ void copyGhostKernel(Arg arg) {
     typedef typename mapper<FloatIn>::type RegTypeIn;
     typedef typename mapper<FloatOut>::type RegTypeOut;
     constexpr int nColor = Ncolor(length);

     int x = blockIdx.x * blockDim.x + threadIdx.x;
     int parity_d = blockIdx.z * blockDim.z + threadIdx.z; //parity_d = parity*nDim + d
     int parity = parity_d / arg.nDim;
     int d = parity_d % arg.nDim;
     if (parity_d >= 2 * arg.nDim) return;

     if (x < arg.faceVolumeCB[d]) {
 #ifdef FINE_GRAINED_ACCESS
       int i = blockIdx.y * blockDim.y + threadIdx.y;
       if (i >= nColor) return;
       for (int j=0; j<nColor; j++)
         arg.out.Ghost(d+arg.out_offset, parity, x, i, j) = arg.in.Ghost(d+arg.in_offset, parity, x, i, j);
 #else
       Matrix<complex<RegTypeIn>, nColor> in;
       Matrix<complex<RegTypeOut>, nColor> out;
       in = arg.in.Ghost(d+arg.in_offset, x, parity);
       out = in;
       arg.out.Ghost(d+arg.out_offset, x, parity) = out;
 #endif
     }

   }

 } // namespace quda
quda::gauge::Ncolor
__host__ __device__ constexpr int Ncolor(int length)
Return the number of colors of the accessor based on the length of the field.
Definition: gauge_field_order.h:1674

quda::CopyGaugeArg::out
OutOrder out
Definition: copy_gauge.cuh:13

quda::CopyGaugeArg::geometry
int_fastdiv geometry
Definition: copy_gauge.cuh:18

errorQuda
#define errorQuda(...)
Definition: util_quda.h:121

quda::LatticeField::SurfaceCB
const int * SurfaceCB() const
Definition: lattice_field.h:515

int_fastdiv
Definition: fast_intdiv.h:20

quda::copyGauge
void copyGauge(Arg &arg)
Definition: copy_gauge.cuh:32

quda::checkNan
void checkNan(Arg &arg)
Definition: copy_gauge.cuh:63

length
int length[]
Definition: gauge_force_test.cpp:34

quda
Definition: blas_cublas.h:5

quda::GaugeField::Nface
int Nface() const
Definition: gauge_field.h:281

quda::copyGhostKernel
__global__ void copyGhostKernel(Arg arg)
Definition: copy_gauge.cuh:157

nColor
const int nColor
Definition: covdev_test.cpp:75

quda::CopyGaugeArg::CopyGaugeArg
CopyGaugeArg(const OutOrder &out, const InOrder &in, const GaugeField &meta)
Definition: copy_gauge.cuh:21

quda::CopyGaugeArg
Definition: copy_gauge.cuh:12

quda::CopyGaugeArg::out_offset
int out_offset
Definition: copy_gauge.cuh:19

in
cpuColorSpinorField * in
Definition: staggered_invert_test.cpp:98

gauge_field_order.h
Main header file for host and device accessors to GaugeFields.

quda::CopyGaugeArg::in
const InOrder in
Definition: copy_gauge.cuh:14

quda::Arg
Definition: spinor_noise.cu:22

quda_matrix.h

out
cpuColorSpinorField * out
Definition: staggered_invert_test.cpp:99

quda::mapper
Definition: register_traits.h:43

quda::CopyGaugeArg::nDim
int_fastdiv nDim
Definition: copy_gauge.cuh:17

quda::copyGhost
void copyGhost(Arg &arg)
Definition: copy_gauge.cuh:126

quda::CopyGaugeArg::volume
int volume
Definition: copy_gauge.cuh:15

quda::arg
__host__ __device__ ValueType arg(const complex< ValueType > &z)
Returns the phase angle of z.
Definition: complex_quda.h:1076

quda::copyGaugeKernel
__global__ void copyGaugeKernel(Arg arg)
Definition: copy_gauge.cuh:96

QUDA_MAX_DIM
#define QUDA_MAX_DIM
Maximum number of dimensions supported by QUDA. In practice, no routines make use of more than 5...
Definition: quda_constants.h:17

parity
QudaParity parity
Definition: covdev_test.cpp:54

quda::Matrix
Definition: quda_matrix.h:64

quda::CopyGaugeArg::in_offset
int in_offset
Definition: copy_gauge.cuh:20

quda::GaugeField
Definition: gauge_field.h:164