quda-ref/v0.7.0/ks__force__quda_8cu_source.html

 #include <quda_internal.h>

 #include <quda_matrix.h>

 #include <tune_quda.h>

 #include <gauge_field.h>

 #include <gauge_field_order.h>

 #include <ks_force_quda.h>


 namespace quda {


   template<typename Oprod, typename Gauge, typename Mom>

     struct KSForceArg {

       int threads;

       int X[4]; // grid dimensions

 #ifndef BUILD_TIFR_INTERFACE

 #ifdef MULTI_GPU

       int border[4];

 #endif

 #endif

       Oprod oprod;

       Gauge gauge;

       Mom mom;


       KSForceArg(Oprod& oprod, Gauge &gauge, Mom& mom, int dim[4])

         : oprod(oprod), gauge(gauge), mom(mom){


           threads = 1;

           for(int dir=0; dir<4; ++dir) threads *= dim[dir];


           for(int dir=0; dir<4; ++dir) X[dir] = dim[dir];

 #ifndef BUILD_TIFR_INTERFACE

 #ifdef MULTI_GPU

           for(int dir=0; dir<4; ++dir) border[dir] = 2;

 #endif

 #endif

         }


     };


   __device__ __host__ inline int linkIndex(int x[], int dx[], const int X[4]) {

     int y[4];

     for (int i=0; i<4; i++) y[i] = (x[i] + dx[i] + X[i]) % X[i];

     int idx = (((y[3]*X[2] + y[2])*X[1] + y[1])*X[0] + y[0]) >> 1;

     return idx;

   }


   __device__ __host__ inline void getCoords(int x[4], int cb_index, const int X[4], int parity)

   {

     x[3] = cb_index/(X[2]*X[1]*X[0]/2);

     x[2] = (cb_index/(X[1]*X[0]/2)) % X[2];

     x[1] = (cb_index/(X[0]/2)) % X[1];

     x[0] = 2*(cb_index%(X[0]/2)) + ((x[3]+x[2]+x[1]+parity)&1);


     return;

   }


   template<typename Float, typename Oprod, typename Gauge, typename Mom>

     __host__ __device__ void completeKSForceCore(KSForceArg<Oprod,Gauge,Mom>& arg, int idx){


       int parity = 0;

       if(idx >= arg.threads/2){

         parity = 1;

         idx -= arg.threads/2;

       }


       int X[4];

       for(int dir=0; dir<4; ++dir) X[dir] = arg.X[dir];


       int x[4];

       getCoords(x, idx, X, parity);

 #ifndef BUILD_TIFR_INTERFACE

 #ifdef MULTI_GPU

       for(int dir=0; dir<4; ++dir){

         x[dir] += arg.border[dir];

         X[dir] += 2*arg.border[dir];

       }

 #endif

 #endif


       typedef typename ComplexTypeId<Float>::Type Cmplx;


       Matrix<Cmplx,3> O;

       Matrix<Cmplx,3> G;

       Matrix<Cmplx,3> M;


       int dx[4] = {0,0,0,0};

       for(int dir=0; dir<4; ++dir){

         arg.gauge.load((Float*)(G.data), linkIndex(x,dx,X), dir, parity);

         arg.oprod.load((Float*)(O.data), linkIndex(x,dx,X), dir, parity);

         if(parity==0){

           M = G*O;

         }else{

           M = -G*O;

         }


         Float sub = getTrace(M).y/(static_cast<Float>(3));

         Float temp[10];


         temp[0] = (M.data[1].x - M.data[3].x)*0.5;

         temp[1] = (M.data[1].y + M.data[3].y)*0.5;


         temp[2] = (M.data[2].x - M.data[6].x)*0.5;

         temp[3] = (M.data[2].y + M.data[6].y)*0.5;


         temp[4] = (M.data[5].x - M.data[7].x)*0.5;

         temp[5] = (M.data[5].y + M.data[7].y)*0.5;


         temp[6] = (M.data[0].y-sub);

         temp[7] = (M.data[4].y-sub);

         temp[8] = (M.data[8].y-sub);

         temp[9] = 0.0;


         arg.mom.save(temp, idx, dir, parity);

       }

     }


   template<typename Float, typename Oprod, typename Gauge, typename Mom>

     __global__ void completeKSForceKernel(KSForceArg<Oprod,Gauge,Mom> arg)

     {

       int idx = threadIdx.x + blockIdx.x*blockDim.x;


       if(idx >= arg.threads) return;

       completeKSForceCore<Float,Oprod,Gauge,Mom>(arg,idx);

     }


   template<typename Float, typename Oprod, typename Gauge, typename Mom>

     void completeKSForceCPU(KSForceArg<Oprod,Gauge,Mom>& arg)

     {

       for(int idx=0; idx<arg.threads; idx++){

         completeKSForceCore<Float,Oprod,Gauge,Mom>(arg,idx);

       }

     }


   template<typename Float, typename Oprod, typename Gauge, typename Mom>

     class KSForceComplete : Tunable {


       KSForceArg<Oprod, Gauge, Mom> arg;

       const GaugeField &meta;

       const QudaFieldLocation location;


       private:

       unsigned int sharedBytesPerThread() const { return 0; }

       unsigned int sharedBytesPerBlock(const TuneParam &param) const { return 0; }


       bool tuneSharedBytes() const { return false; } // Don't tune the shared memory.

       bool tuneGridDim() const { return false; } // Don't tune the grid dimensions.

       unsigned int minThreads() const { return arg.threads; }


       public:

       KSForceComplete(KSForceArg<Oprod,Gauge,Mom> &arg, const GaugeField &meta, QudaFieldLocation location)

         : arg(arg), meta(meta), location(location) {

         writeAuxString("prec=%lu,stride=%d",sizeof(Float),arg.mom.stride);

       }


       virtual ~KSForceComplete() {}


       void apply(const cudaStream_t &stream) {

         if(location == QUDA_CUDA_FIELD_LOCATION){

 #if (__COMPUTE_CAPABILITY__ >= 200)

           // Fix this

           dim3 blockDim(128, 1, 1);

           dim3 gridDim((arg.threads + blockDim.x - 1) / blockDim.x, 1, 1);

           completeKSForceKernel<Float><<<gridDim,blockDim>>>(arg);

 #else

           errorQuda("completeKSForce not supported on pre-Fermi architecture");

 #endif

         }else{

           completeKSForceCPU<Float>(arg);

         }

       }


       TuneKey tuneKey() const { return TuneKey(meta.VolString(), typeid(*this).name(), aux); }


       std::string paramString(const TuneParam &param) const { // Don't print the grid dim.

         std::stringstream ps;

         ps << "block=(" << param.block.x << "," << param.block.y << "," << param.block.z << "), ";

         ps << "shared=" << param.shared_bytes;

         return ps.str();

       }


       long long flops() const { return 792*arg.X[0]*arg.X[1]*arg.X[2]*arg.X[3]; }

       long long bytes() const { return 0; } // Fix this

     };


   template<typename Float, typename Oprod, typename Gauge, typename Mom>

   void completeKSForce(Oprod oprod, Gauge gauge, Mom mom, int dim[4], const GaugeField &meta, QudaFieldLocation location, long long *flops)

     {

       KSForceArg<Oprod,Gauge,Mom> arg(oprod, gauge, mom, dim);

       KSForceComplete<Float,Oprod,Gauge,Mom> completeForce(arg,meta,location);

       completeForce.apply(0);

       if(flops) *flops = completeForce.flops();

       cudaDeviceSynchronize();

     }


   template<typename Float>

     void completeKSForce(GaugeField& mom, const GaugeField& oprod, const GaugeField& gauge, QudaFieldLocation location, long long *flops)

     {


       if(location != QUDA_CUDA_FIELD_LOCATION){

         errorQuda("Only QUDA_CUDA_FIELD_LOCATION currently supported");

       }else{

         if((oprod.Reconstruct() != QUDA_RECONSTRUCT_NO) || (gauge.Reconstruct() != QUDA_RECONSTRUCT_NO) || (mom.Reconstruct() != QUDA_RECONSTRUCT_10)){

           errorQuda("Reconstruct type not supported");

         }else{

           completeKSForce<Float>(FloatNOrder<Float, 18, 2, 18>(oprod),

                                  FloatNOrder<Float, 18, 2, 18>(gauge),

                                  FloatNOrder<Float, 10, 2, 10>(mom),

                                  const_cast<int*>(mom.X()),

                                  gauge, location, flops);

         }

       }

       return;

     }


   void completeKSForce(GaugeField &mom, const GaugeField &oprod, const GaugeField &gauge, QudaFieldLocation location, long long *flops)

   {

     if(mom.Precision() == QUDA_HALF_PRECISION){

       errorQuda("Half precision not supported");

     }


     if(mom.Precision() == QUDA_SINGLE_PRECISION){

       completeKSForce<float>(mom, oprod, gauge, location, flops);

     }else if(mom.Precision() == QUDA_DOUBLE_PRECISION){

       completeKSForce<double>(mom, oprod, gauge, location, flops);

     }else{

       errorQuda("Precision %d not supported", mom.Precision());

     }

     return;

   }


   template<typename Result, typename Oprod, typename Gauge>

     struct KSLongLinkArg {

       int threads;

       int X[4]; // grid dimensions

 #ifdef MULTI_GPU

       int border[4];

 #endif

       double coeff;

       Result res;

       Oprod oprod;

       Gauge gauge;


       KSLongLinkArg(Result& res, Oprod& oprod, Gauge &gauge, int dim[4])

         : coeff(1.0), res(res), oprod(oprod), gauge(gauge){


           threads = 1;

 #ifdef MULTI_GPU

           for(int dir=0; dir<4; ++dir) threads *= (dim[dir]-2);

           for(int dir=0; dir<4; ++dir) X[dir] = dim[dir]-2;

           for(int dir=0; dir<4; ++dir) border[dir] = 2;

 #else

           for(int dir=0; dir<4; ++dir) threads *= dim[dir];

           for(int dir=0; dir<4; ++dir) X[dir] = dim[dir];

 #endif

         }


     };


   template<typename Float, typename Result, typename Oprod, typename Gauge>

     __host__ __device__ void computeKSLongLinkForceCore(KSLongLinkArg<Result,Oprod,Gauge>& arg, int idx){


       /*

          int parity = 0;

          if(idx >= arg.threads/2){

          parity = 1;

          idx -= arg.threads/2;

          }


          int X[4];

          for(int dir=0; dir<4; ++dir) X[dir] = arg.X[dir];


          int x[4];

          getCoords(x, idx, X, parity);

 #ifndef BUILD_TIFR_INTERFACE

 #ifdef MULTI_GPU

 for(int dir=0; dir<4; ++dir){

 x[dir] += arg.border[dir];

 X[dir] += 2*arg.border[dir];

 }

 #endif

 #endif


 typedef typename ComplexTypeId<Float>::Type Cmplx;


 Matrix<Cmplx,3> O;

 Matrix<Cmplx,3> G;

 Matrix<Cmplx,3> M;


 int dx[4] = {0,0,0,0};

 for(int dir=0; dir<4; ++dir){

 arg.gauge.load((Float*)(G.data), linkIndex(x,dx,X), dir, parity);

 arg.oprod.load((Float*)(O.data), linkIndex(x,dx,X), dir, parity);

 if(parity==0){

 M = G*O;

 }else{

 M = -G*O;

 }


 Float sub = getTrace(M).y/(static_cast<Float>(3));

 Float temp[10];


 temp[0] = (M.data[1].x - M.data[3].x)*0.5;

 temp[1] = (M.data[1].y + M.data[3].y)*0.5;


 temp[2] = (M.data[2].x - M.data[6].x)*0.5;

 temp[3] = (M.data[2].y + M.data[6].y)*0.5;


 temp[4] = (M.data[5].x - M.data[7].x)*0.5;

 temp[5] = (M.data[5].y + M.data[7].y)*0.5;


 temp[6] = (M.data[0].y-sub);

 temp[7] = (M.data[4].y-sub);

 temp[8] = (M.data[8].y-sub);

 temp[9] = 0.0;


 arg.mom.save(temp, idx, dir, parity);

 }

        */

     }


   template<typename Float, typename Result, typename Oprod, typename Gauge>

 __global__ void computeKSLongLinkForceKernel(KSLongLinkArg<Result,Oprod,Gauge> arg)

 {

   int idx = threadIdx.x + blockIdx.x*blockDim.x;


   if(idx >= arg.threads) return;

   computeKSLongLinkForceCore<Float,Result,Oprod,Gauge>(arg,idx);

 }


   template<typename Float, typename Result, typename Oprod, typename Gauge>

 void computeKSLongLinkForceCPU(KSLongLinkArg<Result,Oprod,Gauge>& arg)

 {

   for(int idx=0; idx<arg.threads; idx++){

     computeKSLongLinkForceCore<Float,Result,Oprod,Gauge>(arg,idx);

   }

 }


 // should be tunable

 template<typename Float, typename Result, typename Oprod, typename Gauge>

 class KSLongLinkForce : Tunable {


   KSLongLinkArg<Result,Oprod,Gauge> arg;

   const GaugeField &meta;

   const QudaFieldLocation location;


   private:

   unsigned int sharedBytesPerThread() const { return 0; }

   unsigned int sharedBytesPerBlock(const TuneParam &param) const { return 0; }


   bool tuneSharedBytes() const { return false; } // Don't tune the shared memory.

   bool tuneGridDim() const { return false; } // Don't tune the grid dimensions.

   unsigned int minThreads() const { return arg.threads; }


   public:

   KSLongLinkForce(KSLongLinkArg<Result,Oprod,Gauge> &arg, const GaugeField &meta, QudaFieldLocation location)

     : arg(arg), meta(meta), location(location) {

     writeAuxString("prec=%lu,stride=%d",sizeof(Float),arg.res.stride);

   }


   virtual ~KSLongLinkForce() {}


   void apply(const cudaStream_t &stream) {

     if(location == QUDA_CUDA_FIELD_LOCATION){

 #if (__COMPUTE_CAPABILITY__ >= 200)

       // Fix this

       dim3 blockDim(128, 1, 1);

       dim3 gridDim((arg.threads + blockDim.x - 1) / blockDim.x, 1, 1);

       computeKSLongLinkForceKernel<Float><<<gridDim,blockDim>>>(arg);

 #else

       errorQuda("computeKSLongLinkForce not supported on pre-Fermi architecture");

 #endif

     }else{

       computeKSLongLinkForceCPU<Float>(arg);

     }

   }


   TuneKey tuneKey() const { return TuneKey(meta.VolString(), typeid(*this).name(), aux); }


   std::string paramString(const TuneParam &param) const { // Don't print the grid dim.

     std::stringstream ps;

     ps << "block=(" << param.block.x << "," << param.block.y << "," << param.block.z << "), ";

     ps << "shared=" << param.shared_bytes;

     return ps.str();

   }


   void preTune(){}

   void postTune(){}

   long long flops() const { return 0; } // Fix this

   long long bytes() const { return 0; } // Fix this

 };


 template<typename Float, typename Result, typename Oprod, typename Gauge>

 void computeKSLongLinkForce(Result res, Oprod oprod, Gauge gauge, int dim[4], const GaugeField &meta, QudaFieldLocation location)

 {

   KSLongLinkArg<Result,Oprod,Gauge> arg(res, oprod, gauge, dim);

   KSLongLinkForce<Float,Result,Oprod,Gauge> computeLongLink(arg,meta,location);

   computeLongLink.apply(0);

   cudaDeviceSynchronize();

 }


   template<typename Float>

 void computeKSLongLinkForce(GaugeField& result, const GaugeField &oprod, const GaugeField &gauge, QudaFieldLocation location)

 {

   if(location != QUDA_CUDA_FIELD_LOCATION){

     errorQuda("Only QUDA_CUDA_FIELD_LOCATION currently supported");

   }else{

     if((oprod.Reconstruct() != QUDA_RECONSTRUCT_NO) || (gauge.Reconstruct() != QUDA_RECONSTRUCT_NO) ||

         (result.Reconstruct() != QUDA_RECONSTRUCT_10)){


       errorQuda("Reconstruct type not supported");

     }else{

       computeKSLongLinkForce<Float>(FloatNOrder<Float, 18, 2, 18>(result),

                                     FloatNOrder<Float, 18, 2, 18>(oprod),

                                     FloatNOrder<Float, 18, 2, 18>(gauge),

                                     const_cast<int*>(result.X()),

                                     gauge, location);

     }

   }

   return;

 }


 void computeKSLongLinkForce(GaugeField &result, const GaugeField &oprod, const GaugeField &gauge, QudaFieldLocation location)

 {

   if(result.Precision() == QUDA_HALF_PRECISION){

     errorQuda("Half precision not supported");

   }


   if(result.Precision() == QUDA_SINGLE_PRECISION){

     computeKSLongLinkForce<float>(result, oprod, gauge, location);

   }else if(result.Precision() == QUDA_DOUBLE_PRECISION){

     computeKSLongLinkForce<double>(result, oprod, gauge, location);

   }

   errorQuda("Precision %d not supported", result.Precision());

   return;

 }


 } // namespace quda

quda::KSLongLinkArg::coeff
double coeff
Definition: ks_force_quda.cu:252

QUDA_RECONSTRUCT_NO
Definition: enum_quda.h:55

quda::TuneParam
Definition: tune_quda.h:16

QUDA_RECONSTRUCT_10
Definition: enum_quda.h:60

quda::KSForceArg::KSForceArg
KSForceArg(Oprod &oprod, Gauge &gauge, Mom &mom, int dim[4])
Definition: ks_force_quda.cu:24

quda::linkIndex
__device__ __host__ int linkIndex(int x[], int dx[], const int X[4])
Definition: ks_force_quda.cu:40

quda::completeKSForceKernel
__global__ void completeKSForceKernel(KSForceArg< Oprod, Gauge, Mom > arg)
Definition: ks_force_quda.cu:121

quda::KSForceComplete::tuneKey
TuneKey tuneKey() const
Definition: ks_force_quda.cu:180

y
int y[4]
Definition: staggered_dslash_core.h:356

quda::computeKSLongLinkForceKernel
__global__ void computeKSLongLinkForceKernel(KSLongLinkArg< Result, Oprod, Gauge > arg)
Definition: ks_force_quda.cu:340

quda::KSForceComplete::KSForceComplete
KSForceComplete(KSForceArg< Oprod, Gauge, Mom > &arg, const GaugeField &meta, QudaFieldLocation location)
Definition: ks_force_quda.cu:158

errorQuda
#define errorQuda(...)
Definition: util_quda.h:73

quda::LatticeField::X
const int * X() const
Definition: lattice_field.h:162

QUDA_CUDA_FIELD_LOCATION
Definition: enum_quda.h:271

QUDA_HALF_PRECISION
Definition: enum_quda.h:48

quda::completeKSForceCPU
void completeKSForceCPU(KSForceArg< Oprod, Gauge, Mom > &arg)
Definition: ks_force_quda.cu:133

quda::KSForceArg::threads
int threads
Definition: ks_force_quda.cu:13

quda::stream
cudaStream_t * stream
Definition: cuda_color_spinor_field.cu:816

testing::internal::string
::std::string string
Definition: gtest.h:1979

quda::KSForceComplete::flops
long long flops() const
Definition: ks_force_quda.cu:190

quda::KSLongLinkForce::bytes
long long bytes() const
Definition: ks_force_quda.cu:414

quda::completeKSForce
void completeKSForce(GaugeField &mom, const GaugeField &oprod, const GaugeField &gauge, QudaFieldLocation location, long long *flops=NULL)
Definition: ks_force_quda.cu:206

quda::KSForceArg::oprod
Oprod oprod
Definition: ks_force_quda.cu:20

quda::KSLongLinkArg::threads
int threads
Definition: ks_force_quda.cu:247

quda::TuneParam::shared_bytes
int shared_bytes
Definition: tune_quda.h:21

quda::KSForceComplete::apply
void apply(const cudaStream_t &stream)
Definition: ks_force_quda.cu:165

quda::ComplexTypeId
Definition: quda_matrix.h:19

quda::KSLongLinkForce::preTune
void preTune()
Definition: ks_force_quda.cu:411

param
QudaGaugeParam param
Definition: pack_test.cpp:17

quda::KSLongLinkForce::flops
long long flops() const
Definition: ks_force_quda.cu:413

quda::Tunable
Definition: tune_quda.h:40

quda::KSLongLinkArg::res
Result res
Definition: ks_force_quda.cu:253

quda::Tunable::writeAuxString
void writeAuxString(const char *format,...)
Definition: tune_quda.h:138

location
const QudaFieldLocation location
Definition: pack_test.cpp:46

quda::KSLongLinkForce::paramString
std::string paramString(const TuneParam &param) const
Definition: ks_force_quda.cu:403

testing::internal::Float
FloatingPoint< float > Float
Definition: gtest.h:7350

quda::TuneParam::block
dim3 block
Definition: tune_quda.h:19

quda::Matrix::data
T data[N *N]
Definition: quda_matrix.h:351

quda::completeKSForceCore
__host__ __device__ void completeKSForceCore(KSForceArg< Oprod, Gauge, Mom > &arg, int idx)
Definition: ks_force_quda.cu:59

quda::KSForceComplete::~KSForceComplete
virtual ~KSForceComplete()
Definition: ks_force_quda.cu:163

dim
int dim
Definition: tm_ndeg_fused_exterior_dslash_core.h:195

quda::GaugeField::Reconstruct
QudaReconstructType Reconstruct() const
Definition: gauge_field.h:168

quda::FloatNOrder
Definition: clover_field_order.h:56

quda::KSLongLinkForce::KSLongLinkForce
KSLongLinkForce(KSLongLinkArg< Result, Oprod, Gauge > &arg, const GaugeField &meta, QudaFieldLocation location)
Definition: ks_force_quda.cu:379

quda::KSLongLinkArg::X
int X[4]
Definition: ks_force_quda.cu:248

quda::KSForceComplete
Definition: ks_force_quda.cu:143

quda::KSForceComplete::paramString
std::string paramString(const TuneParam &param) const
Definition: ks_force_quda.cu:182

gauge_field_order.h

quda::LatticeField::VolString
const char * VolString() const
Definition: lattice_field.h:199

quda::KSLongLinkForce::postTune
void postTune()
Definition: ks_force_quda.cu:412

quda::KSForceArg::gauge
Gauge gauge
Definition: ks_force_quda.cu:21

x
int x[4]
Definition: hisq_paths_force_core.h:99

tune_quda.h

X
int X
Definition: asym_wilson_clover_dslash_dagger_fermi_core.h:394

dx
int dx[4]
Definition: hisq_paths_force_core.h:98

quda_matrix.h

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:50

quda::KSForceComplete::bytes
long long bytes() const
Definition: ks_force_quda.cu:191

quda::getTrace
__device__ __host__ T getTrace(const Matrix< T, 3 > &a)
Definition: quda_matrix.h:378

QudaFieldLocation
enum QudaFieldLocation_s QudaFieldLocation

quda::KSForceArg::X
int X[4]
Definition: ks_force_quda.cu:14

idx
int idx
Definition: staggered_fused_exterior_dslash_core.h:342

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:49

quda::computeKSLongLinkForceCore
__host__ __device__ void computeKSLongLinkForceCore(KSLongLinkArg< Result, Oprod, Gauge > &arg, int idx)
Definition: ks_force_quda.cu:276

quda::KSLongLinkForce
Definition: ks_force_quda.cu:363

quda::KSForceArg
Definition: ks_force_quda.cu:12

quda::KSLongLinkForce::~KSLongLinkForce
virtual ~KSLongLinkForce()
Definition: ks_force_quda.cu:384

quda::KSLongLinkArg
Definition: ks_force_quda.cu:246

quda::KSLongLinkArg::gauge
Gauge gauge
Definition: ks_force_quda.cu:255

quda::computeKSLongLinkForce
void computeKSLongLinkForce(Result res, Oprod oprod, Gauge gauge, int dim[4], const GaugeField &meta, QudaFieldLocation location)
Definition: ks_force_quda.cu:421

quda::arg
__host__ __device__ ValueType arg(const complex< ValueType > &z)
Returns the phase angle of z.
Definition: complex_quda.h:843

quda::KSForceArg::mom
Mom mom
Definition: ks_force_quda.cu:22

quda::computeKSLongLinkForceCPU
void computeKSLongLinkForceCPU(KSLongLinkArg< Result, Oprod, Gauge > &arg)
Definition: ks_force_quda.cu:352

ks_force_quda.h

quda::KSLongLinkForce::apply
void apply(const cudaStream_t &stream)
Definition: ks_force_quda.cu:386

quda::KSLongLinkArg::KSLongLinkArg
KSLongLinkArg(Result &res, Oprod &oprod, Gauge &gauge, int dim[4])
Definition: ks_force_quda.cu:257

parity
const QudaParity parity
Definition: dslash_test.cpp:29

gauge_field.h

gauge
void * gauge[4]
Definition: su3_test.cpp:15

quda::Matrix
Definition: quda_matrix.h:348

quda::KSLongLinkArg::oprod
Oprod oprod
Definition: ks_force_quda.cu:254

quda::Tunable::aux
char aux[TuneKey::aux_n]
Definition: tune_quda.h:136

quda::TuneKey
Definition: tune_key.h:8

quda::KSLongLinkForce::tuneKey
TuneKey tuneKey() const
Definition: ks_force_quda.cu:401

quda::getCoords
__device__ __host__ void getCoords(int x[4], int cb_index, const int X[4], int parity)
Definition: ks_force_quda.cu:48

quda_internal.h

quda::GaugeField
Definition: gauge_field.h:118