quda-ref/v1.1.0/matrix__field_8h_source.html

 #pragma once


 // trove requires the warp shuffle instructions introduced with Kepler

 #if __COMPUTE_CAPABILITY__ >= 300

 #include <trove/ptr.h>

 #else

 #define DISABLE_TROVE

 #endif


 #include <quda_matrix.h>


 namespace quda

 {


   template <typename T, int n> struct matrix_field {

     T *field;

     int volume_cb;


     matrix_field(T *field, int volume_cb) : field(field), volume_cb(volume_cb) {}


     __device__ __host__ inline void load(Matrix<T, n> &A, int x_cb, int parity) const

     {

       int idx = parity * volume_cb + x_cb;

 #ifdef __CUDA_ARCH__

       const trove::coalesced_ptr<Matrix<T, n>> field_((Matrix<T, n> *)field);

       A = field_[idx];

 #else

 #pragma unroll

       for (int i = 0; i < n; i++)

 #pragma unroll

         for (int j = 0; j < n; j++) A(i, j) = field[(n * idx + i) * n + j] = A(i, j);

 #endif

     }


     __device__ __host__ inline void save(const Matrix<T, n> &A, int x_cb, int parity)

     {

       int idx = parity * volume_cb + x_cb;

 #ifdef __CUDA_ARCH__

       trove::coalesced_ptr<Matrix<T, n>> field_((Matrix<T, n> *)field);

       field_[idx] = A;

 #else

 #pragma unroll

       for (int i = 0; i < n; i++)

 #pragma unroll

         for (int j = 0; j < n; j++) field[(n * idx + i) * n + j] = A(i, j);

 #endif

     }

   };


 } // namespace quda

quda::Matrix
Definition: quda_matrix.h:63

parity
QudaParity parity
Definition: covdev_test.cpp:40

quda
Definition: blas_lapack.h:24

ptr.h

quda_matrix.h

quda::matrix_field
Definition: matrix_field.h:21

quda::matrix_field::field
T * field
Definition: matrix_field.h:22

quda::matrix_field::save
__device__ __host__ void save(const Matrix< T, n > &A, int x_cb, int parity)
Definition: matrix_field.h:41

quda::matrix_field::matrix_field
matrix_field(T *field, int volume_cb)
Definition: matrix_field.h:25

quda::matrix_field::volume_cb
int volume_cb
Definition: matrix_field.h:23

quda::matrix_field::load
__device__ __host__ void load(Matrix< T, n > &A, int x_cb, int parity) const
Definition: matrix_field.h:27

trove::coalesced_ptr
Definition: ptr.h:61