v0.9.0/doc/clover__field_8cpp_source.html

 #include <stdlib.h>
 #include <stdio.h>
 #include <string.h>
 #include <math.h>
 #include <typeinfo>

 #include <quda_internal.h>
 #include <clover_field.h>
 #include <gauge_field.h>
 #include <color_spinor_field.h>
 #include <blas_quda.h>

 namespace quda {

   CloverFieldParam::CloverFieldParam(const CloverField &a)
     : LatticeFieldParam(),
       direct(false),
       inverse(false),
       clover(NULL),
       norm(NULL),
       cloverInv(NULL),
       invNorm(NULL),
       csw(a.Csw()),
       twisted(a.Twisted()),
       mu2(a.Mu2()),
       rho(a.Rho()),
       order(a.Order()),
       create(QUDA_NULL_FIELD_CREATE)
       {
   precision = a.Precision();
   nDim = a.Ndim();
   pad = a.Pad();
   siteSubset = QUDA_FULL_SITE_SUBSET;
   for(int dir=0; dir<nDim; ++dir) x[dir] = a.X()[dir];
       }

   CloverField::CloverField(const CloverFieldParam &param) :
     LatticeField(param), bytes(0), norm_bytes(0), nColor(3), nSpin(4),
     clover(0), norm(0), cloverInv(0), invNorm(0), csw(param.csw), rho(param.rho),
     order(param.order), create(param.create), trlog{0, 0}
   {
     if (nDim != 4) errorQuda("Number of dimensions must be 4, not %d", nDim);

     if (order == QUDA_QDPJIT_CLOVER_ORDER && create != QUDA_REFERENCE_FIELD_CREATE)
       errorQuda("QDPJIT ordered clover fields only supported for reference fields");

     real_length = 2*volumeCB*nColor*nColor*nSpin*nSpin/2;  // block-diagonal Hermitian (72 reals)
     length = 2*stride*nColor*nColor*nSpin*nSpin/2;

     bytes = (size_t)length*precision;
     if (isNative()) bytes = 2*ALIGNMENT_ADJUST(bytes/2);
     if (precision == QUDA_HALF_PRECISION) {
       norm_bytes = sizeof(float)*2*stride*2; // 2 chirality
       if (isNative()) norm_bytes = 2*ALIGNMENT_ADJUST(norm_bytes/2);
     }
 //for twisted mass only:
     twisted = false;//param.twisted;
     mu2 = 0.0; //param.mu2;
   }

   CloverField::~CloverField() { }

   bool CloverField::isNative() const {
     if (precision == QUDA_DOUBLE_PRECISION) {
       if (order  == QUDA_FLOAT2_CLOVER_ORDER) return true;
     } else if (precision == QUDA_SINGLE_PRECISION ||
          precision == QUDA_HALF_PRECISION) {
       if (order == QUDA_FLOAT4_CLOVER_ORDER) return true;
     }
     return false;
   }

   void CloverField::setRho(double rho_)
   {
     rho = rho_;
   }

   cudaCloverField::cudaCloverField(const CloverFieldParam &param) : CloverField(param) {

     if (create != QUDA_NULL_FIELD_CREATE && create != QUDA_REFERENCE_FIELD_CREATE)
       errorQuda("Create type %d not supported", create);

     if (param.direct) {
       if (create != QUDA_REFERENCE_FIELD_CREATE) {
   clover = bytes ? pool_device_malloc(bytes) : nullptr;
   if (precision == QUDA_HALF_PRECISION) norm = norm_bytes ? pool_device_malloc(norm_bytes) : nullptr;
       } else {
   clover = param.clover;
   norm = param.norm;
       }

       even = clover;
       odd = static_cast<char*>(clover) + bytes/2;

       evenNorm = norm;
       oddNorm = static_cast<char*>(norm) + norm_bytes/2;

       total_bytes += bytes + norm_bytes;

       // this is a hack to prevent us allocating a texture object for an unallocated inverse field
       if (!param.inverse) {
   cloverInv = clover;
   evenInv = even;
   oddInv = odd;
   invNorm = norm;
   evenInvNorm = evenNorm;
   oddInvNorm = oddNorm;
       }
     }

     if (param.inverse) {
       if (create != QUDA_REFERENCE_FIELD_CREATE) {
   cloverInv = bytes ? pool_device_malloc(bytes) : nullptr;
   if (precision == QUDA_HALF_PRECISION) invNorm = norm_bytes ? pool_device_malloc(norm_bytes): nullptr;
       } else {
   cloverInv = param.cloverInv;
   invNorm = param.invNorm;
       }

       evenInv = cloverInv;
       oddInv = static_cast<char*>(cloverInv) + bytes/2;

       evenInvNorm = invNorm;
       oddInvNorm = static_cast<char*>(invNorm) + norm_bytes/2;

       total_bytes += bytes + norm_bytes;

       // this is a hack to ensure that we can autotune the clover
       // operator when just using symmetric preconditioning
       if (!param.direct) {
   clover = cloverInv;
   even = evenInv;
   odd = oddInv;
   norm = invNorm;
   evenNorm = evenInvNorm;
   oddNorm = oddInvNorm;
       }
     }

     if (!param.inverse) {
       cloverInv = clover;
       evenInv = even;
       oddInv = odd;
       invNorm = norm;
       evenInvNorm = evenNorm;
       oddInvNorm = oddNorm;
     }

 #ifdef USE_TEXTURE_OBJECTS
     createTexObject(tex, normTex, clover, norm, true);
     createTexObject(invTex, invNormTex, cloverInv, invNorm, true);

     createTexObject(evenTex, evenNormTex, even, evenNorm, false);
     createTexObject(oddTex, oddNormTex, odd, oddNorm, false);

     createTexObject(evenInvTex, evenInvNormTex, evenInv, evenInvNorm, false);
     createTexObject(oddInvTex, oddInvNormTex, oddInv, oddInvNorm, false);
 #endif
     twisted = param.twisted;
     mu2 = param.mu2;

   }

 #ifdef USE_TEXTURE_OBJECTS
   void cudaCloverField::createTexObject(cudaTextureObject_t &tex, cudaTextureObject_t &texNorm,
           void *field, void *norm, bool full) {
     if (isNative()) {
       // create the texture for the field components

       cudaChannelFormatDesc desc;
       memset(&desc, 0, sizeof(cudaChannelFormatDesc));
       if (precision == QUDA_SINGLE_PRECISION) desc.f = cudaChannelFormatKindFloat;
       else desc.f = cudaChannelFormatKindSigned; // half is short, double is int2

       // always four components regardless of precision
       desc.x = (precision == QUDA_DOUBLE_PRECISION) ? 8*sizeof(int) : 8*precision;
       desc.y = (precision == QUDA_DOUBLE_PRECISION) ? 8*sizeof(int) : 8*precision;
       desc.z = (precision == QUDA_DOUBLE_PRECISION) ? 8*sizeof(int) : 8*precision;
       desc.w = (precision == QUDA_DOUBLE_PRECISION) ? 8*sizeof(int) : 8*precision;
       int texel_size = 4 * (precision == QUDA_DOUBLE_PRECISION ? sizeof(int) : precision);

       cudaResourceDesc resDesc;
       memset(&resDesc, 0, sizeof(resDesc));
       resDesc.resType = cudaResourceTypeLinear;
       resDesc.res.linear.devPtr = field;
       resDesc.res.linear.desc = desc;
       resDesc.res.linear.sizeInBytes = bytes/(!full ? 2 : 1);

       unsigned long texels = resDesc.res.linear.sizeInBytes / texel_size;
       if (texels > (unsigned)deviceProp.maxTexture1DLinear) {
   errorQuda("Attempting to bind too large a texture %lu > %d", texels, deviceProp.maxTexture1DLinear);
       }

       cudaTextureDesc texDesc;
       memset(&texDesc, 0, sizeof(texDesc));
       if (precision == QUDA_HALF_PRECISION) texDesc.readMode = cudaReadModeNormalizedFloat;
       else texDesc.readMode = cudaReadModeElementType;

       cudaCreateTextureObject(&tex, &resDesc, &texDesc, NULL);
       checkCudaError();

       // create the texture for the norm components
       if (precision == QUDA_HALF_PRECISION) {
   cudaChannelFormatDesc desc;
   memset(&desc, 0, sizeof(cudaChannelFormatDesc));
   desc.f = cudaChannelFormatKindFloat;
   desc.x = 8*QUDA_SINGLE_PRECISION; desc.y = 0; desc.z = 0; desc.w = 0;

   cudaResourceDesc resDesc;
   memset(&resDesc, 0, sizeof(resDesc));
   resDesc.resType = cudaResourceTypeLinear;
   resDesc.res.linear.devPtr = norm;
   resDesc.res.linear.desc = desc;
   resDesc.res.linear.sizeInBytes = norm_bytes/(!full ? 2 : 1);

   cudaTextureDesc texDesc;
   memset(&texDesc, 0, sizeof(texDesc));
   texDesc.readMode = cudaReadModeElementType;

   cudaCreateTextureObject(&texNorm, &resDesc, &texDesc, NULL);
   checkCudaError();
       }
     }

   }

   void cudaCloverField::destroyTexObject() {
     if (isNative()) {
       cudaDestroyTextureObject(tex);
       cudaDestroyTextureObject(invTex);
       cudaDestroyTextureObject(evenTex);
       cudaDestroyTextureObject(oddTex);
       cudaDestroyTextureObject(evenInvTex);
       cudaDestroyTextureObject(oddInvTex);
       if (precision == QUDA_HALF_PRECISION) {
   cudaDestroyTextureObject(normTex);
   cudaDestroyTextureObject(invNormTex);
   cudaDestroyTextureObject(evenNormTex);
   cudaDestroyTextureObject(oddNormTex);
   cudaDestroyTextureObject(evenInvNormTex);
   cudaDestroyTextureObject(oddInvNormTex);
       }
       checkCudaError();
     }
   }
 #endif

   cudaCloverField::~cudaCloverField()
   {
 #ifdef USE_TEXTURE_OBJECTS
     destroyTexObject();
 #endif

     if (create != QUDA_REFERENCE_FIELD_CREATE) {
       if (clover != cloverInv) {
   if (clover) pool_device_free(clover);
   if (norm) pool_device_free(norm);
       }
       if (cloverInv) pool_device_free(cloverInv);
       if (invNorm) pool_device_free(invNorm);
     }

     checkCudaError();
   }

   void cudaCloverField::copy(const CloverField &src, bool inverse) {

     checkField(src);

     if (typeid(src) == typeid(cudaCloverField)) {
       if (src.V(false)) copyGenericClover(*this, src, false, QUDA_CUDA_FIELD_LOCATION);
       if (src.V(true)) copyGenericClover(*this, src, true, QUDA_CUDA_FIELD_LOCATION);
     } else if (reorder_location() == QUDA_CPU_FIELD_LOCATION && typeid(src) == typeid(cpuCloverField)) {
       void *packClover = pool_pinned_malloc(bytes + norm_bytes);
       void *packCloverNorm = (precision == QUDA_HALF_PRECISION) ? static_cast<char*>(packClover) + bytes : 0;

       if (src.V(false)) {
   copyGenericClover(*this, src, false, QUDA_CPU_FIELD_LOCATION, packClover, 0, packCloverNorm, 0);
   qudaMemcpy(clover, packClover, bytes, cudaMemcpyHostToDevice);
   if (precision == QUDA_HALF_PRECISION)
     qudaMemcpy(norm, packCloverNorm, norm_bytes, cudaMemcpyHostToDevice);
       }

       if (src.V(true) && inverse) {
   copyGenericClover(*this, src, true, QUDA_CPU_FIELD_LOCATION, packClover, 0, packCloverNorm, 0);
   qudaMemcpy(cloverInv, packClover, bytes, cudaMemcpyHostToDevice);
   if (precision == QUDA_HALF_PRECISION)
     qudaMemcpy(invNorm, packCloverNorm, norm_bytes, cudaMemcpyHostToDevice);
       }

       pool_pinned_free(packClover);
     } else if (reorder_location() == QUDA_CUDA_FIELD_LOCATION && typeid(src) == typeid(cpuCloverField)) {
       void *packClover = pool_device_malloc(src.Bytes() + src.NormBytes());
       void *packCloverNorm = (precision == QUDA_HALF_PRECISION) ? static_cast<char*>(packClover) + src.Bytes() : 0;

       if (src.V(false)) {
   qudaMemcpy(packClover, src.V(false), src.Bytes(), cudaMemcpyHostToDevice);
   if (precision == QUDA_HALF_PRECISION)
     qudaMemcpy(packCloverNorm, src.Norm(false), src.NormBytes(), cudaMemcpyHostToDevice);

   copyGenericClover(*this, src, false, QUDA_CUDA_FIELD_LOCATION, 0, packClover, 0, packCloverNorm);
       }

       if (src.V(true) && inverse) {
   qudaMemcpy(packClover, src.V(true), src.Bytes(), cudaMemcpyHostToDevice);
   if (precision == QUDA_HALF_PRECISION)
     qudaMemcpy(packCloverNorm, src.Norm(true), src.NormBytes(), cudaMemcpyHostToDevice);

   copyGenericClover(*this, src, true, QUDA_CUDA_FIELD_LOCATION, 0, packClover, 0, packCloverNorm);
       }

       pool_device_free(packClover);
     } else {
       errorQuda("Invalid clover field type");
     }

     checkCudaError();
   }

   void cudaCloverField::loadCPUField(const cpuCloverField &cpu) { copy(cpu); }

   void cudaCloverField::saveCPUField(cpuCloverField &cpu) const {
     checkField(cpu);

     // we know we are copying from GPU to CPU here, so for now just
     // assume that reordering is on CPU
     void *packClover = pool_pinned_malloc(bytes + norm_bytes);
     void *packCloverNorm = (precision == QUDA_HALF_PRECISION) ? static_cast<char*>(packClover) + bytes : 0;

     // first copy over the direct part (if it exists)
     if (V(false) && cpu.V(false)) {
       qudaMemcpy(packClover, clover, bytes, cudaMemcpyDeviceToHost);
       if (precision == QUDA_HALF_PRECISION)
   qudaMemcpy(packCloverNorm, norm, norm_bytes, cudaMemcpyDeviceToHost);
       copyGenericClover(cpu, *this, false, QUDA_CPU_FIELD_LOCATION, 0, packClover, 0, packCloverNorm);
     } else if((V(false) && !cpu.V(false)) || (!V(false) && cpu.V(false))) {
       errorQuda("Mismatch between Clover field GPU V(false) and CPU.V(false)");
     }

     // now copy the inverse part (if it exists)
     if (V(true) && cpu.V(true)) {
       qudaMemcpy(packClover, cloverInv, bytes, cudaMemcpyDeviceToHost);
   if (precision == QUDA_HALF_PRECISION)
     qudaMemcpy(packCloverNorm, invNorm, norm_bytes, cudaMemcpyDeviceToHost);
       copyGenericClover(cpu, *this, true, QUDA_CPU_FIELD_LOCATION, 0, packClover, 0, packCloverNorm);
     } else if ((V(true) && !cpu.V(true)) || (!V(true) && cpu.V(true))) {
       errorQuda("Mismatch between Clover field GPU V(true) and CPU.V(true)");
     }

     pool_pinned_free(packClover);
   }

   void cudaCloverField::compute(const cudaGaugeField &gauge) {

     if (gauge.Precision() != precision)
       errorQuda("Gauge and clover precisions must match");

     computeClover(*this, gauge, 1.0, QUDA_CUDA_FIELD_LOCATION);

   }

   cpuCloverField::cpuCloverField(const CloverFieldParam &param) : CloverField(param) {

     if (create == QUDA_NULL_FIELD_CREATE || create == QUDA_ZERO_FIELD_CREATE) {
       if(order != QUDA_PACKED_CLOVER_ORDER) {errorQuda("cpuCloverField only supports QUDA_PACKED_CLOVER_ORDER");}
       clover = (void *) safe_malloc(bytes);
       if (precision == QUDA_HALF_PRECISION) norm = (void *) safe_malloc(norm_bytes);
       if(param.inverse) {
   cloverInv = (void *) safe_malloc(bytes);
   if (precision == QUDA_HALF_PRECISION) invNorm = (void *) safe_malloc(norm_bytes);
       }

       if(create == QUDA_ZERO_FIELD_CREATE) {
   memset(clover, '\0', bytes);
   if(param.inverse) memset(cloverInv, '\0', bytes);
   if(precision == QUDA_HALF_PRECISION) memset(norm, '\0', norm_bytes);
   if(param.inverse && precision ==QUDA_HALF_PRECISION) memset(invNorm, '\0', norm_bytes);
       }
     } else if (create == QUDA_REFERENCE_FIELD_CREATE) {
       clover = param.clover;
       norm = param.norm;
       cloverInv = param.cloverInv;
       invNorm = param.invNorm;
     } else {
       errorQuda("Create type %d not supported", create);
     }

     if (param.pad != 0) errorQuda("%s pad must be zero", __func__);
   }

   cpuCloverField::~cpuCloverField() {
     if (create != QUDA_REFERENCE_FIELD_CREATE) {
       if (clover) host_free(clover);
       if (norm) host_free(norm);
       if (cloverInv) host_free(cloverInv);
       if (invNorm) host_free(invNorm);
     }
   }

   // This doesn't really live here, but is fine for the moment
   std::ostream& operator<<(std::ostream& output, const CloverFieldParam& param)
   {
     output << static_cast<const LatticeFieldParam&>(param);
     output << "direct = "    << param.direct << std::endl;
     output << "inverse = "   << param.inverse << std::endl;
     output << "clover = "    << param.clover << std::endl;
     output << "norm = "      << param.norm << std::endl;
     output << "cloverInv = " << param.cloverInv << std::endl;
     output << "invNorm = "   << param.invNorm << std::endl;
     output << "csw = "       << param.csw << std::endl;
     output << "twisted = "   << param.twisted << std::endl;
     output << "mu2 = "       << param.mu2 << std::endl;
     output << "rho = "       << param.rho << std::endl;
     output << "order = "     << param.order << std::endl;
     output << "create = "    << param.create << std::endl;
     return output;  // for multiple << operators.
   }

   ColorSpinorParam colorSpinorParam(const CloverField &a, bool inverse) {

     if (a.Precision() == QUDA_HALF_PRECISION)
       errorQuda("Casting a CloverField into ColorSpinorField not possible in half precision");

     ColorSpinorParam spinor_param;
     // 72 = 9 * 4 * 2
     spinor_param.nColor = 9;
     spinor_param.nSpin = 4;
     spinor_param.nDim = a.Ndim();
     for (int d=0; d<a.Ndim(); d++) spinor_param.x[d] = a.X()[d];
     spinor_param.precision = a.Precision();
     spinor_param.pad = a.Pad();
     spinor_param.siteSubset = QUDA_FULL_SITE_SUBSET;
     spinor_param.siteOrder = QUDA_EVEN_ODD_SITE_ORDER;
     spinor_param.fieldOrder = a.Precision() == QUDA_DOUBLE_PRECISION ?
       QUDA_FLOAT2_FIELD_ORDER : QUDA_FLOAT4_FIELD_ORDER;
     spinor_param.gammaBasis = QUDA_UKQCD_GAMMA_BASIS;
     spinor_param.create = QUDA_REFERENCE_FIELD_CREATE;
     spinor_param.v = (void*)a.V(inverse);
     spinor_param.location = a.Location();
     return spinor_param;
   }

   // Return the L2 norm squared of the clover field
   double norm2(const CloverField &a, bool inverse) {
     ColorSpinorField *b = ColorSpinorField::Create(colorSpinorParam(a, inverse));
     double nrm2 = blas::norm2(*b);
     delete b;
     return nrm2;
   }

   // Return the L1 norm of the clover field
   double norm1(const CloverField &a, bool inverse) {
     ColorSpinorField *b = ColorSpinorField::Create(colorSpinorParam(a, inverse));
     double nrm1 = blas::norm1(*b);
     delete b;
     return nrm1;
   }

 } // namespace quda
quda::CloverField::~CloverField
virtual ~CloverField()
Definition: clover_field.cpp:61

quda::CloverField::norm_bytes
size_t norm_bytes
Definition: clover_field.h:48

quda::cudaCloverField::even
void * even
Definition: clover_field.h:135

quda::CloverField::setRho
void setRho(double rho)
Bakes in the rho factor into the clover field, (for real diagonal additive Hasenbusch), e.g., A + rho.
Definition: clover_field.cpp:73

qudaMemcpy
#define qudaMemcpy(dst, src, count, kind)
Definition: quda_cuda_api.h:32

quda::reorder_location
QudaFieldLocation reorder_location()
Return whether data is reordered on the CPU or GPU. This can set at QUDA initialization using the env...
Definition: lattice_field.cpp:585

quda::CloverFieldParam::CloverFieldParam
CloverFieldParam()
Definition: clover_field.h:29

quda::CloverField::clover
void * clover
Definition: clover_field.h:54

QUDA_PACKED_CLOVER_ORDER
Definition: enum_quda.h:228

quda::cudaCloverField::cudaCloverField
cudaCloverField(const CloverFieldParam &param)
Definition: clover_field.cpp:78

pool_pinned_free
#define pool_pinned_free(ptr)
Definition: malloc_quda.h:116

quda::ColorSpinorField
Definition: color_spinor_field.h:271

quda::CloverField::cloverInv
void * cloverInv
Definition: clover_field.h:56

deviceProp
cudaDeviceProp deviceProp
Definition: interface_quda.cpp:152

quda::CloverField::V
void * V(bool inverse=false)
Definition: clover_field.h:73

quda::cudaCloverField::odd
void * odd
Definition: clover_field.h:135

quda::norm
__host__ __device__ ValueType norm(const complex< ValueType > &z)
Returns the magnitude of z squared.
Definition: complex_quda.h:896

quda::LatticeField::total_bytes
size_t total_bytes
Definition: lattice_field.h:134

quda::ColorSpinorParam::nColor
int nColor
Definition: color_spinor_field.h:85

dslash_cuda_gen.twisted
def twisted()
Definition: dslash_cuda_gen.py:922

src
const void * src
Definition: CMakeCUDACompilerId.cpp1.ii:2290

quda::LatticeFieldParam
Definition: lattice_field.h:44

quda::CloverField::bytes
size_t bytes
Definition: clover_field.h:47

errorQuda
#define errorQuda(...)
Definition: util_quda.h:90

quda::blas::norm2
double norm2(const ColorSpinorField &a)
Definition: reduce_quda.cu:241

quda::CloverField::norm
void * norm
Definition: clover_field.h:55

color_spinor_field.h

quda::cudaCloverField::oddInv
void * oddInv
Definition: clover_field.h:138

QUDA_CUDA_FIELD_LOCATION
Definition: enum_quda.h:297

quda::cudaCloverField::saveCPUField
void saveCPUField(cpuCloverField &cpu) const
Definition: clover_field.cpp:322

host_free
#define host_free(ptr)
Definition: malloc_quda.h:59

QUDA_HALF_PRECISION
Definition: enum_quda.h:59

quda::cudaCloverField::loadCPUField
void loadCPUField(const cpuCloverField &cpu)
Definition: clover_field.cpp:320

quda::cudaCloverField::oddNorm
void * oddNorm
Definition: clover_field.h:136

quda::CloverField
Definition: clover_field.h:44

quda::CloverField::invNorm
void * invNorm
Definition: clover_field.h:57

QUDA_FULL_SITE_SUBSET
Definition: enum_quda.h:304

quda::cpuCloverField::~cpuCloverField
virtual ~cpuCloverField()
Definition: clover_field.cpp:394

quda::ColorSpinorField::Create
static ColorSpinorField * Create(const ColorSpinorParam &param)
Definition: color_spinor_field.cpp:748

QUDA_NULL_FIELD_CREATE
Definition: enum_quda.h:330

quda::LatticeFieldParam::precision
QudaPrecision precision
Definition: lattice_field.h:54

quda::CloverField::order
QudaCloverFieldOrder order
Definition: clover_field.h:64

quda::CloverField::CloverField
CloverField(const CloverFieldParam &param)
Definition: clover_field.cpp:37

QUDA_UKQCD_GAMMA_BASIS
Definition: enum_quda.h:339

quda
Definition: blas_cublas.h:6

quda::LatticeFieldParam::siteSubset
QudaSiteSubset siteSubset
Definition: lattice_field.h:55

quda::CloverField::create
QudaFieldCreate create
Definition: clover_field.h:65

quda::operator<<
std::ostream & operator<<(std::ostream &output, const CloverFieldParam &param)
Definition: clover_field.cpp:404

quda::norm2
double norm2(const CloverField &a, bool inverse=false)
Definition: clover_field.cpp:447

QUDA_REFERENCE_FIELD_CREATE
Definition: enum_quda.h:333

param
QudaGaugeParam param
Definition: pack_test.cpp:17

b
#define b
Definition: dw_dslash4_core.h:83

QUDA_QDPJIT_CLOVER_ORDER
Definition: enum_quda.h:229

quda::LatticeFieldParam::x
int x[QUDA_MAX_DIM]
Definition: lattice_field.h:50

quda::norm1
double norm1(const CloverField &u, bool inverse=false)
Definition: clover_field.cpp:455

QUDA_FLOAT2_CLOVER_ORDER
Definition: enum_quda.h:226

dslash_cuda_gen.clover
bool clover
Definition: dslash_cuda_gen.py:1224

quda::cudaCloverField
Definition: clover_field.h:132

QUDA_EVEN_ODD_SITE_ORDER
Definition: enum_quda.h:311

quda::cudaCloverField::evenNorm
void * evenNorm
Definition: clover_field.h:136

quda::ColorSpinorParam::location
QudaFieldLocation location
Definition: color_spinor_field.h:83

quda::CloverFieldParam
Definition: clover_field.h:9

quda::LatticeField::checkField
void checkField(const LatticeField &a) const
Definition: lattice_field.cpp:493

quda::ColorSpinorParam::fieldOrder
QudaFieldOrder fieldOrder
Definition: color_spinor_field.h:92

nColor
const int nColor
Definition: covdev_test.cpp:77

ALIGNMENT_ADJUST
#define ALIGNMENT_ADJUST(n)
Definition: quda_internal.h:32

quda::cudaCloverField::compute
void compute(const cudaGaugeField &gauge)
Definition: clover_field.cpp:356

quda::LatticeField
Definition: lattice_field.h:122

quda::ColorSpinorParam::gammaBasis
QudaGammaBasis gammaBasis
Definition: color_spinor_field.h:93

pool_device_malloc
#define pool_device_malloc(size)
Definition: malloc_quda.h:113

quda::cudaGaugeField
Definition: gauge_field.h:298

QUDA_FLOAT2_FIELD_ORDER
Definition: enum_quda.h:319

QUDA_FLOAT4_CLOVER_ORDER
Definition: enum_quda.h:227

quda::CloverField::twisted
bool twisted
Definition: clover_field.h:60

quda::CloverField::mu2
double mu2
Definition: clover_field.h:61

size_t
long unsigned int size_t
Definition: CMakeCUDACompilerId.cpp1.ii:409

quda::cpuCloverField::cpuCloverField
cpuCloverField(const CloverFieldParam &param)
Definition: clover_field.cpp:365

clover_field.h

quda::CloverField::isNative
bool isNative() const
Definition: clover_field.cpp:63

safe_malloc
#define safe_malloc(size)
Definition: malloc_quda.h:54

quda::cudaCloverField::copy
void copy(const CloverField &src, bool inverse=true)
Copy into this CloverField from the generic CloverField src.
Definition: clover_field.cpp:266

quda::LatticeFieldParam::nDim
int nDim
Definition: lattice_field.h:47

quda::cudaCloverField::evenInv
void * evenInv
Definition: clover_field.h:138

blas_quda.h

memset
void * memset(void *__b, int __c, size_t __len)

pool_pinned_malloc
#define pool_pinned_malloc(size)
Definition: malloc_quda.h:115

quda::cudaCloverField::oddInvNorm
void * oddInvNorm
Definition: clover_field.h:139

quda::ColorSpinorParam
Definition: color_spinor_field.h:80

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:61

quda::blas::norm1
double norm1(const ColorSpinorField &b)
Definition: reduce_quda.cu:200

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:60

quda::ColorSpinorParam::nSpin
int nSpin
Definition: color_spinor_field.h:86

int
int
Definition: CMakeCUDACompilerId.cpp1.ii:3962

quda::cpuCloverField
Definition: clover_field.h:208

tex
static __inline__ dim3 dim3 void size_t cudaStream_t int enum cudaTextureReadMode readMode static __inline__ const struct texture< T, dim, readMode > & tex
Definition: CMakeCUDACompilerId.cpp1.ii:15874

quda::ColorSpinorParam::siteOrder
QudaSiteOrder siteOrder
Definition: color_spinor_field.h:90

quda::colorSpinorParam
ColorSpinorParam colorSpinorParam(const CloverField &a, bool inverse)
Definition: clover_field.cpp:422

quda::cudaCloverField::~cudaCloverField
virtual ~cudaCloverField()
Definition: clover_field.cpp:248

length
void size_t length
Definition: CMakeCUDACompilerId.cpp1.ii:2433

quda::ColorSpinorParam::v
void * v
Definition: color_spinor_field.h:98

quda::cudaCloverField::evenInvNorm
void * evenInvNorm
Definition: clover_field.h:139

pool_device_free
#define pool_device_free(ptr)
Definition: malloc_quda.h:114

checkCudaError
#define checkCudaError()
Definition: util_quda.h:129

desc
const struct cudaChannelFormatDesc * desc
Definition: CMakeCUDACompilerId.cpp1.ii:2509

QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:331

float
float
Definition: CMakeCUDACompilerId.cpp1.ii:12791

QUDA_FLOAT4_FIELD_ORDER
Definition: enum_quda.h:320

quda::ColorSpinorParam::create
QudaFieldCreate create
Definition: color_spinor_field.h:94

d
static __inline__ size_t size_t d
Definition: CMakeCUDACompilerId.cpp1.ii:3019

quda::LatticeField::Precision
QudaPrecision Precision() const
Definition: lattice_field.h:462

quda::computeClover
void computeClover(CloverField &clover, const GaugeField &gauge, double coeff, QudaFieldLocation location)
Definition: clover_quda.cu:204

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:296

quda::LatticeField::precision
QudaPrecision precision
Definition: lattice_field.h:149

a
#define a
Definition: dw_dslash4_core.h:82

gauge_field.h

quda::blas::bytes
unsigned long long bytes
Definition: blas_quda.cu:43

quda::CloverField::rho
double rho
Definition: clover_field.h:62

quda::copyGenericClover
void copyGenericClover(CloverField &out, const CloverField &in, bool inverse, QudaFieldLocation location, void *Out=0, void *In=0, void *outNorm=0, void *inNorm=0)
This generic function is used for copying the clover field where in the input and output can be in an...
Definition: copy_clover.cu:175

quda_internal.h

quda::LatticeFieldParam::pad
int pad
Definition: lattice_field.h:52