quda-ref/v1.0.0/clover__field_8cpp_source.html

 #include <stdlib.h>
 #include <stdio.h>
 #include <string.h>
 #include <math.h>
 #include <typeinfo>

 #include <quda_internal.h>
 #include <clover_field.h>
 #include <gauge_field.h>
 #include <color_spinor_field.h>
 #include <blas_quda.h>

 namespace quda {

   CloverFieldParam::CloverFieldParam(const CloverField &a) :
       LatticeFieldParam(a),
       direct(false),
       inverse(false),
       clover(NULL),
       norm(NULL),
       cloverInv(NULL),
       invNorm(NULL),
       csw(a.Csw()),
       twisted(a.Twisted()),
       mu2(a.Mu2()),
       rho(a.Rho()),
       order(a.Order()),
       create(QUDA_NULL_FIELD_CREATE)
   {
     precision = a.Precision();
     nDim = a.Ndim();
     pad = a.Pad();
     siteSubset = QUDA_FULL_SITE_SUBSET;
     for (int dir = 0; dir < nDim; ++dir) x[dir] = a.X()[dir];
   }

   CloverField::CloverField(const CloverFieldParam &param) :
     LatticeField(param), bytes(0), norm_bytes(0), nColor(3), nSpin(4),
     clover(0), norm(0), cloverInv(0), invNorm(0), csw(param.csw), rho(param.rho),
     order(param.order), create(param.create), trlog{0, 0}
   {
     if (nDim != 4) errorQuda("Number of dimensions must be 4, not %d", nDim);

     if (order == QUDA_QDPJIT_CLOVER_ORDER && create != QUDA_REFERENCE_FIELD_CREATE)
       errorQuda("QDPJIT ordered clover fields only supported for reference fields");

     real_length = 2 * ((size_t)volumeCB) * nColor * nColor * nSpin * nSpin / 2; // block-diagonal Hermitian (72 reals)
     length = 2 * ((size_t)stride) * nColor * nColor * nSpin * nSpin / 2;

     bytes = length * precision;
     if (isNative()) bytes = 2*ALIGNMENT_ADJUST(bytes/2);
     if (precision == QUDA_HALF_PRECISION || precision == QUDA_QUARTER_PRECISION) {
       norm_bytes = sizeof(float)*2*stride*2; // 2 chirality
       if (isNative()) norm_bytes = 2*ALIGNMENT_ADJUST(norm_bytes/2);
     }
 //for twisted mass only:
     twisted = false;//param.twisted;
     mu2 = 0.0; //param.mu2;
   }

   CloverField::~CloverField() { }

   bool CloverField::isNative() const {
     if (precision == QUDA_DOUBLE_PRECISION) {
       if (order  == QUDA_FLOAT2_CLOVER_ORDER) return true;
     } else if (precision == QUDA_SINGLE_PRECISION || precision == QUDA_HALF_PRECISION
         || precision == QUDA_QUARTER_PRECISION) {
       if (order == QUDA_FLOAT4_CLOVER_ORDER) return true;
     }
     return false;
   }

   void CloverField::setRho(double rho_)
   {
     rho = rho_;
   }

   cudaCloverField::cudaCloverField(const CloverFieldParam &param) : CloverField(param) {

     if (create != QUDA_NULL_FIELD_CREATE && create != QUDA_REFERENCE_FIELD_CREATE)
       errorQuda("Create type %d not supported", create);

     if (param.direct) {
       if (create != QUDA_REFERENCE_FIELD_CREATE) {
   clover = bytes ? pool_device_malloc(bytes) : nullptr;
         if (precision == QUDA_HALF_PRECISION || precision == QUDA_QUARTER_PRECISION)
           norm = norm_bytes ? pool_device_malloc(norm_bytes) : nullptr;
       } else {
   clover = param.clover;
   norm = param.norm;
       }

       even = clover;
       odd = static_cast<char*>(clover) + bytes/2;

       evenNorm = norm;
       oddNorm = static_cast<char*>(norm) + norm_bytes/2;

       total_bytes += bytes + norm_bytes;

       // this is a hack to prevent us allocating a texture object for an unallocated inverse field
       if (!param.inverse) {
   cloverInv = clover;
   evenInv = even;
   oddInv = odd;
   invNorm = norm;
   evenInvNorm = evenNorm;
   oddInvNorm = oddNorm;
       }
     }

     if (param.inverse) {
       if (create != QUDA_REFERENCE_FIELD_CREATE) {
   cloverInv = bytes ? pool_device_malloc(bytes) : nullptr;
         if (precision == QUDA_HALF_PRECISION || precision == QUDA_QUARTER_PRECISION)
           invNorm = norm_bytes ? pool_device_malloc(norm_bytes) : nullptr;
       } else {
   cloverInv = param.cloverInv;
   invNorm = param.invNorm;
       }

       evenInv = cloverInv;
       oddInv = static_cast<char*>(cloverInv) + bytes/2;

       evenInvNorm = invNorm;
       oddInvNorm = static_cast<char*>(invNorm) + norm_bytes/2;

       total_bytes += bytes + norm_bytes;

       // this is a hack to ensure that we can autotune the clover
       // operator when just using symmetric preconditioning
       if (!param.direct) {
   clover = cloverInv;
   even = evenInv;
   odd = oddInv;
   norm = invNorm;
   evenNorm = evenInvNorm;
   oddNorm = oddInvNorm;
       }
     }

     if (!param.inverse) {
       cloverInv = clover;
       evenInv = even;
       oddInv = odd;
       invNorm = norm;
       evenInvNorm = evenNorm;
       oddInvNorm = oddNorm;
     }

 #ifdef USE_TEXTURE_OBJECTS
     createTexObject(tex, normTex, clover, norm, true);
     createTexObject(invTex, invNormTex, cloverInv, invNorm, true);

     createTexObject(evenTex, evenNormTex, even, evenNorm, false);
     createTexObject(oddTex, oddNormTex, odd, oddNorm, false);

     createTexObject(evenInvTex, evenInvNormTex, evenInv, evenInvNorm, false);
     createTexObject(oddInvTex, oddInvNormTex, oddInv, oddInvNorm, false);
 #endif
     twisted = param.twisted;
     mu2 = param.mu2;

   }

 #ifdef USE_TEXTURE_OBJECTS
   void cudaCloverField::createTexObject(cudaTextureObject_t &tex, cudaTextureObject_t &texNorm,
           void *field, void *norm, bool full) {
     if (isNative()) {
       // create the texture for the field components

       cudaChannelFormatDesc desc;
       memset(&desc, 0, sizeof(cudaChannelFormatDesc));
       if (precision == QUDA_SINGLE_PRECISION) desc.f = cudaChannelFormatKindFloat;
       else desc.f = cudaChannelFormatKindSigned; // half is short, double is int2

       // always four components regardless of precision
       desc.x = (precision == QUDA_DOUBLE_PRECISION) ? 8*sizeof(int) : 8*precision;
       desc.y = (precision == QUDA_DOUBLE_PRECISION) ? 8*sizeof(int) : 8*precision;
       desc.z = (precision == QUDA_DOUBLE_PRECISION) ? 8*sizeof(int) : 8*precision;
       desc.w = (precision == QUDA_DOUBLE_PRECISION) ? 8*sizeof(int) : 8*precision;
       int texel_size = 4 * (precision == QUDA_DOUBLE_PRECISION ? sizeof(int) : precision);

       cudaResourceDesc resDesc;
       memset(&resDesc, 0, sizeof(resDesc));
       resDesc.resType = cudaResourceTypeLinear;
       resDesc.res.linear.devPtr = field;
       resDesc.res.linear.desc = desc;
       resDesc.res.linear.sizeInBytes = bytes/(!full ? 2 : 1);

       if (resDesc.res.linear.sizeInBytes % deviceProp.textureAlignment != 0
           || !is_aligned(resDesc.res.linear.devPtr, deviceProp.textureAlignment)) {
         errorQuda("Allocation size %lu does not have correct alignment for textures (%lu)",
                   resDesc.res.linear.sizeInBytes, deviceProp.textureAlignment);
       }

       unsigned long texels = resDesc.res.linear.sizeInBytes / texel_size;
       if (texels > (unsigned)deviceProp.maxTexture1DLinear) {
   errorQuda("Attempting to bind too large a texture %lu > %d", texels, deviceProp.maxTexture1DLinear);
       }

       cudaTextureDesc texDesc;
       memset(&texDesc, 0, sizeof(texDesc));
       if (precision == QUDA_HALF_PRECISION || precision == QUDA_QUARTER_PRECISION)
         texDesc.readMode = cudaReadModeNormalizedFloat;
       else
         texDesc.readMode = cudaReadModeElementType;

       cudaCreateTextureObject(&tex, &resDesc, &texDesc, NULL);
       checkCudaError();

       // create the texture for the norm components
       if (precision == QUDA_HALF_PRECISION || precision == QUDA_QUARTER_PRECISION) {
         cudaChannelFormatDesc desc;
   memset(&desc, 0, sizeof(cudaChannelFormatDesc));
   desc.f = cudaChannelFormatKindFloat;
   desc.x = 8*QUDA_SINGLE_PRECISION; desc.y = 0; desc.z = 0; desc.w = 0;

   cudaResourceDesc resDesc;
   memset(&resDesc, 0, sizeof(resDesc));
   resDesc.resType = cudaResourceTypeLinear;
   resDesc.res.linear.devPtr = norm;
   resDesc.res.linear.desc = desc;
   resDesc.res.linear.sizeInBytes = norm_bytes/(!full ? 2 : 1);

         if (!is_aligned(resDesc.res.linear.devPtr, deviceProp.textureAlignment)) {
           errorQuda("Allocation size %lu does not have correct alignment for textures (%lu)",
                     resDesc.res.linear.sizeInBytes, deviceProp.textureAlignment);
         }

         cudaTextureDesc texDesc;
         memset(&texDesc, 0, sizeof(texDesc));
         texDesc.readMode = cudaReadModeElementType;

         cudaCreateTextureObject(&texNorm, &resDesc, &texDesc, NULL);
   checkCudaError();
       }
     }

   }

   void cudaCloverField::destroyTexObject() {
     if (isNative()) {
       cudaDestroyTextureObject(tex);
       cudaDestroyTextureObject(invTex);
       cudaDestroyTextureObject(evenTex);
       cudaDestroyTextureObject(oddTex);
       cudaDestroyTextureObject(evenInvTex);
       cudaDestroyTextureObject(oddInvTex);
       if (precision == QUDA_HALF_PRECISION || precision == QUDA_QUARTER_PRECISION) {
         cudaDestroyTextureObject(normTex);
   cudaDestroyTextureObject(invNormTex);
   cudaDestroyTextureObject(evenNormTex);
   cudaDestroyTextureObject(oddNormTex);
   cudaDestroyTextureObject(evenInvNormTex);
   cudaDestroyTextureObject(oddInvNormTex);
       }
       checkCudaError();
     }
   }
 #endif

   cudaCloverField::~cudaCloverField()
   {
 #ifdef USE_TEXTURE_OBJECTS
     destroyTexObject();
 #endif

     if (create != QUDA_REFERENCE_FIELD_CREATE) {
       if (clover != cloverInv) {
   if (clover) pool_device_free(clover);
   if (norm) pool_device_free(norm);
       }
       if (cloverInv) pool_device_free(cloverInv);
       if (invNorm) pool_device_free(invNorm);
     }

     checkCudaError();
   }

   void cudaCloverField::copy(const CloverField &src, bool inverse) {

     checkField(src);

     if (typeid(src) == typeid(cudaCloverField)) {
       if (src.V(false)) copyGenericClover(*this, src, false, QUDA_CUDA_FIELD_LOCATION);
       if (src.V(true)) copyGenericClover(*this, src, true, QUDA_CUDA_FIELD_LOCATION);
     } else if (reorder_location() == QUDA_CPU_FIELD_LOCATION && typeid(src) == typeid(cpuCloverField)) {
       void *packClover = pool_pinned_malloc(bytes + norm_bytes);
       void *packCloverNorm = (precision == QUDA_HALF_PRECISION || precision == QUDA_QUARTER_PRECISION) ?
           static_cast<char *>(packClover) + bytes :
           0;

       if (src.V(false)) {
   copyGenericClover(*this, src, false, QUDA_CPU_FIELD_LOCATION, packClover, 0, packCloverNorm, 0);
   qudaMemcpy(clover, packClover, bytes, cudaMemcpyHostToDevice);
         if (precision == QUDA_HALF_PRECISION || precision == QUDA_QUARTER_PRECISION)
           qudaMemcpy(norm, packCloverNorm, norm_bytes, cudaMemcpyHostToDevice);
       }

       if (src.V(true) && inverse) {
   copyGenericClover(*this, src, true, QUDA_CPU_FIELD_LOCATION, packClover, 0, packCloverNorm, 0);
   qudaMemcpy(cloverInv, packClover, bytes, cudaMemcpyHostToDevice);
         if (precision == QUDA_HALF_PRECISION || precision == QUDA_QUARTER_PRECISION)
           qudaMemcpy(invNorm, packCloverNorm, norm_bytes, cudaMemcpyHostToDevice);
       }

       pool_pinned_free(packClover);
     } else if (reorder_location() == QUDA_CUDA_FIELD_LOCATION && typeid(src) == typeid(cpuCloverField)) {
       void *packClover = pool_device_malloc(src.Bytes() + src.NormBytes());
       void *packCloverNorm = (precision == QUDA_HALF_PRECISION || precision == QUDA_QUARTER_PRECISION) ?
           static_cast<char *>(packClover) + src.Bytes() :
           0;

       if (src.V(false)) {
   qudaMemcpy(packClover, src.V(false), src.Bytes(), cudaMemcpyHostToDevice);
         if (precision == QUDA_HALF_PRECISION || precision == QUDA_QUARTER_PRECISION)
           qudaMemcpy(packCloverNorm, src.Norm(false), src.NormBytes(), cudaMemcpyHostToDevice);

   copyGenericClover(*this, src, false, QUDA_CUDA_FIELD_LOCATION, 0, packClover, 0, packCloverNorm);
       }

       if (src.V(true) && inverse) {
   qudaMemcpy(packClover, src.V(true), src.Bytes(), cudaMemcpyHostToDevice);
         if (precision == QUDA_HALF_PRECISION || precision == QUDA_QUARTER_PRECISION)
           qudaMemcpy(packCloverNorm, src.Norm(true), src.NormBytes(), cudaMemcpyHostToDevice);

   copyGenericClover(*this, src, true, QUDA_CUDA_FIELD_LOCATION, 0, packClover, 0, packCloverNorm);
       }

       pool_device_free(packClover);
     } else {
       errorQuda("Invalid clover field type");
     }

     qudaDeviceSynchronize();
     checkCudaError();
   }

   void cudaCloverField::loadCPUField(const cpuCloverField &cpu) { copy(cpu); }

   void cudaCloverField::saveCPUField(cpuCloverField &cpu) const {
     checkField(cpu);

     // we know we are copying from GPU to CPU here, so for now just
     // assume that reordering is on CPU
     void *packClover = pool_pinned_malloc(bytes + norm_bytes);
     void *packCloverNorm = (precision == QUDA_HALF_PRECISION) ? static_cast<char*>(packClover) + bytes : 0;

     // first copy over the direct part (if it exists)
     if (V(false) && cpu.V(false)) {
       qudaMemcpy(packClover, clover, bytes, cudaMemcpyDeviceToHost);
       if (precision == QUDA_HALF_PRECISION)
   qudaMemcpy(packCloverNorm, norm, norm_bytes, cudaMemcpyDeviceToHost);
       copyGenericClover(cpu, *this, false, QUDA_CPU_FIELD_LOCATION, 0, packClover, 0, packCloverNorm);
     } else if((V(false) && !cpu.V(false)) || (!V(false) && cpu.V(false))) {
       errorQuda("Mismatch between Clover field GPU V(false) and CPU.V(false)");
     }

     // now copy the inverse part (if it exists)
     if (V(true) && cpu.V(true)) {
       qudaMemcpy(packClover, cloverInv, bytes, cudaMemcpyDeviceToHost);
   if (precision == QUDA_HALF_PRECISION)
     qudaMemcpy(packCloverNorm, invNorm, norm_bytes, cudaMemcpyDeviceToHost);
       copyGenericClover(cpu, *this, true, QUDA_CPU_FIELD_LOCATION, 0, packClover, 0, packCloverNorm);
     } else if ((V(true) && !cpu.V(true)) || (!V(true) && cpu.V(true))) {
       errorQuda("Mismatch between Clover field GPU V(true) and CPU.V(true)");
     }

     pool_pinned_free(packClover);

     qudaDeviceSynchronize();
     checkCudaError();
   }

   void cudaCloverField::compute(const cudaGaugeField &gauge) {

     if (gauge.Precision() != precision)
       errorQuda("Gauge and clover precisions must match");

     computeClover(*this, gauge, 1.0, QUDA_CUDA_FIELD_LOCATION);

   }

   cpuCloverField::cpuCloverField(const CloverFieldParam &param) : CloverField(param) {

     if (create == QUDA_NULL_FIELD_CREATE || create == QUDA_ZERO_FIELD_CREATE) {
       if(order != QUDA_PACKED_CLOVER_ORDER) {errorQuda("cpuCloverField only supports QUDA_PACKED_CLOVER_ORDER");}
       clover = (void *) safe_malloc(bytes);
       if (precision == QUDA_HALF_PRECISION) norm = (void *) safe_malloc(norm_bytes);
       if(param.inverse) {
   cloverInv = (void *) safe_malloc(bytes);
   if (precision == QUDA_HALF_PRECISION) invNorm = (void *) safe_malloc(norm_bytes);
       }

       if(create == QUDA_ZERO_FIELD_CREATE) {
   memset(clover, '\0', bytes);
   if(param.inverse) memset(cloverInv, '\0', bytes);
   if(precision == QUDA_HALF_PRECISION) memset(norm, '\0', norm_bytes);
   if(param.inverse && precision ==QUDA_HALF_PRECISION) memset(invNorm, '\0', norm_bytes);
       }
     } else if (create == QUDA_REFERENCE_FIELD_CREATE) {
       clover = param.clover;
       norm = param.norm;
       cloverInv = param.cloverInv;
       invNorm = param.invNorm;
     } else {
       errorQuda("Create type %d not supported", create);
     }

     if (param.pad != 0) errorQuda("%s pad must be zero", __func__);
   }

   cpuCloverField::~cpuCloverField() {
     if (create != QUDA_REFERENCE_FIELD_CREATE) {
       if (clover) host_free(clover);
       if (norm) host_free(norm);
       if (cloverInv) host_free(cloverInv);
       if (invNorm) host_free(invNorm);
     }
   }

   // This doesn't really live here, but is fine for the moment
   std::ostream& operator<<(std::ostream& output, const CloverFieldParam& param)
   {
     output << static_cast<const LatticeFieldParam&>(param);
     output << "direct = "    << param.direct << std::endl;
     output << "inverse = "   << param.inverse << std::endl;
     output << "clover = "    << param.clover << std::endl;
     output << "norm = "      << param.norm << std::endl;
     output << "cloverInv = " << param.cloverInv << std::endl;
     output << "invNorm = "   << param.invNorm << std::endl;
     output << "csw = "       << param.csw << std::endl;
     output << "twisted = "   << param.twisted << std::endl;
     output << "mu2 = "       << param.mu2 << std::endl;
     output << "rho = "       << param.rho << std::endl;
     output << "order = "     << param.order << std::endl;
     output << "create = "    << param.create << std::endl;
     return output;  // for multiple << operators.
   }

   ColorSpinorParam colorSpinorParam(const CloverField &a, bool inverse) {

     if (a.Precision() == QUDA_HALF_PRECISION)
       errorQuda("Casting a CloverField into ColorSpinorField not possible in half precision");

     ColorSpinorParam spinor_param;
     // 72 = 9 * 4 * 2
     spinor_param.nColor = 9;
     spinor_param.nSpin = 4;
     spinor_param.nDim = a.Ndim();
     for (int d=0; d<a.Ndim(); d++) spinor_param.x[d] = a.X()[d];
     spinor_param.setPrecision(a.Precision());
     spinor_param.pad = a.Pad();
     spinor_param.siteSubset = QUDA_FULL_SITE_SUBSET;
     spinor_param.siteOrder = QUDA_EVEN_ODD_SITE_ORDER;
     spinor_param.fieldOrder = a.Precision() == QUDA_DOUBLE_PRECISION ?
       QUDA_FLOAT2_FIELD_ORDER : QUDA_FLOAT4_FIELD_ORDER;
     spinor_param.gammaBasis = QUDA_UKQCD_GAMMA_BASIS;
     spinor_param.create = QUDA_REFERENCE_FIELD_CREATE;
     spinor_param.v = (void*)a.V(inverse);
     spinor_param.location = a.Location();
     return spinor_param;
   }

   // Return the L2 norm squared of the clover field
   double norm2(const CloverField &a, bool inverse) {
     ColorSpinorField *b = ColorSpinorField::Create(colorSpinorParam(a, inverse));
     double nrm2 = blas::norm2(*b);
     delete b;
     return nrm2;
   }

   // Return the L1 norm of the clover field
   double norm1(const CloverField &a, bool inverse) {
     ColorSpinorField *b = ColorSpinorField::Create(colorSpinorParam(a, inverse));
     double nrm1 = blas::norm1(*b);
     delete b;
     return nrm1;
   }

 } // namespace quda
quda::CloverField::~CloverField
virtual ~CloverField()
Definition: clover_field.cpp:61

quda::CloverFieldParam::order
QudaCloverFieldOrder order
Definition: clover_field.h:21

quda::CloverField::norm_bytes
size_t norm_bytes
Definition: clover_field.h:49

quda::cudaCloverField::even
void * even
Definition: clover_field.h:171

quda::CloverField::setRho
void setRho(double rho)
Bakes in the rho factor into the clover field, (for real diagonal additive Hasenbusch), e.g., A + rho.
Definition: clover_field.cpp:73

qudaMemcpy
#define qudaMemcpy(dst, src, count, kind)
Definition: quda_cuda_api.h:33

quda::reorder_location
QudaFieldLocation reorder_location()
Return whether data is reordered on the CPU or GPU. This can set at QUDA initialization using the env...
Definition: lattice_field.cpp:725

quda::CloverFieldParam::CloverFieldParam
CloverFieldParam()
Definition: clover_field.h:30

quda::CloverField::clover
void * clover
Definition: clover_field.h:55

quda::ColorSpinorParam::setPrecision
void setPrecision(QudaPrecision precision, QudaPrecision ghost_precision=QUDA_INVALID_PRECISION, bool force_native=false)
Definition: color_spinor_field.h:231

QUDA_PACKED_CLOVER_ORDER
Definition: enum_quda.h:256

quda::cudaCloverField::cudaCloverField
cudaCloverField(const CloverFieldParam &param)
Definition: clover_field.cpp:78

pool_pinned_free
#define pool_pinned_free(ptr)
Definition: malloc_quda.h:128

quda::ColorSpinorField
Definition: color_spinor_field.h:311

quda::CloverField::cloverInv
void * cloverInv
Definition: clover_field.h:57

deviceProp
cudaDeviceProp deviceProp
Definition: interface_quda.cpp:156

quda::CloverField::V
void * V(bool inverse=false)
Definition: clover_field.h:74

quda::cudaCloverField::odd
void * odd
Definition: clover_field.h:171

quda::norm
__host__ __device__ ValueType norm(const complex< ValueType > &z)
Returns the magnitude of z squared.
Definition: complex_quda.h:1092

quda::LatticeField::total_bytes
size_t total_bytes
Definition: lattice_field.h:156

quda::ColorSpinorParam::nColor
int nColor
Definition: color_spinor_field.h:85

quda::LatticeFieldParam
Definition: lattice_field.h:47

quda::LatticeField::volumeCB
int volumeCB
Definition: lattice_field.h:151

quda::CloverField::bytes
size_t bytes
Definition: clover_field.h:48

errorQuda
#define errorQuda(...)
Definition: util_quda.h:121

quda::blas::norm2
double norm2(const ColorSpinorField &a)
Definition: reduce_quda.cu:721

quda::CloverField::norm
void * norm
Definition: clover_field.h:56

color_spinor_field.h

quda::cudaCloverField::oddInv
void * oddInv
Definition: clover_field.h:174

quda::CloverFieldParam::create
QudaFieldCreate create
Definition: clover_field.h:22

QUDA_CUDA_FIELD_LOCATION
Definition: enum_quda.h:326

quda::CloverField::Bytes
size_t Bytes() const
Definition: clover_field.h:98

quda::CloverField::length
size_t length
Definition: clover_field.h:50

quda::cudaCloverField::saveCPUField
void saveCPUField(cpuCloverField &cpu) const
Definition: clover_field.cpp:342

host_free
#define host_free(ptr)
Definition: malloc_quda.h:71

QUDA_QUARTER_PRECISION
Definition: enum_quda.h:59

QUDA_HALF_PRECISION
Definition: enum_quda.h:60

quda::cudaCloverField::loadCPUField
void loadCPUField(const cpuCloverField &cpu)
Definition: clover_field.cpp:340

quda::cudaCloverField::oddNorm
void * oddNorm
Definition: clover_field.h:172

quda::CloverField
Definition: clover_field.h:45

quda::CloverField::nColor
int nColor
Definition: clover_field.h:52

quda::CloverField::invNorm
void * invNorm
Definition: clover_field.h:58

QUDA_FULL_SITE_SUBSET
Definition: enum_quda.h:333

quda::cpuCloverField::~cpuCloverField
virtual ~cpuCloverField()
Definition: clover_field.cpp:417

quda::ColorSpinorField::Create
static ColorSpinorField * Create(const ColorSpinorParam &param)
Definition: color_spinor_field.cpp:752

QUDA_NULL_FIELD_CREATE
Definition: enum_quda.h:359

quda::CloverFieldParam::clover
void * clover
Definition: clover_field.h:12

quda::LatticeFieldParam::precision
QudaPrecision precision
Definition: lattice_field.h:51

quda::CloverField::order
QudaCloverFieldOrder order
Definition: clover_field.h:65

quda::CloverField::norm2
double norm2() const
Compute the L2 norm squared of the field.
Definition: max_clover.cu:59

quda::CloverField::CloverField
CloverField(const CloverFieldParam &param)
Definition: clover_field.cpp:37

quda::CloverFieldParam::inverse
bool inverse
Definition: clover_field.h:11

QUDA_UKQCD_GAMMA_BASIS
Definition: enum_quda.h:368

quda::CloverFieldParam::invNorm
void * invNorm
Definition: clover_field.h:15

quda::CloverFieldParam::mu2
double mu2
Definition: clover_field.h:18

quda
Definition: blas_cublas.h:5

quda::LatticeFieldParam::siteSubset
QudaSiteSubset siteSubset
Definition: lattice_field.h:71

quda::CloverField::create
QudaFieldCreate create
Definition: clover_field.h:66

quda::operator<<
std::ostream & operator<<(std::ostream &output, const CloverFieldParam &param)
Definition: clover_field.cpp:427

quda::is_aligned
bool is_aligned(const void *ptr, size_t alignment)
Definition: malloc_quda.h:57

QUDA_REFERENCE_FIELD_CREATE
Definition: enum_quda.h:362

param
QudaGaugeParam param
Definition: pack_test.cpp:17

QUDA_QDPJIT_CLOVER_ORDER
Definition: enum_quda.h:257

quda::LatticeFieldParam::x
int x[QUDA_MAX_DIM]
Definition: lattice_field.h:67

quda::LatticeField::Ndim
int Ndim() const
Definition: lattice_field.h:494

QUDA_FLOAT2_CLOVER_ORDER
Definition: enum_quda.h:254

quda::cudaCloverField
Definition: clover_field.h:168

qudaDeviceSynchronize
#define qudaDeviceSynchronize()
Definition: quda_cuda_api.h:145

QUDA_EVEN_ODD_SITE_ORDER
Definition: enum_quda.h:340

quda::cudaCloverField::evenNorm
void * evenNorm
Definition: clover_field.h:172

quda::ColorSpinorParam::location
QudaFieldLocation location
Definition: color_spinor_field.h:83

quda::LatticeField::Pad
int Pad() const
Definition: lattice_field.h:531

quda::CloverFieldParam
Definition: clover_field.h:9

quda::LatticeField::checkField
void checkField(const LatticeField &a) const
Definition: lattice_field.cpp:631

quda::ColorSpinorParam::fieldOrder
QudaFieldOrder fieldOrder
Definition: color_spinor_field.h:93

nColor
const int nColor
Definition: covdev_test.cpp:75

ALIGNMENT_ADJUST
#define ALIGNMENT_ADJUST(n)
Definition: quda_internal.h:22

quda::cudaCloverField::compute
void compute(const cudaGaugeField &gauge)
Definition: clover_field.cpp:379

quda::LatticeField
Definition: lattice_field.h:144

quda::ColorSpinorParam::gammaBasis
QudaGammaBasis gammaBasis
Definition: color_spinor_field.h:94

pool_device_malloc
#define pool_device_malloc(size)
Definition: malloc_quda.h:125

quda::cudaGaugeField
Definition: gauge_field.h:404

QUDA_FLOAT2_FIELD_ORDER
Definition: enum_quda.h:348

QUDA_FLOAT4_CLOVER_ORDER
Definition: enum_quda.h:255

quda::CloverField::twisted
bool twisted
Definition: clover_field.h:61

quda::CloverField::mu2
double mu2
Definition: clover_field.h:62

quda::cpuCloverField::cpuCloverField
cpuCloverField(const CloverFieldParam &param)
Definition: clover_field.cpp:388

quda::LatticeField::nDim
int nDim
Definition: lattice_field.h:159

clover_field.h

quda::CloverField::isNative
bool isNative() const
Definition: clover_field.cpp:63

quda::CloverField::nSpin
int nSpin
Definition: clover_field.h:53

safe_malloc
#define safe_malloc(size)
Definition: malloc_quda.h:66

quda::cudaCloverField::copy
void copy(const CloverField &src, bool inverse=true)
Copy into this CloverField from the generic CloverField src.
Definition: clover_field.cpp:281

quda::LatticeFieldParam::nDim
int nDim
Definition: lattice_field.h:64

memset
void * memset(void *s, int c, size_t n)

quda::cudaCloverField::evenInv
void * evenInv
Definition: clover_field.h:174

quda::LatticeField::Location
QudaFieldLocation Location() const
Definition: lattice_field.cpp:660

blas_quda.h

quda::CloverFieldParam::cloverInv
void * cloverInv
Definition: clover_field.h:14

pool_pinned_malloc
#define pool_pinned_malloc(size)
Definition: malloc_quda.h:127

quda::CloverField::real_length
size_t real_length
Definition: clover_field.h:51

quda::cudaCloverField::oddInvNorm
void * oddInvNorm
Definition: clover_field.h:175

quda::ColorSpinorParam
Definition: color_spinor_field.h:80

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:62

quda::inverse
__device__ __host__ Matrix< T, 3 > inverse(const Matrix< T, 3 > &u)
Definition: quda_matrix.h:611

quda::blas::norm1
double norm1(const ColorSpinorField &b)
Definition: reduce_quda.cu:714

quda::CloverFieldParam::twisted
bool twisted
Clover coefficient.
Definition: clover_field.h:17

quda::CloverFieldParam::csw
double csw
Definition: clover_field.h:16

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:61

quda::CloverField::NormBytes
size_t NormBytes() const
Definition: clover_field.h:103

quda::ColorSpinorParam::nSpin
int nSpin
Definition: color_spinor_field.h:86

quda::CloverField::Norm
void * Norm(bool inverse=false)
Definition: clover_field.h:75

quda::CloverFieldParam::rho
double rho
Definition: clover_field.h:19

quda::CloverFieldParam::direct
bool direct
Definition: clover_field.h:10

quda::cpuCloverField
Definition: clover_field.h:244

quda::ColorSpinorParam::siteOrder
QudaSiteOrder siteOrder
Definition: color_spinor_field.h:91

quda::colorSpinorParam
ColorSpinorParam colorSpinorParam(const CloverField &a, bool inverse)
Definition: clover_field.cpp:445

quda::cudaCloverField::~cudaCloverField
virtual ~cudaCloverField()
Definition: clover_field.cpp:263

quda::ColorSpinorParam::v
void * v
Definition: color_spinor_field.h:99

quda::CloverField::norm1
double norm1() const
Compute the L1 norm of the field.
Definition: max_clover.cu:49

quda::cudaCloverField::evenInvNorm
void * evenInvNorm
Definition: clover_field.h:175

pool_device_free
#define pool_device_free(ptr)
Definition: malloc_quda.h:126

checkCudaError
#define checkCudaError()
Definition: util_quda.h:161

QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:360

QUDA_FLOAT4_FIELD_ORDER
Definition: enum_quda.h:349

quda::ColorSpinorParam::create
QudaFieldCreate create
Definition: color_spinor_field.h:95

quda::LatticeField::Precision
QudaPrecision Precision() const
Definition: lattice_field.h:546

quda::CloverFieldParam::norm
void * norm
Definition: clover_field.h:13

quda::computeClover
void computeClover(CloverField &clover, const GaugeField &gauge, double coeff, QudaFieldLocation location)
Definition: clover_quda.cu:204

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:325

quda::LatticeField::precision
QudaPrecision precision
Definition: lattice_field.h:171

quda::LatticeField::stride
int stride
Definition: lattice_field.h:153

gauge_field.h

quda::blas::bytes
unsigned long long bytes
Definition: blas_quda.cu:23

quda::CloverField::rho
double rho
Definition: clover_field.h:63

quda::copyGenericClover
void copyGenericClover(CloverField &out, const CloverField &in, bool inverse, QudaFieldLocation location, void *Out=0, void *In=0, void *outNorm=0, void *inNorm=0)
This generic function is used for copying the clover field where in the input and output can be in an...
Definition: copy_clover.cu:175

quda::LatticeField::X
const int * X() const
Definition: lattice_field.h:499

quda_internal.h

quda::LatticeFieldParam::pad
int pad
Definition: lattice_field.h:69