v0.9.0/doc/blas__cpu_8cpp_source.html

 #include <color_spinor_field.h>
 #include <blas_quda.h>

 namespace quda {

   namespace blas {

     template <typename Float>
     void axpby(const Float &a, const Float *x, const Float &b, Float *y, const int N) {
       for (int i=0; i<N; i++) y[i] = a*x[i] + b*y[i];
     }

     void axpbyCpu(const double &a, const cpuColorSpinorField &x,
       const double &b, cpuColorSpinorField &y) {
       if (x.Precision() == QUDA_DOUBLE_PRECISION)
   axpby(a, (double*)x.V(), b, (double*)y.V(), x.Length());
       else if (x.Precision() == QUDA_SINGLE_PRECISION)
   axpby((float)a, (float*)x.V(), (float)b, (float*)y.V(), x.Length());
       else
   errorQuda("Precision type %d not implemented", x.Precision());
     }

     void xpyCpu(const cpuColorSpinorField &x, cpuColorSpinorField &y) {
       if (x.Precision() == QUDA_DOUBLE_PRECISION)
   axpby(1.0, (double*)x.V(), 1.0, (double*)y.V(), x.Length());
       else if (x.Precision() == QUDA_SINGLE_PRECISION)
   axpby(1.0f, (float*)x.V(), 1.0f, (float*)y.V(), x.Length());
       else
   errorQuda("Precision type %d not implemented", x.Precision());
     }

     void axpyCpu(const double &a, const cpuColorSpinorField &x,
      cpuColorSpinorField &y) {
       if (x.Precision() == QUDA_DOUBLE_PRECISION)
   axpby(a, (double*)x.V(), 1.0, (double*)y.V(), x.Length());
       else if (x.Precision() == QUDA_SINGLE_PRECISION)
   axpby((float)a, (float*)x.V(), 1.0f, (float*)y.V(), x.Length());
       else
   errorQuda("Precision type %d not implemented", x.Precision());
     }

     void xpayCpu(const cpuColorSpinorField &x, const double &a,
      cpuColorSpinorField &y) {
       if (x.Precision() == QUDA_DOUBLE_PRECISION)
   axpby(1.0, (double*)x.V(), a, (double*)y.V(), x.Length());
       else if (x.Precision() == QUDA_SINGLE_PRECISION)
   axpby(1.0f, (float*)x.V(), (float)a, (float*)y.V(), x.Length());
       else
   errorQuda("Precision type %d not implemented", x.Precision());
     }

     void mxpyCpu(const cpuColorSpinorField &x, cpuColorSpinorField &y) {
       if (x.Precision() == QUDA_DOUBLE_PRECISION)
   axpby(-1.0, (double*)x.V(), 1.0, (double*)y.V(), x.Length());
       else if (x.Precision() == QUDA_SINGLE_PRECISION)
   axpby(-1.0f, (float*)x.V(), 1.0f, (float*)y.V(), x.Length());
       else
   errorQuda("Precision type %d not implemented", x.Precision());
     }

     void axCpu(const double &a, cpuColorSpinorField &x) {
       if (x.Precision() == QUDA_DOUBLE_PRECISION)
   axpby(0.0, (double*)x.V(), a, (double*)x.V(), x.Length());
       else if (x.Precision() == QUDA_SINGLE_PRECISION)
   axpby(0.0f, (float*)x.V(), (float)a, (float*)x.V(), x.Length());
       else
   errorQuda("Precision type %d not implemented", x.Precision());
     }

     template <typename Float>
     void caxpby(const std::complex<Float> &a, const std::complex<Float> *x,
     const std::complex<Float> &b, std::complex<Float> *y, int N) {

       for (int i=0; i<N; i++) {
   y[i] = a*x[i] + b*y[i];
       }

     }

     void caxpyCpu(const Complex &a, const cpuColorSpinorField &x,
       cpuColorSpinorField &y) {

       if ( x.Precision() == QUDA_DOUBLE_PRECISION)
   caxpby(a, (Complex*)x.V(), Complex(1.0),
          (Complex*)y.V(), x.Length()/2);
       else if (x.Precision() == QUDA_SINGLE_PRECISION)
   caxpby((std::complex<float>)a, (std::complex<float>*)x.V(), std::complex<float>(1.0),
          (std::complex<float>*)y.V(), x.Length()/2);
       else
   errorQuda("Precision type %d not implemented", x.Precision());
     }

     void caxpbyCpu(const Complex &a, const cpuColorSpinorField &x,
        const Complex &b, cpuColorSpinorField &y) {

       if ( x.Precision() == QUDA_DOUBLE_PRECISION)
   caxpby(a, (Complex*)x.V(), b, (Complex*)y.V(), x.Length()/2);
       else if (x.Precision() == QUDA_SINGLE_PRECISION)
   caxpby((std::complex<float>)a, (std::complex<float>*)x.V(), (std::complex<float>)b,
          (std::complex<float>*)y.V(), x.Length()/2);
       else
   errorQuda("Precision type %d not implemented", x.Precision());
     }

     template <typename Float>
     void caxpbypcz(const std::complex<Float> &a, const std::complex<Float> *x,
        const std::complex<Float> &b, const std::complex<Float> *y,
        const std::complex<Float> &c, std::complex<Float> *z, int N) {

       for (int i=0; i<N; i++) {
   z[i] = a*x[i] + b*y[i] + c*z[i];
       }

     }

     void cxpaypbzCpu(const cpuColorSpinorField &x, const Complex &a,
          const cpuColorSpinorField &y, const Complex &b,
          cpuColorSpinorField &z) {

       if (x.Precision() == QUDA_DOUBLE_PRECISION)
   caxpbypcz(Complex(1, 0), (Complex*)x.V(), a, (Complex*)y.V(),
       b, (Complex*)z.V(), x.Length()/2);
       else if (x.Precision() == QUDA_SINGLE_PRECISION)
   caxpbypcz(std::complex<float>(1, 0), (std::complex<float>*)x.V(), (std::complex<float>)a, (std::complex<float>*)y.V(),
       (std::complex<float>)b, (std::complex<float>*)z.V(), x.Length()/2);
       else
   errorQuda("Precision type %d not implemented", x.Precision());
     }

     void axpyBzpcxCpu(const double &a, cpuColorSpinorField& x, cpuColorSpinorField& y,
           const double &b, const cpuColorSpinorField& z, const double &c) {
       axpyCpu(a, x, y);
       axpbyCpu(b, z, c, x);
     }

     // performs the operations: {y[i] = a*x[i] + y[i]; x[i] = z[i] + b*x[i]}
     void axpyZpbxCpu(const double &a, cpuColorSpinorField &x, cpuColorSpinorField &y,
          const cpuColorSpinorField &z, const double &b) {
       axpyCpu(a, x, y);
       xpayCpu(z, b, x);
     }

     // performs the operation z[i] = a*x[i] + b*y[i] + z[i] and y[i] -= b*w[i]
     void caxpbypzYmbwCpu(const Complex &a, const cpuColorSpinorField &x, const Complex &b,
        cpuColorSpinorField &y, cpuColorSpinorField &z, const cpuColorSpinorField &w) {

       if (x.Precision() == QUDA_DOUBLE_PRECISION)
   caxpbypcz(a, (Complex*)x.V(), b, (Complex*)y.V(),
       Complex(1, 0), (Complex*)z.V(), x.Length()/2);
       else if (x.Precision() == QUDA_SINGLE_PRECISION)
   caxpbypcz((std::complex<float>)a, (std::complex<float>*)x.V(),
       (std::complex<float>)b, (std::complex<float>*)y.V(),
       (std::complex<float>)(1.0f), (std::complex<float>*)z.V(), x.Length()/2);
       else
   errorQuda("Precision type %d not implemented", x.Precision());

       caxpyCpu(-b, w, y);
     }

     template <typename Float>
     double norm(const Float *a, const int N) {
       double norm2 = 0;
       for (int i=0; i<N; i++) norm2 += a[i]*a[i];
       return norm2;
     }

     double normCpu(const cpuColorSpinorField &a) {
       double norm2 = 0.0;
       if (a.Precision() == QUDA_DOUBLE_PRECISION)
   norm2 = norm((double*)a.V(), a.Length());
       else if (a.Precision() == QUDA_SINGLE_PRECISION)
   norm2 = norm((float*)a.V(), a.Length());
       else
   errorQuda("Precision type %d not implemented", a.Precision());
       reduceDouble(norm2);
       return norm2;
     }

     double axpyNormCpu(const double &a, const cpuColorSpinorField &x,
            cpuColorSpinorField &y) {
       axpyCpu(a, x, y);
       return normCpu(y);
     }

     template <typename Float>
     double reDotProduct(const Float *a, const Float *b, const int N) {
       double dot = 0;
       for (int i=0; i<N; i++) dot += a[i]*b[i];
       return dot;
     }

     double reDotProductCpu(const cpuColorSpinorField &a, const cpuColorSpinorField &b) {
       double dot = 0.0;
       if (a.Precision() == QUDA_DOUBLE_PRECISION)
   dot = reDotProduct((double*)a.V(), (double*)b.V(), a.Length());
       else if (a.Precision() == QUDA_SINGLE_PRECISION)
   dot = reDotProduct((float*)a.V(), (float*)b.V(), a.Length());
       else
   errorQuda("Precision type %d not implemented", a.Precision());
       reduceDouble(dot);
       return dot;
     }

     // First performs the operation y[i] = x[i] - y[i]
     // Second returns the norm of y
     double xmyNormCpu(const cpuColorSpinorField &x, cpuColorSpinorField &y) {
       xpayCpu(x, -1, y);
       return normCpu(y);
     }

     template <typename Float>
     Complex cDotProduct(const std::complex<Float> *a, const std::complex<Float> *b, const int N) {
       quda::Complex dot = 0;
       for (int i=0; i<N; i++) dot += conj(a[i])*b[i];
       return dot;
     }

     Complex cDotProductCpu(const cpuColorSpinorField &a, const cpuColorSpinorField &b) {
       Complex dot = 0.0;
       if (a.Precision() == QUDA_DOUBLE_PRECISION)
   dot = cDotProduct((Complex*)a.V(), (Complex*)b.V(), a.Length()/2);
       else if (a.Precision() == QUDA_SINGLE_PRECISION)
   dot = cDotProduct((std::complex<float>*)a.V(), (std::complex<float>*)b.V(), a.Length()/2);
       else
   errorQuda("Precision type %d not implemented", a.Precision());
       reduceDoubleArray((double*)&dot, 2);
       return dot;
     }

     // First performs the operation y = x + a*y
     // Second returns complex dot product (z,y)
     Complex xpaycDotzyCpu(const cpuColorSpinorField &x, const double &a,
         cpuColorSpinorField &y, const cpuColorSpinorField &z) {
       xpayCpu(x, a, y);
       return cDotProductCpu(z,y);
     }

     double3 cDotProductNormACpu(const cpuColorSpinorField &a, const cpuColorSpinorField &b) {
       Complex dot = cDotProductCpu(a, b);
       double norm = normCpu(a);
       return make_double3(real(dot), imag(dot), norm);
     }

     double3 cDotProductNormBCpu(const cpuColorSpinorField &a, const cpuColorSpinorField &b) {
       Complex dot = cDotProductCpu(a, b);
       double norm = normCpu(b);
       return make_double3(real(dot), imag(dot), norm);
     }

     // This convoluted kernel does the following: z += a*x + b*y, y -= b*w, norm = (y,y), dot = (u, y)
     double3 caxpbypzYmbwcDotProductUYNormYCpu(const Complex &a, const cpuColorSpinorField &x,
                 const Complex &b, cpuColorSpinorField &y,
                 cpuColorSpinorField &z, const cpuColorSpinorField &w,
                 const cpuColorSpinorField &u) {

       caxpbypzYmbwCpu(a, x, b, y, z, w);
       return cDotProductNormBCpu(u, y);
     }

     void cabxpyAxCpu(const double &a, const Complex &b, cpuColorSpinorField &x, cpuColorSpinorField &y) {
       axCpu(a, x);
       caxpyCpu(b, x, y);
     }

     double caxpyNormCpu(const Complex &a, cpuColorSpinorField &x,
       cpuColorSpinorField &y) {
       caxpyCpu(a, x, y);
       return norm2(y);
     }

     double caxpyXmazNormXCpu(const Complex &a, cpuColorSpinorField &x,
            cpuColorSpinorField &y, cpuColorSpinorField &z) {
       caxpyCpu(a, x, y);
       caxpyCpu(-a, z, x);
       return norm2(x);
     }

     void caxpyXmazCpu(const Complex &a, cpuColorSpinorField &x,
           cpuColorSpinorField &y, cpuColorSpinorField &z) {
       caxpyCpu(a, x, y);
       caxpyCpu(-a, z, x);
     }

     double cabxpyAxNormCpu(const double &a, const Complex &b, cpuColorSpinorField &x, cpuColorSpinorField &y) {
       axCpu(a, x);
       caxpyCpu(b, x, y);
       return norm2(y);
     }

     void caxpbypzCpu(const Complex &a, cpuColorSpinorField &x, const Complex &b, cpuColorSpinorField &y,
          cpuColorSpinorField &z) {
       caxpyCpu(a, x, z);
       caxpyCpu(b, y, z);
     }

     void caxpbypczpwCpu(const Complex &a, cpuColorSpinorField &x, const Complex &b, cpuColorSpinorField &y,
       const Complex &c, cpuColorSpinorField &z, cpuColorSpinorField &w) {
       caxpyCpu(a, x, w);
       caxpyCpu(b, y, w);
       caxpyCpu(c, z, w);

     }

     Complex caxpyDotzyCpu(const Complex &a, cpuColorSpinorField &x, cpuColorSpinorField &y,
         cpuColorSpinorField &z) {
       caxpyCpu(a, x, y);
       return cDotProductCpu(z, y);
     }

     template <typename Float>
     double3 HeavyQuarkResidualNorm(const Float *x, const Float *r, const int volume, const int Nint) {

       double3 sum = make_double3(0.0, 0.0, 0.0);
       for (int i = 0; i<volume; i++) {
   double x2 = 0;
   double r2 = 0;

   for (int j=0; j<Nint; j++) { // loop over internal degrees of freedom
     int k = i*Nint + j;
     x2 += x[k]*x[k];
     r2 += r[k]*r[k];
   }

   sum.x += x2;
   sum.y += r2;
   sum.z += (x2 > 0.0) ? (r2 / x2) : 1.0;
       }
       return sum;
     }


     double3 HeavyQuarkResidualNormCpu(cpuColorSpinorField &x, cpuColorSpinorField &r) {
       double3 rtn;
       if (x.Precision() == QUDA_DOUBLE_PRECISION) {
   rtn = HeavyQuarkResidualNorm<double>((const double*)(x.V()), (const double*)(r.V()),
                x.Volume(), 2*x.Ncolor()*x.Nspin());
       } else if (x.Precision() == QUDA_SINGLE_PRECISION) {
   rtn = HeavyQuarkResidualNorm<float>((const float*)(x.V()), (const float*)(r.V()),
               x.Volume(), 2*x.Ncolor()*x.Nspin());
       } else {
   errorQuda("Precision type %d not implemented", x.Precision());
       }
 #ifdef MULTI_GPU
       rtn.z /= (x.Volume()*comm_size());
 #else
       rtn.z /= x.Volume();
 #endif
     reduceDoubleArray((double*)&rtn, 3);

     return rtn;
   }

     double3 HeavyQuarkResidualNormCpu(cpuColorSpinorField &x, cpuColorSpinorField &y, cpuColorSpinorField &r) {
       cpuColorSpinorField tmp(x);
       xpyCpu(y, tmp);
       return HeavyQuarkResidualNormCpu(tmp, r);
     }

   } // namespace blas
 } // namespace quda

quda::blas::xmyNormCpu
double xmyNormCpu(const cpuColorSpinorField &x, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:206

quda::blas::mxpyCpu
void mxpyCpu(const cpuColorSpinorField &x, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:52

quda::blas::xpaycDotzyCpu
Complex xpaycDotzyCpu(const cpuColorSpinorField &x, const double &a, cpuColorSpinorField &y, const cpuColorSpinorField &z)
Definition: blas_cpu.cpp:232

quda::blas::xpayCpu
void xpayCpu(const cpuColorSpinorField &x, const double &a, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:42

quda::blas::caxpbypzCpu
void caxpbypzCpu(const Complex &a, cpuColorSpinorField &x, const Complex &b, cpuColorSpinorField &y, cpuColorSpinorField &z)
Definition: blas_cpu.cpp:290

quda::blas::cDotProductCpu
Complex cDotProductCpu(const cpuColorSpinorField &a, const cpuColorSpinorField &b)
Definition: blas_cpu.cpp:218

quda::blas::axpyNormCpu
double axpyNormCpu(const double &a, const cpuColorSpinorField &x, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:179

errorQuda
#define errorQuda(...)
Definition: util_quda.h:90

quda::blas::norm2
double norm2(const ColorSpinorField &a)
Definition: reduce_quda.cu:241

color_spinor_field.h

quda::blas::xpyCpu
void xpyCpu(const cpuColorSpinorField &x, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:23

quda::blas::cDotProduct
Complex cDotProduct(ColorSpinorField &, ColorSpinorField &)
Definition: reduce_quda.cu:500

quda::Complex
std::complex< double > Complex
Definition: eig_variables.h:13

tmp
cudaColorSpinorField * tmp
Definition: covdev_test.cpp:44

quda::blas::axpyBzpcxCpu
void axpyBzpcxCpu(const double &a, cpuColorSpinorField &x, cpuColorSpinorField &y, const double &b, const cpuColorSpinorField &z, const double &c)
Definition: blas_cpu.cpp:130

reduceDoubleArray
void reduceDoubleArray(double *, const int len)
Definition: comm_common.cpp:667

quda::blas::reDotProduct
double reDotProduct(ColorSpinorField &x, ColorSpinorField &y)
Definition: reduce_quda.cu:277

z
int int z
Definition: CMakeCUDACompilerId.cpp1.ii:2637

quda
Definition: blas_cublas.h:6

b
#define b
Definition: dw_dslash4_core.h:83

x
p x
Definition: CMakeCUDACompilerId.cpp1.ii:3011

quda::blas::caxpyXmazNormXCpu
double caxpyXmazNormXCpu(const Complex &a, cpuColorSpinorField &x, cpuColorSpinorField &y, cpuColorSpinorField &z)
Definition: blas_cpu.cpp:271

quda::blas::cabxpyAxNormCpu
double cabxpyAxNormCpu(const double &a, const Complex &b, cpuColorSpinorField &x, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:284

quda::blas::axpbyCpu
void axpbyCpu(const double &a, const cpuColorSpinorField &x, const double &b, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:13

comm_size
int comm_size(void)
Definition: comm_mpi.cpp:126

quda::blas::axCpu
void axCpu(const double &a, cpuColorSpinorField &x)
Definition: blas_cpu.cpp:61

sum
__host__ __device__ void sum(double &a, double &b)
Definition: multi_reduce_core.cuh:4

quda::blas::caxpyCpu
void caxpyCpu(const Complex &a, const cpuColorSpinorField &x, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:80

w
int int int w
Definition: CMakeCUDACompilerId.cpp1.ii:2637

fused_exterior_ndeg_tm_dslash_cuda_gen.i
int i
start here
Definition: fused_exterior_ndeg_tm_dslash_cuda_gen.py:816

quda::blas::cDotProductNormACpu
double3 cDotProductNormACpu(const cpuColorSpinorField &a, const cpuColorSpinorField &b)
Definition: blas_cpu.cpp:238

f
int int int enum cudaChannelFormatKind f
Definition: CMakeCUDACompilerId.cpp1.ii:2637

quda::blas::axpyZpbxCpu
void axpyZpbxCpu(const double &a, cpuColorSpinorField &x, cpuColorSpinorField &y, const cpuColorSpinorField &z, const double &b)
Definition: blas_cpu.cpp:137

quda::blas::HeavyQuarkResidualNorm
double3 HeavyQuarkResidualNorm(ColorSpinorField &x, ColorSpinorField &r)
Definition: reduce_quda.cu:703

quda::blas::caxpbypcz
void caxpbypcz(const std::complex< Float > &a, const std::complex< Float > *x, const std::complex< Float > &b, const std::complex< Float > *y, const std::complex< Float > &c, std::complex< Float > *z, int N)
Definition: blas_cpu.cpp:106

quda::blas::norm
double norm(const Float *a, const int N)
Definition: blas_cpu.cpp:161

blas_quda.h

quda::blas::caxpbyCpu
void caxpbyCpu(const Complex &a, const cpuColorSpinorField &x, const Complex &b, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:93

quda::blas::HeavyQuarkResidualNormCpu
double3 HeavyQuarkResidualNormCpu(cpuColorSpinorField &x, cpuColorSpinorField &r)
Definition: blas_cpu.cpp:332

quda::blas::caxpyXmazCpu
void caxpyXmazCpu(const Complex &a, cpuColorSpinorField &x, cpuColorSpinorField &y, cpuColorSpinorField &z)
Definition: blas_cpu.cpp:278

quda::blas::axpby
void axpby(const double &a, ColorSpinorField &x, const double &b, ColorSpinorField &y)
Definition: blas_quda.cu:106

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:61

quda::blas::caxpyDotzyCpu
Complex caxpyDotzyCpu(const Complex &a, cpuColorSpinorField &x, cpuColorSpinorField &y, cpuColorSpinorField &z)
Definition: blas_cpu.cpp:304

quda::blas::reDotProductCpu
double reDotProductCpu(const cpuColorSpinorField &a, const cpuColorSpinorField &b)
Definition: blas_cpu.cpp:192

quda::blas::cxpaypbzCpu
void cxpaypbzCpu(const cpuColorSpinorField &x, const Complex &a, const cpuColorSpinorField &y, const Complex &b, cpuColorSpinorField &z)
Definition: blas_cpu.cpp:116

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:60

quda::blas::normCpu
double normCpu(const cpuColorSpinorField &a)
Definition: blas_cpu.cpp:167

quda::blas::caxpbypczpwCpu
void caxpbypczpwCpu(const Complex &a, cpuColorSpinorField &x, const Complex &b, cpuColorSpinorField &y, const Complex &c, cpuColorSpinorField &z, cpuColorSpinorField &w)
Definition: blas_cpu.cpp:296

quda::blas::caxpbypzYmbwCpu
void caxpbypzYmbwCpu(const Complex &a, const cpuColorSpinorField &x, const Complex &b, cpuColorSpinorField &y, cpuColorSpinorField &z, const cpuColorSpinorField &w)
Definition: blas_cpu.cpp:144

quda::blas::caxpby
void caxpby(const Complex &a, ColorSpinorField &x, const Complex &b, ColorSpinorField &y)
Definition: blas_quda.cu:292

quda::blas::caxpyNormCpu
double caxpyNormCpu(const Complex &a, cpuColorSpinorField &x, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:265

c
const void * c
Definition: CMakeCUDACompilerId.cpp1.ii:2234

quda::blas::cabxpyAxCpu
void cabxpyAxCpu(const double &a, const Complex &b, cpuColorSpinorField &x, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:260

quda::blas::axpyCpu
void axpyCpu(const double &a, const cpuColorSpinorField &x, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:32

float
float
Definition: CMakeCUDACompilerId.cpp1.ii:12791

reduceDouble
void reduceDouble(double &)
Definition: comm_common.cpp:665

quda::conj
__host__ __device__ ValueType conj(ValueType x)
Definition: complex_quda.h:115

quda::blas::caxpbypzYmbwcDotProductUYNormYCpu
double3 caxpbypzYmbwcDotProductUYNormYCpu(const Complex &a, const cpuColorSpinorField &x, const Complex &b, cpuColorSpinorField &y, cpuColorSpinorField &z, const cpuColorSpinorField &w, const cpuColorSpinorField &u)
Definition: blas_cpu.cpp:251

a
#define a
Definition: dw_dslash4_core.h:82

quda::blas::cDotProductNormBCpu
double3 cDotProductNormBCpu(const cpuColorSpinorField &a, const cpuColorSpinorField &b)
Definition: blas_cpu.cpp:244

quda::cpuColorSpinorField
Definition: color_spinor_field.h:789

quda::ColorSpinorField::V
void * V()
Definition: color_spinor_field.h:380

y
int y
Definition: CMakeCUDACompilerId.cpp1.ii:2637

dot
static void dot(sFloat *res, gFloat *a, sFloat *b)
Definition: dslash_util.h:56