quda-ref/v0.7.0/blas__cpu_8cpp_source.html

 #include <color_spinor_field.h>

 #include <blas_quda.h>

 #include <face_quda.h>


 namespace quda {


   template <typename Float>

   void axpby(const Float &a, const Float *x, const Float &b, Float *y, const int N) {

     for (int i=0; i<N; i++) y[i] = a*x[i] + b*y[i];

   }


   void axpbyCpu(const double &a, const cpuColorSpinorField &x,

                 const double &b, cpuColorSpinorField &y) {

     if (x.Precision() == QUDA_DOUBLE_PRECISION)

       axpby(a, (double*)x.V(), b, (double*)y.V(), x.Length());

     else if (x.Precision() == QUDA_SINGLE_PRECISION)

       axpby((float)a, (float*)x.V(), (float)b, (float*)y.V(), x.Length());

     else

       errorQuda("Precision type %d not implemented", x.Precision());

   }


   void xpyCpu(const cpuColorSpinorField &x, cpuColorSpinorField &y) {

     if (x.Precision() == QUDA_DOUBLE_PRECISION)

       axpby(1.0, (double*)x.V(), 1.0, (double*)y.V(), x.Length());

     else if (x.Precision() == QUDA_SINGLE_PRECISION)

       axpby(1.0f, (float*)x.V(), 1.0f, (float*)y.V(), x.Length());

     else

       errorQuda("Precision type %d not implemented", x.Precision());

   }


   void axpyCpu(const double &a, const cpuColorSpinorField &x,

                cpuColorSpinorField &y) {

     if (x.Precision() == QUDA_DOUBLE_PRECISION)

       axpby(a, (double*)x.V(), 1.0, (double*)y.V(), x.Length());

     else if (x.Precision() == QUDA_SINGLE_PRECISION)

       axpby((float)a, (float*)x.V(), 1.0f, (float*)y.V(), x.Length());

     else

       errorQuda("Precision type %d not implemented", x.Precision());

   }


   void xpayCpu(const cpuColorSpinorField &x, const double &a,

                cpuColorSpinorField &y) {

     if (x.Precision() == QUDA_DOUBLE_PRECISION)

       axpby(1.0, (double*)x.V(), a, (double*)y.V(), x.Length());

     else if (x.Precision() == QUDA_SINGLE_PRECISION)

       axpby(1.0f, (float*)x.V(), (float)a, (float*)y.V(), x.Length());

     else

       errorQuda("Precision type %d not implemented", x.Precision());

   }


   void mxpyCpu(const cpuColorSpinorField &x, cpuColorSpinorField &y) {

     if (x.Precision() == QUDA_DOUBLE_PRECISION)

       axpby(-1.0, (double*)x.V(), 1.0, (double*)y.V(), x.Length());

     else if (x.Precision() == QUDA_SINGLE_PRECISION)

       axpby(-1.0f, (float*)x.V(), 1.0f, (float*)y.V(), x.Length());

     else

       errorQuda("Precision type %d not implemented", x.Precision());

   }


   void axCpu(const double &a, cpuColorSpinorField &x) {

     if (x.Precision() == QUDA_DOUBLE_PRECISION)

       axpby(0.0, (double*)x.V(), a, (double*)x.V(), x.Length());

     else if (x.Precision() == QUDA_SINGLE_PRECISION)

       axpby(0.0f, (float*)x.V(), (float)a, (float*)x.V(), x.Length());

     else

       errorQuda("Precision type %d not implemented", x.Precision());

   }


   template <typename Float>

   void caxpby(const std::complex<Float> &a, const std::complex<Float> *x,

               const std::complex<Float> &b, std::complex<Float> *y, int N) {


     for (int i=0; i<N; i++) {

       y[i] = a*x[i] + b*y[i];

     }


   }


   void caxpyCpu(const Complex &a, const cpuColorSpinorField &x,

                 cpuColorSpinorField &y) {


     if ( x.Precision() == QUDA_DOUBLE_PRECISION)

       caxpby(a, (Complex*)x.V(), Complex(1.0),

              (Complex*)y.V(), x.Length()/2);

     else if (x.Precision() == QUDA_SINGLE_PRECISION)

       caxpby((std::complex<float>)a, (std::complex<float>*)x.V(), std::complex<float>(1.0),

              (std::complex<float>*)y.V(), x.Length()/2);

     else

       errorQuda("Precision type %d not implemented", x.Precision());

   }


   void caxpbyCpu(const Complex &a, const cpuColorSpinorField &x,

                  const Complex &b, cpuColorSpinorField &y) {


     if ( x.Precision() == QUDA_DOUBLE_PRECISION)

       caxpby(a, (Complex*)x.V(), b, (Complex*)y.V(), x.Length()/2);

     else if (x.Precision() == QUDA_SINGLE_PRECISION)

       caxpby((std::complex<float>)a, (std::complex<float>*)x.V(), (std::complex<float>)b,

              (std::complex<float>*)y.V(), x.Length()/2);

     else

       errorQuda("Precision type %d not implemented", x.Precision());

   }


   template <typename Float>

   void caxpbypcz(const std::complex<Float> &a, const std::complex<Float> *x,

                  const std::complex<Float> &b, const std::complex<Float> *y,

                  const std::complex<Float> &c, std::complex<Float> *z, int N) {


     for (int i=0; i<N; i++) {

       z[i] = a*x[i] + b*y[i] + c*z[i];

     }


   }


   void cxpaypbzCpu(const cpuColorSpinorField &x, const Complex &a,

                    const cpuColorSpinorField &y, const Complex &b,

                    cpuColorSpinorField &z) {


     if (x.Precision() == QUDA_DOUBLE_PRECISION)

       caxpbypcz(Complex(1, 0), (Complex*)x.V(), a, (Complex*)y.V(),

                 b, (Complex*)z.V(), x.Length()/2);

     else if (x.Precision() == QUDA_SINGLE_PRECISION)

       caxpbypcz(std::complex<float>(1, 0), (std::complex<float>*)x.V(), (std::complex<float>)a, (std::complex<float>*)y.V(),

                 (std::complex<float>)b, (std::complex<float>*)z.V(), x.Length()/2);

     else

       errorQuda("Precision type %d not implemented", x.Precision());

   }


   void axpyBzpcxCpu(const double &a, cpuColorSpinorField& x, cpuColorSpinorField& y,

                     const double &b, const cpuColorSpinorField& z, const double &c) {

     axpyCpu(a, x, y);

     axpbyCpu(b, z, c, x);

   }


   // performs the operations: {y[i] = a*x[i] + y[i]; x[i] = z[i] + b*x[i]}

   void axpyZpbxCpu(const double &a, cpuColorSpinorField &x, cpuColorSpinorField &y,

                    const cpuColorSpinorField &z, const double &b) {

     axpyCpu(a, x, y);

     xpayCpu(z, b, x);

   }


   // performs the operation z[i] = a*x[i] + b*y[i] + z[i] and y[i] -= b*w[i]

   void caxpbypzYmbwCpu(const Complex &a, const cpuColorSpinorField &x, const Complex &b,

                        cpuColorSpinorField &y, cpuColorSpinorField &z, const cpuColorSpinorField &w) {


     if (x.Precision() == QUDA_DOUBLE_PRECISION)

       caxpbypcz(a, (Complex*)x.V(), b, (Complex*)y.V(),

                 Complex(1, 0), (Complex*)z.V(), x.Length()/2);

     else if (x.Precision() == QUDA_SINGLE_PRECISION)

       caxpbypcz((std::complex<float>)a, (std::complex<float>*)x.V(),

                 (std::complex<float>)b, (std::complex<float>*)y.V(),

                 (std::complex<float>)(1.0f), (std::complex<float>*)z.V(), x.Length()/2);

     else

       errorQuda("Precision type %d not implemented", x.Precision());


     caxpyCpu(-b, w, y);

   }


   template <typename Float>

   double norm(const Float *a, const int N) {

     double norm2 = 0;

     for (int i=0; i<N; i++) norm2 += a[i]*a[i];

     return norm2;

   }


   double normCpu(const cpuColorSpinorField &a) {

     double norm2 = 0.0;

     if (a.Precision() == QUDA_DOUBLE_PRECISION)

       norm2 = norm((double*)a.V(), a.Length());

     else if (a.Precision() == QUDA_SINGLE_PRECISION)

       norm2 = norm((float*)a.V(), a.Length());

     else

       errorQuda("Precision type %d not implemented", a.Precision());

     reduceDouble(norm2);

     return norm2;

   }


   double axpyNormCpu(const double &a, const cpuColorSpinorField &x,

                      cpuColorSpinorField &y) {

     axpyCpu(a, x, y);

     return normCpu(y);

   }


   template <typename Float>

   double reDotProduct(const Float *a, const Float *b, const int N) {

     double dot = 0;

     for (int i=0; i<N; i++) dot += a[i]*b[i];

     return dot;

   }


   double reDotProductCpu(const cpuColorSpinorField &a, const cpuColorSpinorField &b) {

     double dot = 0.0;

     if (a.Precision() == QUDA_DOUBLE_PRECISION)

       dot = reDotProduct((double*)a.V(), (double*)b.V(), a.Length());

     else if (a.Precision() == QUDA_SINGLE_PRECISION)

       dot = reDotProduct((float*)a.V(), (float*)b.V(), a.Length());

     else

       errorQuda("Precision type %d not implemented", a.Precision());

     reduceDouble(dot);

     return dot;

   }


   // First performs the operation y[i] = x[i] - y[i]

   // Second returns the norm of y

   double xmyNormCpu(const cpuColorSpinorField &x, cpuColorSpinorField &y) {

     xpayCpu(x, -1, y);

     return normCpu(y);

   }


   template <typename Float>

   Complex cDotProduct(const std::complex<Float> *a, const std::complex<Float> *b, const int N) {

     quda::Complex dot = 0;

     for (int i=0; i<N; i++) dot += conj(a[i])*b[i];

     return dot;

   }


   Complex cDotProductCpu(const cpuColorSpinorField &a, const cpuColorSpinorField &b) {

     Complex dot = 0.0;

     if (a.Precision() == QUDA_DOUBLE_PRECISION)

       dot = cDotProduct((Complex*)a.V(), (Complex*)b.V(), a.Length()/2);

     else if (a.Precision() == QUDA_SINGLE_PRECISION)

       dot = cDotProduct((std::complex<float>*)a.V(), (std::complex<float>*)b.V(), a.Length()/2);

     else

       errorQuda("Precision type %d not implemented", a.Precision());

     reduceDoubleArray((double*)&dot, 2);

     return dot;

   }


   // First performs the operation y = x + a*y

   // Second returns complex dot product (z,y)

   Complex xpaycDotzyCpu(const cpuColorSpinorField &x, const double &a,

                               cpuColorSpinorField &y, const cpuColorSpinorField &z) {

     xpayCpu(x, a, y);

     return cDotProductCpu(z,y);

   }


   double3 cDotProductNormACpu(const cpuColorSpinorField &a, const cpuColorSpinorField &b) {

     Complex dot = cDotProductCpu(a, b);

     double norm = normCpu(a);

     return make_double3(real(dot), imag(dot), norm);

   }


   double3 cDotProductNormBCpu(const cpuColorSpinorField &a, const cpuColorSpinorField &b) {

     Complex dot = cDotProductCpu(a, b);

     double norm = normCpu(b);

     return make_double3(real(dot), imag(dot), norm);

   }


   // This convoluted kernel does the following: z += a*x + b*y, y -= b*w, norm = (y,y), dot = (u, y)

   double3 caxpbypzYmbwcDotProductUYNormYCpu(const Complex &a, const cpuColorSpinorField &x,

                                             const Complex &b, cpuColorSpinorField &y,

                                             cpuColorSpinorField &z, const cpuColorSpinorField &w,

                                             const cpuColorSpinorField &u) {


     caxpbypzYmbwCpu(a, x, b, y, z, w);

     return cDotProductNormBCpu(u, y);

   }


   void cabxpyAxCpu(const double &a, const Complex &b, cpuColorSpinorField &x, cpuColorSpinorField &y) {

     axCpu(a, x);

     caxpyCpu(b, x, y);

   }


   double caxpyNormCpu(const Complex &a, cpuColorSpinorField &x,

                       cpuColorSpinorField &y) {

     caxpyCpu(a, x, y);

     return norm2(y);

   }


   double caxpyXmazNormXCpu(const Complex &a, cpuColorSpinorField &x,

                            cpuColorSpinorField &y, cpuColorSpinorField &z) {

     caxpyCpu(a, x, y);

     caxpyCpu(-a, z, x);

     return norm2(x);

   }


   void caxpyXmazCpu(const Complex &a, cpuColorSpinorField &x,

                     cpuColorSpinorField &y, cpuColorSpinorField &z) {

     caxpyCpu(a, x, y);

     caxpyCpu(-a, z, x);

   }


   double cabxpyAxNormCpu(const double &a, const Complex &b, cpuColorSpinorField &x, cpuColorSpinorField &y) {

     axCpu(a, x);

     caxpyCpu(b, x, y);

     return norm2(y);

   }


   void caxpbypzCpu(const Complex &a, cpuColorSpinorField &x, const Complex &b, cpuColorSpinorField &y,

                    cpuColorSpinorField &z) {

     caxpyCpu(a, x, z);

     caxpyCpu(b, y, z);

   }


   void caxpbypczpwCpu(const Complex &a, cpuColorSpinorField &x, const Complex &b, cpuColorSpinorField &y,

                       const Complex &c, cpuColorSpinorField &z, cpuColorSpinorField &w) {

     caxpyCpu(a, x, w);

     caxpyCpu(b, y, w);

     caxpyCpu(c, z, w);


   }


   Complex caxpyDotzyCpu(const Complex &a, cpuColorSpinorField &x, cpuColorSpinorField &y,

                         cpuColorSpinorField &z) {

     caxpyCpu(a, x, y);

     return cDotProductCpu(z, y);

   }


   template <typename Float>

   double3 HeavyQuarkResidualNorm(const Float *x, const Float *r, const int volume, const int Nint) {


     double3 sum = make_double3(0.0, 0.0, 0.0);

     for (int i = 0; i<volume; i++) {

       double x2 = 0;

       double r2 = 0;


       for (int j=0; j<Nint; j++) { // loop over internal degrees of freedom

         int k = i*Nint + j;

         x2 += x[k]*x[k];

         r2 += r[k]*r[k];

       }


       sum.x += x2;

       sum.y += r2;

       sum.z += (x2 > 0.0) ? (r2 / x2) : 1.0;

     }

     return sum;

   }


   double3 HeavyQuarkResidualNormCpu(cpuColorSpinorField &x, cpuColorSpinorField &r) {

     double3 rtn;

     if (x.Precision() == QUDA_DOUBLE_PRECISION) {

       rtn = HeavyQuarkResidualNorm<double>((const double*)(x.V()), (const double*)(r.V()),

                                            x.Volume(), 2*x.Ncolor()*x.Nspin());

     } else if (x.Precision() == QUDA_SINGLE_PRECISION) {

       rtn = HeavyQuarkResidualNorm<float>((const float*)(x.V()), (const float*)(r.V()),

                                           x.Volume(), 2*x.Ncolor()*x.Nspin());

     } else {

       errorQuda("Precision type %d not implemented", x.Precision());

     }

 #ifdef MULTI_GPU

     rtn.z /= (x.Volume()*comm_size());

 #else

     rtn.z /= x.Volume();

 #endif

     reduceDoubleArray((double*)&rtn, 3);


     return rtn;

   }


   double3 HeavyQuarkResidualNormCpu(cpuColorSpinorField &x, cpuColorSpinorField &y, cpuColorSpinorField &r) {

     cpuColorSpinorField tmp(x);

     xpyCpu(y, tmp);

     return HeavyQuarkResidualNormCpu(tmp, r);

   }


 } // namespace quda


quda::caxpbypcz
void caxpbypcz(const std::complex< Float > &a, const std::complex< Float > *x, const std::complex< Float > &b, const std::complex< Float > *y, const std::complex< Float > &c, std::complex< Float > *z, int N)
Definition: blas_cpu.cpp:105

quda::caxpbypzYmbwCpu
void caxpbypzYmbwCpu(const Complex &, const cpuColorSpinorField &, const Complex &, cpuColorSpinorField &, cpuColorSpinorField &, const cpuColorSpinorField &)
Definition: blas_cpu.cpp:143

quda::mxpyCpu
void mxpyCpu(const cpuColorSpinorField &x, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:51

y
int y[4]
Definition: staggered_dslash_core.h:356

quda::xpaycDotzyCpu
Complex xpaycDotzyCpu(const cpuColorSpinorField &x, const double &a, cpuColorSpinorField &y, const cpuColorSpinorField &z)
Definition: blas_cpu.cpp:231

quda::norm
__host__ __device__ ValueType norm(const complex< ValueType > &z)
Returns the magnitude of z squared.
Definition: complex_quda.h:859

quda::cabxpyAxCpu
void cabxpyAxCpu(const double &a, const Complex &b, cpuColorSpinorField &x, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:259

errorQuda
#define errorQuda(...)
Definition: util_quda.h:73

color_spinor_field.h

quda::axpby
void axpby(const Float &a, const Float *x, const Float &b, Float *y, const int N)
Definition: blas_cpu.cpp:8

quda::xpayCpu
void xpayCpu(const cpuColorSpinorField &x, const double &a, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:41

quda::Complex
std::complex< double > Complex
Definition: eig_variables.h:13

quda::xpyCpu
void xpyCpu(const cpuColorSpinorField &x, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:22

x2
int x2
Definition: asym_wilson_clover_dslash_dagger_fermi_core.h:393

quda::ColorSpinorField::Length
int Length() const
Definition: color_spinor_field.h:250

quda::caxpby
void caxpby(const std::complex< Float > &a, const std::complex< Float > *x, const std::complex< Float > &b, std::complex< Float > *y, int N)
Definition: blas_cpu.cpp:70

quda::axpyZpbxCpu
void axpyZpbxCpu(const double &a, cpuColorSpinorField &x, cpuColorSpinorField &y, const cpuColorSpinorField &z, const double &b)
Definition: blas_cpu.cpp:136

quda::cDotProduct
Complex cDotProduct(const std::complex< Float > *a, const std::complex< Float > *b, const int N)
Definition: blas_cpu.cpp:211

comm_size
int comm_size(void)
Definition: comm_mpi.cpp:86

tmp
cudaColorSpinorField * tmp
Definition: staggered_dslash_test.cpp:48

quda::caxpbyCpu
void caxpbyCpu(const Complex &a, const cpuColorSpinorField &x, const Complex &b, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:92

quda::caxpbypzYmbwcDotProductUYNormYCpu
double3 caxpbypzYmbwcDotProductUYNormYCpu(const Complex &a, const cpuColorSpinorField &x, const Complex &b, cpuColorSpinorField &y, cpuColorSpinorField &z, const cpuColorSpinorField &w, const cpuColorSpinorField &u)
Definition: blas_cpu.cpp:250

testing::internal::Float
FloatingPoint< float > Float
Definition: gtest.h:7350

quda::cDotProductCpu
Complex cDotProductCpu(const cpuColorSpinorField &, const cpuColorSpinorField &)
Definition: blas_cpu.cpp:217

reduceDoubleArray
void reduceDoubleArray(double *, const int len)
Definition: face_buffer.cpp:532

face_quda.h

quda::cxpaypbzCpu
void cxpaypbzCpu(const cpuColorSpinorField &x, const Complex &b, const cpuColorSpinorField &y, const Complex &c, cpuColorSpinorField &z)
Definition: blas_cpu.cpp:115

quda::caxpbypzCpu
void caxpbypzCpu(const Complex &, cpuColorSpinorField &, const Complex &, cpuColorSpinorField &, cpuColorSpinorField &)
Definition: blas_cpu.cpp:289

quda::caxpyCpu
void caxpyCpu(const Complex &a, const cpuColorSpinorField &x, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:79

quda::axpbyCpu
void axpbyCpu(const double &a, const cpuColorSpinorField &x, const double &b, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:12

quda::reDotProduct
double reDotProduct(const Float *a, const Float *b, const int N)
Definition: blas_cpu.cpp:185

quda::axpyBzpcxCpu
void axpyBzpcxCpu(const double &a, cpuColorSpinorField &x, cpuColorSpinorField &y, const double &b, const cpuColorSpinorField &z, const double &c)
Definition: blas_cpu.cpp:129

x
int x[4]
Definition: hisq_paths_force_core.h:99

quda::axCpu
void axCpu(const double &a, cpuColorSpinorField &x)
Definition: blas_cpu.cpp:60

quda::cabxpyAxNormCpu
double cabxpyAxNormCpu(const double &a, const Complex &b, cpuColorSpinorField &x, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:283

blas_quda.h

quda::caxpyXmazCpu
void caxpyXmazCpu(const Complex &a, cpuColorSpinorField &x, cpuColorSpinorField &y, cpuColorSpinorField &z)
Definition: blas_cpu.cpp:277

quda::caxpbypczpwCpu
void caxpbypczpwCpu(const Complex &, cpuColorSpinorField &, const Complex &, cpuColorSpinorField &, const Complex &, cpuColorSpinorField &, cpuColorSpinorField &)
Definition: blas_cpu.cpp:295

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:50

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:49

quda::caxpyNormCpu
double caxpyNormCpu(const Complex &a, cpuColorSpinorField &x, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:264

quda::ColorSpinorField::Precision
QudaPrecision Precision() const
Definition: color_spinor_field.h:242

reduceDouble
void reduceDouble(double &)
Definition: face_buffer.cpp:530

quda::normCpu
double normCpu(const cpuColorSpinorField &b)
Definition: blas_cpu.cpp:166

quda::HeavyQuarkResidualNorm
double3 HeavyQuarkResidualNorm(const Float *x, const Float *r, const int volume, const int Nint)
Definition: blas_cpu.cpp:310

quda::axpyNormCpu
double axpyNormCpu(const double &a, const cpuColorSpinorField &x, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:178

quda::ColorSpinorField::Volume
int Volume() const
Definition: color_spinor_field.h:253

quda::reDotProductCpu
double reDotProductCpu(const cpuColorSpinorField &a, const cpuColorSpinorField &b)
Definition: blas_cpu.cpp:191

quda::cDotProductNormACpu
double3 cDotProductNormACpu(const cpuColorSpinorField &a, const cpuColorSpinorField &b)
Definition: blas_cpu.cpp:237

quda::caxpyXmazNormXCpu
double caxpyXmazNormXCpu(const Complex &a, cpuColorSpinorField &x, cpuColorSpinorField &y, cpuColorSpinorField &z)
Definition: blas_cpu.cpp:270

quda::HeavyQuarkResidualNormCpu
double3 HeavyQuarkResidualNormCpu(cpuColorSpinorField &x, cpuColorSpinorField &r)
Definition: blas_cpu.cpp:331

quda::ColorSpinorField::Nspin
int Nspin() const
Definition: color_spinor_field.h:244

quda::xmyNormCpu
double xmyNormCpu(const cpuColorSpinorField &a, cpuColorSpinorField &b)
Definition: blas_cpu.cpp:205

quda::conj
__host__ __device__ ValueType conj(ValueType x)
Definition: complex_quda.h:115

quda::caxpyDotzyCpu
Complex caxpyDotzyCpu(const Complex &a, cpuColorSpinorField &x, cpuColorSpinorField &y, cpuColorSpinorField &z)
Definition: blas_cpu.cpp:303

quda::cDotProductNormBCpu
double3 cDotProductNormBCpu(const cpuColorSpinorField &a, const cpuColorSpinorField &b)
Definition: blas_cpu.cpp:243

quda::ColorSpinorField::Ncolor
int Ncolor() const
Definition: color_spinor_field.h:243

quda::norm2
double norm2(const ColorSpinorField &)
Definition: color_spinor_field.cpp:486

quda::axpyCpu
void axpyCpu(const double &a, const cpuColorSpinorField &x, cpuColorSpinorField &y)
Definition: blas_cpu.cpp:31

quda::cpuColorSpinorField
Definition: color_spinor_field.h:517

quda::ColorSpinorField::V
void * V()
Definition: color_spinor_field.h:262