quda-ref/v1.0.0/blas__reference_8cpp_source.html

 #include <blas_reference.h>
 #include <stdio.h>
 #include <comm_quda.h>

 template <typename Float>
 inline void aXpY(Float a, Float *x, Float *y, int len)
 {
   for(int i=0; i < len; i++){ y[i] += a*x[i]; }
 }

 void axpy(double a, void *x, void *y, int len, QudaPrecision precision) {
   if( precision == QUDA_DOUBLE_PRECISION ) aXpY(a, (double *)x, (double *)y, len);
   else aXpY((float)a, (float *)x, (float *)y, len);
 }

 // performs the operation x[i] *= a
 template <typename Float>
 inline void aX(Float a, Float *x, int len) {
   for (int i=0; i<len; i++) x[i] *= a;
 }

 void ax(double a, void *x, int len, QudaPrecision precision) {
   if (precision == QUDA_DOUBLE_PRECISION) aX(a, (double*)x, len);
   else aX((float)a, (float*)x, len);
 }

 // performs the operation y[i] -= x[i] (minus x plus y)
 template <typename Float>
 inline void mXpY(Float *x, Float *y, int len) {
   for (int i=0; i<len; i++) y[i] -= x[i];
 }

 void mxpy(void* x, void* y, int len, QudaPrecision precision) {
   if (precision == QUDA_DOUBLE_PRECISION) mXpY((double*)x, (double*)y, len);
   else mXpY((float*)x, (float*)y, len);
 }


 // returns the square of the L2 norm of the vector
 template <typename Float>
 inline double norm2(Float *v, int len) {
   double sum=0.0;
   for (int i=0; i<len; i++) sum += v[i]*v[i];
   comm_allreduce(&sum);
   return sum;
 }

 double norm_2(void *v, int len, QudaPrecision precision) {
   if (precision == QUDA_DOUBLE_PRECISION) return norm2((double*)v, len);
   else return norm2((float*)v, len);
 }

 // performs the operation y[i] = x[i] + a*y[i]
 template <typename Float>
 static inline void xpay(Float *x, Float a, Float *y, int len) {
   for (int i=0; i<len; i++) y[i] = x[i] + a*y[i];
 }

 void xpay(void *x, double a, void *y, int length, QudaPrecision precision) {
   if (precision == QUDA_DOUBLE_PRECISION) xpay((double*)x, a, (double*)y, length);
   else xpay((float*)x, (float)a, (float*)y, length);
 }

 void cxpay(void *x, double _Complex a, void *y, int length, QudaPrecision precision)
 {
   if (precision == QUDA_DOUBLE_PRECISION) {
     xpay((double _Complex *)x, (double _Complex)a, (double _Complex *)y, length / 2);
   } else {
     xpay((float _Complex *)x, (float _Complex)a, (float _Complex *)y, length / 2);
   }
 }
sum
static void sum(Float *dst, Float *a, Float *b, int cnt)
Definition: dslash_util.h:8

QudaPrecision
enum QudaPrecision_s QudaPrecision

length
int length[]
Definition: gauge_force_test.cpp:34

ax
void ax(double a, void *x, int len, QudaPrecision precision)
Definition: blas_reference.cpp:22

comm_quda.h

aXpY
void aXpY(Float a, Float *x, Float *y, int len)
Definition: blas_reference.cpp:6

mXpY
void mXpY(Float *x, Float *y, int len)
Definition: blas_reference.cpp:29

xpay
static void xpay(Float *x, Float a, Float *y, int len)
Definition: blas_reference.cpp:55

cxpay
void cxpay(void *x, double _Complex a, void *y, int length, QudaPrecision precision)
Definition: blas_reference.cpp:64

blas_reference.h

norm2
double norm2(Float *v, int len)
Definition: blas_reference.cpp:41

mxpy
void mxpy(void *x, void *y, int len, QudaPrecision precision)
Definition: blas_reference.cpp:33

norm_2
double norm_2(void *v, int len, QudaPrecision precision)
Definition: blas_reference.cpp:48

aX
void aX(Float a, Float *x, int len)
Definition: blas_reference.cpp:18

axpy
void axpy(double a, void *x, void *y, int len, QudaPrecision precision)
Definition: blas_reference.cpp:11

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:62

comm_allreduce
void comm_allreduce(double *data)
Definition: comm_mpi.cpp:242