v0.9.0/doc/color__spinor__util_8cu_source.html

 #include <color_spinor_field.h>
 #include <color_spinor_field_order.h>
 #include <index_helper.cuh>

 namespace quda {

   using namespace colorspinor;

   template <class T>
   void random(T &t) {
     for (int parity=0; parity<t.Nparity(); parity++) {
       for (int x_cb=0; x_cb<t.VolumeCB(); x_cb++) {
   for (int s=0; s<t.Nspin(); s++) {
     for (int c=0; c<t.Ncolor(); c++) {
       t(parity,x_cb,s,c).real(comm_drand());
       t(parity,x_cb,s,c).imag(comm_drand());
     }
   }
       }
     }
   }

   template <class T>
   void point(T &t, int x, int s, int c) { t(x%2, x/2, s, c) = 1.0; }

   template <class T>
   void constant(T &t, int k, int s, int c) {
     for (int parity=0; parity<t.Nparity(); parity++) {
       for (int x_cb=0; x_cb<t.VolumeCB(); x_cb++) {
   // set all color-spin components to zero
   for (int s2=0; s2<t.Nspin(); s2++) {
     for (int c2=0; c2<t.Ncolor(); c2++) {
       t(parity,x_cb,s2,c2) = 0.0;
     }
   }
   t(parity,x_cb,s,c) = k; // now set the one we want
       }
     }
   }

   template <class P>
   void sin(P &p, int d, int n, int offset) {
     int coord[4];
     int X[4] = { p.X(0), p.X(1), p.X(2), p.X(3)};
     X[0] *= (p.Nparity() == 1) ? 2 : 1; // need full lattice dims

     for (int parity=0; parity<p.Nparity(); parity++) {
       for (int x_cb=0; x_cb<p.VolumeCB(); x_cb++) {
   getCoords(coord, x_cb, X, parity);

   double mode = n * (double)coord[d] / X[d];
   double k = (double)offset + sin (M_PI * mode);

   for (int s=0; s<p.Nspin(); s++)
     for (int c=0; c<p.Ncolor(); c++)
       p(parity, x_cb, s, c) = k;
       }
     }
   }

   // print out the vector at volume point x
   template <typename Float, int nSpin, int nColor, QudaFieldOrder order>
   void genericSource(cpuColorSpinorField &a, QudaSourceType sourceType, int x, int s, int c) {
     FieldOrderCB<Float,nSpin,nColor,1,order> A(a);
     if (sourceType == QUDA_RANDOM_SOURCE) random(A);
     else if (sourceType == QUDA_POINT_SOURCE) point(A, x, s, c);
     else if (sourceType == QUDA_CONSTANT_SOURCE) constant(A, x, s, c);
     else if (sourceType == QUDA_SINUSOIDAL_SOURCE) sin(A, x, s, c);
     else errorQuda("Unsupported source type %d", sourceType);
   }

   template <typename Float, int nSpin, QudaFieldOrder order>
   void genericSource(cpuColorSpinorField &a, QudaSourceType sourceType, int x, int s, int c) {
     if (a.Ncolor() == 2) {
       genericSource<Float,nSpin,2,order>(a,sourceType, x, s, c);
     } else if (a.Ncolor() == 3) {
       genericSource<Float,nSpin,3,order>(a,sourceType, x, s, c);
     } else if (a.Ncolor() == 4) {
       genericSource<Float,nSpin,4,order>(a,sourceType, x, s, c);
     } else if (a.Ncolor() == 8) {
       genericSource<Float,nSpin,8,order>(a,sourceType, x, s, c);
     } else if (a.Ncolor() == 12) {
       genericSource<Float,nSpin,12,order>(a,sourceType, x, s, c);
     } else if (a.Ncolor() == 16) {
       genericSource<Float,nSpin,16,order>(a,sourceType, x, s, c);
     } else if (a.Ncolor() == 20) {
       genericSource<Float,nSpin,20,order>(a,sourceType, x, s, c);
     } else if (a.Ncolor() == 24) {
       genericSource<Float,nSpin,24,order>(a,sourceType, x, s, c);
     } else if (a.Ncolor() == 32) {
       genericSource<Float,nSpin,32,order>(a,sourceType, x, s, c);
     } else {
       errorQuda("Unsupported nColor=%d\n", a.Ncolor());
     }
   }

   template <typename Float, QudaFieldOrder order>
   void genericSource(cpuColorSpinorField &a, QudaSourceType sourceType, int x, int s, int c) {
     if (a.Nspin() == 1) {
       genericSource<Float,1,order>(a,sourceType, x, s, c);
     } else if (a.Nspin() == 2) {
       genericSource<Float,2,order>(a,sourceType, x, s, c);
     } else if (a.Nspin() == 4) {
       genericSource<Float,4,order>(a,sourceType, x, s, c);
     } else {
       errorQuda("Unsupported nSpin=%d\n", a.Nspin());
     }
   }

   template <typename Float>
   void genericSource(cpuColorSpinorField &a, QudaSourceType sourceType, int x, int s, int c) {
     if (a.FieldOrder() == QUDA_SPACE_SPIN_COLOR_FIELD_ORDER) {
       genericSource<Float,QUDA_SPACE_SPIN_COLOR_FIELD_ORDER>(a,sourceType, x, s, c);
     } else {
       errorQuda("Unsupported field order %d\n", a.FieldOrder());
     }

   }

   void genericSource(cpuColorSpinorField &a, QudaSourceType sourceType, int x, int s, int c) {

     if (a.Precision() == QUDA_DOUBLE_PRECISION) {
       genericSource<double>(a,sourceType, x, s, c);
     } else if (a.Precision() == QUDA_SINGLE_PRECISION) {
       genericSource<float>(a,sourceType, x, s, c);
     } else {
       errorQuda("Precision not supported");
     }

   }


   template <class U, class V>
   int compareSpinor(const U &u, const V &v, const int tol) {
     int fail_check = 16*tol;
     int *fail = new int[fail_check];
     for (int f=0; f<fail_check; f++) fail[f] = 0;

     int N = 2*u.Nspin()*u.Ncolor();
     int *iter = new int[N];
     for (int i=0; i<N; i++) iter[i] = 0;

     for (int parity=0; parity<v.Nparity(); parity++) {
       for (int x_cb=0; x_cb<u.VolumeCB(); x_cb++) {

   for (int s=0; s<u.Nspin(); s++) {
     for (int c=0; c<u.Ncolor(); c++) {
       for (int z=0; z<2; z++) {
         int j = (s*u.Ncolor() + c)*2+z;

         double diff = z==0 ? fabs(u(parity,x_cb,s,c,z).real() - v(parity,x_cb,s,c,z).real()) :
     fabs(u(parity,x_cb,s,c).imag() - v(parity,x_cb,s,c).imag());

         for (int f=0; f<fail_check; f++) {
     if (diff > pow(10.0,-(f+1)/(double)tol)) {
       fail[f]++;
     }
         }

         if (diff > 1e-3) iter[j]++;
       }
     }
   }
       }
     }

     // reduce over all processes
     for (int i=0; i<N; i++) comm_allreduce_int(&iter[i]);
     for (int f=0; f<fail_check; f++) comm_allreduce_int(&fail[f]);

     for (int i=0; i<N; i++) printfQuda("%d fails = %d\n", i, iter[i]);

     int accuracy_level =0;
     for (int f=0; f<fail_check; f++) {
       if (fail[f] == 0) accuracy_level = f+1;
     }

     size_t total = u.Nparity()*u.VolumeCB()*N*comm_size();
     for (int f=0; f<fail_check; f++) {
       printfQuda("%e Failures: %d / %lu  = %e\n", pow(10.0,-(f+1)/(double)tol),
      fail[f], total, fail[f] / (double)total);
     }

     delete []iter;
     delete []fail;

     return accuracy_level;
   }

   template <typename oFloat, typename iFloat, QudaFieldOrder order>
   int genericCompare(const cpuColorSpinorField &a, const cpuColorSpinorField &b, int tol) {
     int ret = 0;
     if (a.Ncolor() == 3) {
       const int Nc = 3;
       if (a.Nspin() == 4) {
   const int Ns = 4;
   FieldOrderCB<oFloat,Ns,Nc,1,order> A(a);
   FieldOrderCB<iFloat,Ns,Nc,1,order> B(b);
   ret = compareSpinor(A, B, tol);
       } else if (a.Nspin() == 1) {
   const int Ns = 1;
   FieldOrderCB<oFloat,Ns,Nc,1,order> A(a);
   FieldOrderCB<iFloat,Ns,Nc,1,order> B(b);
   ret = compareSpinor(A, B, tol);
       }
     } else {
       errorQuda("Number of colors %d not supported", a.Ncolor());
     }
     return ret;
   }


   template <typename oFloat, typename iFloat>
   int genericCompare(const cpuColorSpinorField &a, const cpuColorSpinorField &b, int tol) {
     int ret = 0;
     if (a.FieldOrder() == QUDA_SPACE_SPIN_COLOR_FIELD_ORDER &&
   a.FieldOrder() == QUDA_SPACE_SPIN_COLOR_FIELD_ORDER) {
       ret = genericCompare<oFloat,iFloat,QUDA_SPACE_SPIN_COLOR_FIELD_ORDER>(a, b, tol);
     } else {
       errorQuda("Unsupported field order %d\n", a.FieldOrder());
     }
     return ret;
   }


   template <typename oFloat>
   int genericCompare(const cpuColorSpinorField &a, const cpuColorSpinorField &b, int tol) {
     int ret = 0;
     if (b.Precision() == QUDA_DOUBLE_PRECISION) {
       ret = genericCompare<oFloat,double>(a, b, tol);
     } else if (b.Precision() == QUDA_SINGLE_PRECISION) {
       ret = genericCompare<oFloat,float>(a, b, tol);
     } else {
       errorQuda("Precision not supported");
     }
     return ret;
   }


   int genericCompare(const cpuColorSpinorField &a, const cpuColorSpinorField &b, int tol) {
     int ret = 0;
     if (a.Precision() == QUDA_DOUBLE_PRECISION) {
       ret = genericCompare<double>(a, b, tol);
     } else if (a.Precision() == QUDA_SINGLE_PRECISION) {
       ret = genericCompare<float>(a, b, tol);
     } else {
       errorQuda("Precision not supported");
     }
     return ret;
   }


   template <class Order>
   void print_vector(const Order &o, unsigned int x) {

     int x_cb = x / o.Nparity();
     int parity = x%o.Nparity();

     for (int s=0; s<o.Nspin(); s++) {
       std::cout << "x = " << x << ", s = " << s << ", { ";
       for (int c=0; c<o.Ncolor(); c++) {
   std::cout << o(parity, x_cb, s, c) ;
   std::cout << ((c<o.Ncolor()-1) ? " , "  : " " ) ;
       }
       std::cout << "}" << std::endl;
     }

   }

   // print out the vector at volume point x
   template <typename Float, QudaFieldOrder order>
   void genericPrintVector(cpuColorSpinorField &a, unsigned int x) {
     if (a.Ncolor() == 3 && a.Nspin() == 4)  {
       FieldOrderCB<Float,4,3,1,order> A(a);
       print_vector(A, x);
     }
     else if (a.Ncolor() == 2 && a.Nspin() == 2) {
       FieldOrderCB<Float,2,2,1,order> A(a);
       print_vector(A, x);
     }
     else if (a.Ncolor() == 24 && a.Nspin() == 2) {
       FieldOrderCB<Float,2,24,1,order> A(a);
       print_vector(A, x);
     }
     else if (a.Ncolor() == 6 && a.Nspin() == 4) {
       FieldOrderCB<Float,4,6,1,order> A(a);
       print_vector(A, x);
     }
     else if (a.Ncolor() == 72 && a.Nspin() == 4) {
       FieldOrderCB<Float,4,72,1,order> A(a);
       print_vector(A, x);
     }
     else if (a.Ncolor() == 576 && a.Nspin() == 2) {
       FieldOrderCB<Float,2,576,1,order> A(a);
       print_vector(A, x);
     }
     else {
       errorQuda("Not supported Ncolor = %d, Nspin = %d", a.Ncolor(), a.Nspin());
     }
   }

   // print out the vector at volume point x
   template <typename Float>
   void genericPrintVector(cpuColorSpinorField &a, unsigned int x) {
     if (a.FieldOrder() == QUDA_SPACE_SPIN_COLOR_FIELD_ORDER) {
       genericPrintVector<Float,QUDA_SPACE_SPIN_COLOR_FIELD_ORDER>(a,x);
     } else {
       errorQuda("Unsupported field order %d\n", a.FieldOrder());
     }
   }

   // print out the vector at volume point x
   void genericPrintVector(cpuColorSpinorField &a, unsigned int x) {
     if (a.Precision() == QUDA_DOUBLE_PRECISION) {
       genericPrintVector<double>(a,x);
     } else if (a.Precision() == QUDA_SINGLE_PRECISION) {
       genericPrintVector<float>(a,x);
     } else {
       errorQuda("Precision %d not implemented", a.Precision());
     }
   }

 } // namespace quda
quda::genericCompare
int genericCompare(const cpuColorSpinorField &a, const cpuColorSpinorField &b, int tol)
Definition: color_spinor_util.cu:204

quda::print_vector
void print_vector(const Order &o, unsigned int x)
Definition: color_spinor_util.cu:267

errorQuda
#define errorQuda(...)
Definition: util_quda.h:90

color_spinor_field.h

QUDA_SPACE_SPIN_COLOR_FIELD_ORDER
Definition: enum_quda.h:321

QUDA_POINT_SOURCE
Definition: enum_quda.h:345

mode
static __inline__ enum cudaRoundMode mode
Definition: CMakeCUDACompilerId.cpp1.ii:12013

quda::compareSpinor
int compareSpinor(const U &u, const V &v, const int tol)
Definition: color_spinor_util.cu:147

total
size_t * total
Definition: CMakeCUDACompilerId.cpp1.ii:2545

z
int int z
Definition: CMakeCUDACompilerId.cpp1.ii:2637

QUDA_SINUSOIDAL_SOURCE
Definition: enum_quda.h:348

quda::colorspinor::FieldOrderCB
Definition: color_spinor_field_order.h:261

ret
return ret
Definition: CMakeCUDACompilerId.cpp1.ii:13161

quda
Definition: blas_cublas.h:6

QUDA_CONSTANT_SOURCE
Definition: enum_quda.h:347

offset
size_t size_t offset
Definition: CMakeCUDACompilerId.cpp1.ii:2497

QudaSourceType
enum QudaSourceType_s QudaSourceType

b
#define b
Definition: dw_dslash4_core.h:83

x
p x
Definition: CMakeCUDACompilerId.cpp1.ii:3011

comm_size
int comm_size(void)
Definition: comm_mpi.cpp:126

tol
double tol
Definition: test_util.cpp:1647

quda::sin
__host__ __device__ ValueType sin(ValueType x)
Definition: complex_quda.h:40

p
static __inline__ size_t p
Definition: CMakeCUDACompilerId.cpp1.ii:2995

quda::random
void random(T &t)
Definition: color_spinor_util.cu:13

V
int V
Definition: test_util.cpp:28

fused_exterior_ndeg_tm_dslash_cuda_gen.i
int i
start here
Definition: fused_exterior_ndeg_tm_dslash_cuda_gen.py:816

double
double
Definition: CMakeCUDACompilerId.cpp1.ii:8010

quda::pow
__host__ __device__ ValueType pow(ValueType x, ExponentType e)
Definition: complex_quda.h:100

f
int int int enum cudaChannelFormatKind f
Definition: CMakeCUDACompilerId.cpp1.ii:2637

comm_drand
double comm_drand(void)
Definition: comm_common.cpp:82

quda::genericSource
void genericSource(cpuColorSpinorField &a, QudaSourceType sourceType, int x, int s, int c)
Definition: color_spinor_util.cu:76

t
return t
Definition: CMakeCUDACompilerId.cpp1.ii:3149

quda::genericPrintVector
void genericPrintVector(cpuColorSpinorField &a, unsigned int x)
Definition: color_spinor_util.cu:285

X
int X
Definition: asym_wilson_clover_dslash_dagger_fermi_core.h:394

quda::point
void point(T &t, int x, int s, int c)
Definition: color_spinor_util.cu:30

coord
int coord[5]
Definition: asym_wilson_clover_dslash_dagger_fermi_core.h:393

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:61

index_helper.cuh

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:60

color_spinor_field_order.h

s
size_t s
Definition: CMakeCUDACompilerId.cpp1.ii:2229

n
int n
Definition: CMakeCUDACompilerId.cpp1.ii:8086

printfQuda
#define printfQuda(...)
Definition: util_quda.h:84

fabs
double fabs(double)

e
return e
Definition: CMakeCUDACompilerId.cpp1.ii:3026

comm_allreduce_int
void comm_allreduce_int(int *data)
Definition: comm_mpi.cpp:305

QUDA_RANDOM_SOURCE
Definition: enum_quda.h:346

c
const void * c
Definition: CMakeCUDACompilerId.cpp1.ii:2234

d
static __inline__ size_t size_t d
Definition: CMakeCUDACompilerId.cpp1.ii:3019

parity
QudaParity parity
Definition: covdev_test.cpp:53

a
#define a
Definition: dw_dslash4_core.h:82

quda::cpuColorSpinorField
Definition: color_spinor_field.h:789

quda::constant
void constant(T &t, int k, int s, int c)
Definition: color_spinor_util.cu:37

quda::getCoords
static __device__ __host__ void getCoords(int x[], int cb_index, const I X[], int parity)
Definition: index_helper.cuh:129