quda-ref/v1.0.0/clover__reference_8cpp_source.html

 #include <stdio.h>
 #include <stdlib.h>
 #include <math.h>
 #include <complex>

 #include <util_quda.h>
 #include <test_util.h>
 #include <wilson_dslash_reference.h>
 #include <blas_reference.h>


 template <typename sFloat, typename cFloat>
 void cloverReference(sFloat *out, cFloat *clover, sFloat *in, int parity) {
   int nSpin = 4;
   int nColor = 3;
   int N = nColor * nSpin / 2;
   int chiralBlock = N + 2*(N-1)*N/2;

   for (int i=0; i<Vh; i++) {
     std::complex<sFloat> *In = reinterpret_cast<std::complex<sFloat>*>(&in[i*nSpin*nColor*2]);
     std::complex<sFloat> *Out = reinterpret_cast<std::complex<sFloat>*>(&out[i*nSpin*nColor*2]);

     for (int chi=0; chi<nSpin/2; chi++) {
       cFloat *D = &clover[((parity*Vh + i)*2 + chi)*chiralBlock];
       std::complex<cFloat> *L = reinterpret_cast<std::complex<cFloat>*>(&D[N]);

       for (int s_col=0; s_col<nSpin/2; s_col++) { // 2 spins per chiral block
   for (int c_col=0; c_col<nColor; c_col++) {
     const int col = s_col * nColor + c_col;
     const int Col = chi*N + col;
     Out[Col] = 0.0;

     for (int s_row=0; s_row<nSpin/2; s_row++) { // 2 spins per chiral block
       for (int c_row=0; c_row<nColor; c_row++) {
         const int row = s_row * nColor + c_row;
         const int Row = chi*N + row;

         if (row == col) {
     Out[Col] += D[row] * In[Row];
         } else if (col < row) {
     int k = N*(N-1)/2 - (N-col)*(N-col-1)/2 + row - col - 1;
     Out[Col] += conj(L[k]) * In[Row];
         } else if (row < col) {
     int k = N*(N-1)/2 - (N-row)*(N-row-1)/2 + col - row - 1;
     Out[Col] += L[k] * In[Row];
         }
       }
     }

   }
       }

     }

   }

 }

 void apply_clover(void *out, void *clover, void *in, int parity, QudaPrecision precision) {

   switch (precision) {
   case QUDA_DOUBLE_PRECISION:
     cloverReference(static_cast<double*>(out), static_cast<double*>(clover), static_cast<double*>(in), parity);
     break;
   case QUDA_SINGLE_PRECISION:
     cloverReference(static_cast<float*>(out), static_cast<float*>(clover), static_cast<float*>(in), parity);
     break;
   default:
     errorQuda("Unsupported precision %d", precision);
   }

 }

 void clover_dslash(void *out, void **gauge, void *clover, void *in, int parity,
        int dagger, QudaPrecision precision, QudaGaugeParam &param) {
   void *tmp = malloc(Vh*spinorSiteSize*precision);

   wil_dslash(tmp, gauge, in, parity, dagger, precision, param);
   apply_clover(out, clover, tmp, parity, precision);

   free(tmp);
 }

 // Apply the even-odd preconditioned Wilson-clover operator
 void clover_matpc(void *out, void **gauge, void *clover, void *clover_inv, void *in, double kappa,
       QudaMatPCType matpc_type, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param) {

   double kappa2 = -kappa*kappa;
   void *tmp = malloc(Vh*spinorSiteSize*precision);

   switch(matpc_type) {
   case QUDA_MATPC_EVEN_EVEN:
     if (!dagger) {
       wil_dslash(tmp, gauge, in, 1, dagger, precision, gauge_param);
       apply_clover(out, clover_inv, tmp, 1, precision);
       wil_dslash(tmp, gauge, out, 0, dagger, precision, gauge_param);
       apply_clover(out, clover_inv, tmp, 0, precision);
     } else {
       apply_clover(tmp, clover_inv, in, 0, precision);
       wil_dslash(out, gauge, tmp, 1, dagger, precision, gauge_param);
       apply_clover(tmp, clover_inv, out, 1, precision);
       wil_dslash(out, gauge, tmp, 0, dagger, precision, gauge_param);
     }
     xpay(in, kappa2, out, Vh*spinorSiteSize, precision);
     break;
   case QUDA_MATPC_EVEN_EVEN_ASYMMETRIC:
     wil_dslash(out, gauge, in, 1, dagger, precision, gauge_param);
     apply_clover(tmp, clover_inv, out, 1, precision);
     wil_dslash(out, gauge, tmp, 0, dagger, precision, gauge_param);
     apply_clover(tmp, clover, in, 0, precision);
     xpay(tmp, kappa2, out, Vh*spinorSiteSize, precision);
     break;
   case QUDA_MATPC_ODD_ODD:
     if (!dagger) {
       wil_dslash(tmp, gauge, in, 0, dagger, precision, gauge_param);
       apply_clover(out, clover_inv, tmp, 0, precision);
       wil_dslash(tmp, gauge, out, 1, dagger, precision, gauge_param);
       apply_clover(out, clover_inv, tmp, 1, precision);
     } else {
       apply_clover(tmp, clover_inv, in, 1, precision);
       wil_dslash(out, gauge, tmp, 0, dagger, precision, gauge_param);
       apply_clover(tmp, clover_inv, out, 0, precision);
       wil_dslash(out, gauge, tmp, 1, dagger, precision, gauge_param);
     }
     xpay(in, kappa2, out, Vh*spinorSiteSize, precision);
     break;
   case QUDA_MATPC_ODD_ODD_ASYMMETRIC:
     wil_dslash(out, gauge, in, 0, dagger, precision, gauge_param);
     apply_clover(tmp, clover_inv, out, 0, precision);
     wil_dslash(out, gauge, tmp, 1, dagger, precision, gauge_param);
     apply_clover(tmp, clover, in, 1, precision);
     xpay(tmp, kappa2, out, Vh*spinorSiteSize, precision);
     break;
   default:
     errorQuda("Unsupoorted matpc=%d", matpc_type);
   }

   free(tmp);
 }

 // Apply the full Wilson-clover operator
 void clover_mat(void *out, void **gauge, void *clover, void *in, double kappa,
     int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param) {

   void *tmp = malloc(V*spinorSiteSize*precision);

   void *inEven = in;
   void *inOdd  = (char*)in + Vh*spinorSiteSize*precision;
   void *outEven = out;
   void *outOdd = (char*)out + Vh*spinorSiteSize*precision;
   void *tmpEven = tmp;
   void *tmpOdd = (char*)tmp + Vh*spinorSiteSize*precision;

   // Odd part
   wil_dslash(outOdd, gauge, inEven, 1, dagger, precision, gauge_param);
   apply_clover(tmpOdd, clover, inOdd, 1, precision);

   // Even part
   wil_dslash(outEven, gauge, inOdd, 0, dagger, precision, gauge_param);
   apply_clover(tmpEven, clover, inEven, 0, precision);

   // lastly apply the kappa term
   xpay(tmp, -kappa, out, V*spinorSiteSize, precision);

   free(tmp);
 }

 void applyTwist(void *out, void *in, void *tmpH, double a, QudaPrecision precision) {
   switch (precision) {
   case QUDA_DOUBLE_PRECISION:
     for(int i = 0; i < Vh; i++)
       for(int s = 0; s < 4; s++) {
         double a5 = ((s / 2) ? -1.0 : +1.0) * a;
         for(int c = 0; c < 3; c++) {
           ((double *) out)[i * 24 + s * 6 + c * 2 + 0] = ((double *) tmpH)[i * 24 + s * 6 + c * 2 + 0] - a5*((double *) in)[i * 24 + s * 6 + c * 2 + 1];
           ((double *) out)[i * 24 + s * 6 + c * 2 + 1] = ((double *) tmpH)[i * 24 + s * 6 + c * 2 + 1] + a5*((double *) in)[i * 24 + s * 6 + c * 2 + 0];
         }
       }
     break;
   case QUDA_SINGLE_PRECISION:
     for(int i = 0; i < Vh; i++)
       for(int s = 0; s < 4; s++) {
         float a5 = ((s / 2) ? -1.0 : +1.0) * a;
         for(int c = 0; c < 3; c++) {
           ((float *) out)[i * 24 + s * 6 + c * 2 + 0] = ((float *) tmpH)[i * 24 + s * 6 + c * 2 + 0] - a5*((float *) in)[i * 24 + s * 6 + c * 2 + 1];
           ((float *) out)[i * 24 + s * 6 + c * 2 + 1] = ((float *) tmpH)[i * 24 + s * 6 + c * 2 + 1] + a5*((float *) in)[i * 24 + s * 6 + c * 2 + 0];
         }
       }
     break;
   default:
     errorQuda("Unsupported precision %d", precision);
   }
 }

 // Apply (C + i*a*gamma_5)/(C^2 + a^2)
 void twistCloverGamma5(void *out, void *in, void *clover, void *cInv, const int dagger, const double kappa, const double mu,
            const QudaTwistFlavorType flavor, const int parity, QudaTwistGamma5Type twist, QudaPrecision precision) {
   void *tmp1 = malloc(Vh*spinorSiteSize*precision);
   void *tmp2 = malloc(Vh*spinorSiteSize*precision);

   double a = 0.0;

   if (twist == QUDA_TWIST_GAMMA5_DIRECT) {
     a = 2.0 * kappa * mu * flavor;

     if (dagger) a *= -1.0;

     apply_clover(tmp1, clover, in, parity, precision);
     applyTwist(out, in, tmp1, a, precision);
   } else if (twist == QUDA_TWIST_GAMMA5_INVERSE) {
     a = -2.0 * kappa * mu * flavor;

     if (dagger) a *= -1.0;

     apply_clover(tmp1, clover, in, parity, precision);
     applyTwist(tmp2, in, tmp1, a, precision);
     apply_clover(out, cInv, tmp2, parity, precision);
   } else {
     printf("Twist type %d not defined\n", twist);
     exit(0);
   }

   free(tmp2);
   free(tmp1);
 }

 void tmc_dslash(void *out, void **gauge, void *in, void *clover, void *cInv, double kappa, double mu, QudaTwistFlavorType flavor,
     int parity, QudaMatPCType matpc_type, int dagger, QudaPrecision precision, QudaGaugeParam &param) {
   void *tmp1 = malloc(Vh*spinorSiteSize*precision);
   void *tmp2 = malloc(Vh*spinorSiteSize*precision);

   if (dagger) {
     twistCloverGamma5(tmp1, in, clover, cInv, dagger, kappa, mu, flavor, 1-parity, QUDA_TWIST_GAMMA5_INVERSE, precision);
     if (matpc_type == QUDA_MATPC_EVEN_EVEN_ASYMMETRIC || matpc_type == QUDA_MATPC_ODD_ODD_ASYMMETRIC) {
       wil_dslash(tmp2, gauge, tmp1, parity, dagger, precision, param);
       twistCloverGamma5(out, tmp2, clover, cInv, dagger, kappa, mu, flavor, parity, QUDA_TWIST_GAMMA5_INVERSE, precision);
     } else {
       wil_dslash(out, gauge, tmp1, parity, dagger, precision, param);
     }
   } else {
     wil_dslash(tmp1, gauge, in, parity, dagger, precision, param);
     twistCloverGamma5(out, tmp1, clover, cInv, dagger, kappa, mu, flavor, parity, QUDA_TWIST_GAMMA5_INVERSE, precision);
   }

   free(tmp2);
   free(tmp1);
 }

 // Apply the full twisted-clover operator
 void tmc_mat(void *out, void **gauge, void *clover, void *in, double kappa, double mu,
        QudaTwistFlavorType flavor, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param) {

   void *tmp = malloc(V*spinorSiteSize*precision);

   void *inEven = in;
   void *inOdd  = (char*)in + Vh*spinorSiteSize*precision;
   void *outEven = out;
   void *outOdd = (char*)out + Vh*spinorSiteSize*precision;
   void *tmpEven = tmp;
   void *tmpOdd = (char*)tmp + Vh*spinorSiteSize*precision;

   // Odd part
   wil_dslash(outOdd, gauge, inEven, 1, dagger, precision, gauge_param);
   twistCloverGamma5(tmpOdd, inOdd, clover, NULL, dagger, kappa, mu, flavor, 1, QUDA_TWIST_GAMMA5_DIRECT, precision);

   // Even part
   wil_dslash(outEven, gauge, inOdd, 0, dagger, precision, gauge_param);
   twistCloverGamma5(tmpEven, inEven, clover, NULL, dagger, kappa, mu, flavor, 0, QUDA_TWIST_GAMMA5_DIRECT, precision);

   // lastly apply the kappa term
   xpay(tmp, -kappa, out, V*spinorSiteSize, precision);

   free(tmp);
 }

 // Apply the even-odd preconditioned Dirac operator
 void tmc_matpc(void *out, void **gauge, void *in, void *clover, void *cInv, double kappa, double mu, QudaTwistFlavorType flavor,
               QudaMatPCType matpc_type, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param) {

   double kappa2 = -kappa*kappa;

   void *tmp1 = malloc(Vh*spinorSiteSize*precision);
   void *tmp2 = malloc(Vh*spinorSiteSize*precision);

   switch(matpc_type) {
   case QUDA_MATPC_EVEN_EVEN:
     if (!dagger) {
       wil_dslash(out, gauge, in, 1, dagger, precision, gauge_param);
       twistCloverGamma5(tmp1, out, clover, cInv, dagger, kappa, mu, flavor, 1, QUDA_TWIST_GAMMA5_INVERSE, precision);
       wil_dslash(tmp2, gauge, tmp1, 0, dagger, precision, gauge_param);
       twistCloverGamma5(out, tmp2, clover, cInv, dagger, kappa, mu, flavor, 0, QUDA_TWIST_GAMMA5_INVERSE, precision);
     } else {
       twistCloverGamma5(out, in, clover, cInv, dagger, kappa, mu, flavor, 0, QUDA_TWIST_GAMMA5_INVERSE, precision);
       wil_dslash(tmp1, gauge, out, 1, dagger, precision, gauge_param);
       twistCloverGamma5(tmp2, tmp1, clover, cInv, dagger, kappa, mu, flavor, 1, QUDA_TWIST_GAMMA5_INVERSE, precision);
       wil_dslash(out, gauge, tmp2, 0, dagger, precision, gauge_param);
     }
     xpay(in, kappa2, out, Vh*spinorSiteSize, precision);
     break;
   case QUDA_MATPC_EVEN_EVEN_ASYMMETRIC:
     wil_dslash(tmp1, gauge, in, 1, dagger, precision, gauge_param);
     twistCloverGamma5(tmp2, tmp1, clover, cInv, dagger, kappa, mu, flavor, 1, QUDA_TWIST_GAMMA5_INVERSE, precision);
     wil_dslash(out, gauge, tmp2, 0, dagger, precision, gauge_param);
     twistCloverGamma5(tmp2, in, clover, cInv, dagger, kappa, mu, flavor, 0, QUDA_TWIST_GAMMA5_DIRECT, precision);
     xpay(tmp2, kappa2, out, Vh*spinorSiteSize, precision);
     break;
   case QUDA_MATPC_ODD_ODD:
     if (!dagger) {
       wil_dslash(out, gauge, in, 0, dagger, precision, gauge_param);
       twistCloverGamma5(tmp1, out, clover, cInv, dagger, kappa, mu, flavor, 0, QUDA_TWIST_GAMMA5_INVERSE, precision);
       wil_dslash(tmp2, gauge, tmp1, 1, dagger, precision, gauge_param);
       twistCloverGamma5(out, tmp2, clover, cInv, dagger, kappa, mu, flavor, 1, QUDA_TWIST_GAMMA5_INVERSE, precision);
     } else {
       twistCloverGamma5(out, in, clover, cInv, dagger, kappa, mu, flavor, 1, QUDA_TWIST_GAMMA5_INVERSE, precision);
       wil_dslash(tmp1, gauge, out, 0, dagger, precision, gauge_param);
       twistCloverGamma5(tmp2, tmp1, clover, cInv, dagger, kappa, mu, flavor, 0, QUDA_TWIST_GAMMA5_INVERSE, precision);
       wil_dslash(out, gauge, tmp2, 1, dagger, precision, gauge_param);
     }
     xpay(in, kappa2, out, Vh*spinorSiteSize, precision);
     break;
   case QUDA_MATPC_ODD_ODD_ASYMMETRIC:
     wil_dslash(tmp1, gauge, in, 0, dagger, precision, gauge_param);
     twistCloverGamma5(tmp2, tmp1, clover, cInv, dagger, kappa, mu, flavor, 0, QUDA_TWIST_GAMMA5_INVERSE, precision);
     wil_dslash(out, gauge, tmp2, 1, dagger, precision, gauge_param);
     twistCloverGamma5(tmp1, in, clover, cInv, dagger, kappa, mu, flavor, 1, QUDA_TWIST_GAMMA5_DIRECT, precision);
     xpay(tmp1, kappa2, out, Vh*spinorSiteSize, precision);
     break;
   default:
     errorQuda("Unsupported matpc=%d", matpc_type);
   }

   free(tmp2);
   free(tmp1);
 }
tmp2
cudaColorSpinorField * tmp2
Definition: dslash_ctest.cpp:40

tmp1
cudaColorSpinorField * tmp1
Definition: dslash_ctest.cpp:40

mu
double mu
Definition: test_util.cpp:1648

QudaPrecision
enum QudaPrecision_s QudaPrecision

QUDA_MATPC_ODD_ODD
Definition: enum_quda.h:211

kappa
double kappa
Definition: test_util.cpp:1647

conj
Matrix< N, std::complex< T > > conj(const Matrix< N, std::complex< T > > &mat)
Definition: hisq_force_reference2.cpp:231

errorQuda
#define errorQuda(...)
Definition: util_quda.h:121

test_util.h

tmc_dslash
void tmc_dslash(void *out, void **gauge, void *in, void *clover, void *cInv, double kappa, double mu, QudaTwistFlavorType flavor, int parity, QudaMatPCType matpc_type, int dagger, QudaPrecision precision, QudaGaugeParam &param)
Definition: clover_reference.cpp:234

tmp
cudaColorSpinorField * tmp
Definition: covdev_test.cpp:44

clover_matpc
void clover_matpc(void *out, void **gauge, void *clover, void *clover_inv, void *in, double kappa, QudaMatPCType matpc_type, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: clover_reference.cpp:92

gauge_param
QudaGaugeParam gauge_param
Definition: dslash_ctest.cpp:36

tmc_mat
void tmc_mat(void *out, void **gauge, void *clover, void *in, double kappa, double mu, QudaTwistFlavorType flavor, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: clover_reference.cpp:257

util_quda.h

spinorSiteSize
#define spinorSiteSize
Definition: interface_quda.cpp:55

QUDA_TWIST_GAMMA5_DIRECT
Definition: enum_quda.h:422

apply_clover
void apply_clover(void *out, void *clover, void *in, int parity, QudaPrecision precision)
Definition: clover_reference.cpp:66

quda::blas::xpay
void xpay(ColorSpinorField &x, double a, ColorSpinorField &y)
Definition: blas_quda.h:37

param
QudaGaugeParam param
Definition: pack_test.cpp:17

QUDA_MATPC_EVEN_EVEN_ASYMMETRIC
Definition: enum_quda.h:212

QudaGaugeParam_s
Definition: quda.h:32

nColor
const int nColor
Definition: covdev_test.cpp:75

in
cpuColorSpinorField * in
Definition: staggered_invert_test.cpp:98

QudaMatPCType
enum QudaMatPCType_s QudaMatPCType

blas_reference.h

clover_mat
void clover_mat(void *out, void **gauge, void *clover, void *in, double kappa, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: clover_reference.cpp:149

matpc_type
QudaMatPCType matpc_type
Definition: test_util.cpp:1662

applyTwist
void applyTwist(void *out, void *in, void *tmpH, double a, QudaPrecision precision)
Definition: clover_reference.cpp:175

V
int V
Definition: test_util.cpp:27

cloverReference
void cloverReference(sFloat *out, cFloat *clover, sFloat *in, int parity)
Apply the clover matrix field.
Definition: clover_reference.cpp:20

clover_dslash
void clover_dslash(void *out, void **gauge, void *clover, void *in, int parity, int dagger, QudaPrecision precision, QudaGaugeParam &param)
Definition: clover_reference.cpp:81

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:62

out
cpuColorSpinorField * out
Definition: staggered_invert_test.cpp:99

QUDA_MATPC_ODD_ODD_ASYMMETRIC
Definition: enum_quda.h:213

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:61

quda::s
__shared__ float s[]

tmc_matpc
void tmc_matpc(void *out, void **gauge, void *in, void *clover, void *cInv, double kappa, double mu, QudaTwistFlavorType flavor, QudaMatPCType matpc_type, int dagger, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: clover_reference.cpp:284

twistCloverGamma5
void twistCloverGamma5(void *out, void *in, void *clover, void *cInv, const int dagger, const double kappa, const double mu, const QudaTwistFlavorType flavor, const int parity, QudaTwistGamma5Type twist, QudaPrecision precision)
Definition: clover_reference.cpp:203

wilson_dslash_reference.h

QudaTwistGamma5Type
enum QudaTwistGamma5Type_s QudaTwistGamma5Type

wil_dslash
void wil_dslash(void *out, void **gauge, void *in, int oddBit, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:175

QUDA_MATPC_EVEN_EVEN
Definition: enum_quda.h:210

dagger
QudaDagType dagger
Definition: test_util.cpp:1620

parity
QudaParity parity
Definition: covdev_test.cpp:54

QUDA_TWIST_GAMMA5_INVERSE
Definition: enum_quda.h:423

Vh
int Vh
Definition: test_util.cpp:28

QudaTwistFlavorType
enum QudaTwistFlavorType_s QudaTwistFlavorType