quda-ref/v0.7.0/misc_8cpp_source.html

 #include <stdio.h>

 #include <stdlib.h>

 #include "quda.h"

 #include <string.h>

 #include "invert_quda.h"

 #include "misc.h"

  #include <assert.h>

 #include "util_quda.h"

 #include <test_util.h>


 #define stSpinorSiteSize 6

 template<typename Float>

 void display_spinor_internal(Float* spinor)

 {

     printf("(%f,%f) (%f,%f) (%f,%f) \t",

            spinor[0], spinor[1], spinor[2],

            spinor[3], spinor[4], spinor[5]);


     printf("\n");

     return;

 }


 void display_spinor(void* spinor, int len, int precision)

 {

     int i;


     if (precision == QUDA_DOUBLE_PRECISION){

         double* myspinor = (double*)spinor;

         for (i = 0;i < len; i++){

             display_spinor_internal(myspinor + stSpinorSiteSize*i);

         }

     }else if (precision == QUDA_SINGLE_PRECISION){

         float* myspinor = (float*)spinor;

         for (i=0;i < len ;i++){

             display_spinor_internal(myspinor + stSpinorSiteSize*i);

         }

     }

     return;

 }


 template<typename Float>

 void display_link_internal(Float* link)

 {

     int i, j;


     for (i = 0;i < 3; i++){

         for(j=0;j < 3; j++){

             printf("(%.10f,%.10f) \t", link[i*3*2 + j*2], link[i*3*2 + j*2 + 1]);

         }

         printf("\n");

     }

     printf("\n");

     return;

 }


 void display_link(void* link, int len, int precision)

 {

     int i;


     if (precision == QUDA_DOUBLE_PRECISION){

         double* mylink = (double*)link;

         for (i = 0;i < len; i++){

             display_link_internal(mylink + gaugeSiteSize*i);

         }

     }else if (precision == QUDA_SINGLE_PRECISION){

         float* mylink = (float*)link;

         for (i=0;i < len ;i++){

             display_link_internal(mylink + gaugeSiteSize*i);

         }

     }

     return;

 }


 template <typename Float>

 void accumulateConjugateProduct(Float *a, Float *b, Float *c, int sign) {

   a[0] += sign * (b[0]*c[0] - b[1]*c[1]);

   a[1] -= sign * (b[0]*c[1] + b[1]*c[0]);

 }


 template<typename Float>

 int link_sanity_check_internal_12(Float* link, int dir, int ga_idx, QudaGaugeParam* gaugeParam, int oddBit)

 {

     //printf("link sanity check is called\n");


     int ret =0;


     Float refc_buf[6];

     Float* refc = &refc_buf[0];


     memset((void*)refc, 0, sizeof(refc_buf));


     Float* a = link;

     Float* b = link + 6;

     Float* c = link + 12;


     accumulateConjugateProduct(refc + 0*2, a + 1*2, b + 2*2, +1);

     accumulateConjugateProduct(refc + 0*2, a + 2*2, b + 1*2, -1);

     accumulateConjugateProduct(refc + 1*2, a + 2*2, b + 0*2, +1);

     accumulateConjugateProduct(refc + 1*2, a + 0*2, b + 2*2, -1);

     accumulateConjugateProduct(refc + 2*2, a + 0*2, b + 1*2, +1);

     accumulateConjugateProduct(refc + 2*2, a + 1*2, b + 0*2, -1);


     int X1h=gaugeParam->X[0]/2;

     int X1 =gaugeParam->X[0];

     int X2 =gaugeParam->X[1];

     int X3 =gaugeParam->X[2];

     int X4 =gaugeParam->X[3];

     double t_boundary = (gaugeParam->t_boundary ==QUDA_ANTI_PERIODIC_T)? -1.0:1.0;


    double u0 = gaugeParam->tadpole_coeff;

    double coff= -u0*u0*24;

    //coff = (dir < 6) ? coff : ( (ga_idx >= (X4-3)*X1h*X2*X3 )? t_boundary : 1);


    //float u0 = (dir < 6) ? gaugeParam->anisotropy : ( (ga_idx >= (X4-3)*X1h*X2*X3 )? t_boundary : 1);


 #if 1


    {

        int index = fullLatticeIndex(ga_idx, oddBit);

        int i4 = index /(X3*X2*X1);

        int i3 = (index - i4*(X3*X2*X1))/(X2*X1);

        int i2 = (index - i4*(X3*X2*X1) - i3*(X2*X1))/X1;

        int i1 = index - i4*(X3*X2*X1) - i3*(X2*X1) - i2*X1;


        if (dir == 0) {

            if (i4 % 2 == 1){

                coff *= -1;

            }

        }


        if (dir == 2){

            if ((i1+i4) % 2 == 1){

                coff *= -1;

            }

        }

        if (dir == 4){

            if ( (i4+i1+i2) % 2 == 1){

                coff *= -1;

            }

        }

        if (dir == 6){

            if (ga_idx >= (X4-3)*X1h*X2*X3 ){

                coff *= -1;

            }

        }


        //printf("local ga_idx =%d, index=%d, i4,3,2,1 =%d %d %d %d\n", ga_idx, index, i4, i3, i2,i1);


    }

 #endif


    refc[0]*=coff; refc[1]*=coff; refc[2]*=coff; refc[3]*=coff; refc[4]*=coff; refc[5]*=coff;


     double delta = 0.0001;

     int i;

     for (i =0;i < 6; i++){

         double diff =  refc[i] -  c[i];

         double absdiff = diff > 0? diff: (-diff);

         if (absdiff  > delta){

             printf("ERROR: sanity check failed for link\n");

             display_link_internal(link);

             printf("refc = (%.10f,%.10f) (%.10f,%.10f) (%.10f,%.10f)\n",

                    refc[0], refc[1], refc[2], refc[3], refc[4], refc[5]);

             printf("dir=%d, ga_idx=%d, coff=%f, t_boundary=%f\n",dir, ga_idx,coff, t_boundary);

             printf("X=%d %d %d %d, X1h=%d\n", gaugeParam->X[0], X2, X3, X4, X1h);

             return -1;

         }


     }


     return ret;

 }


 template<typename Float>

 int site_link_sanity_check_internal_12(Float* link, int dir, int ga_idx, QudaGaugeParam* gaugeParam, int oddBit)

 {

     int ret = 0;


     Float refc_buf[6];

     Float* refc = &refc_buf[0];


     memset((void*)refc, 0, sizeof(refc_buf));


     Float* a = link;

     Float* b = link + 6;

     Float* c = link + 12;


     accumulateConjugateProduct(refc + 0*2, a + 1*2, b + 2*2, +1);

     accumulateConjugateProduct(refc + 0*2, a + 2*2, b + 1*2, -1);

     accumulateConjugateProduct(refc + 1*2, a + 2*2, b + 0*2, +1);

     accumulateConjugateProduct(refc + 1*2, a + 0*2, b + 2*2, -1);

     accumulateConjugateProduct(refc + 2*2, a + 0*2, b + 1*2, +1);

     accumulateConjugateProduct(refc + 2*2, a + 1*2, b + 0*2, -1);


     int X1h=gaugeParam->X[0]/2;

     int X1 =gaugeParam->X[0];

     int X2 =gaugeParam->X[1];

     int X3 =gaugeParam->X[2];

     int X4 =gaugeParam->X[3];


   // only apply temporal boundary condition if I'm the last node in T

 #ifdef MULTI_GPU

   bool last_node_in_t = (commCoords(3) == commDim(3)-1);

 #else

   bool last_node_in_t = true;

 #endif


 #if 1

     double coeff= 1.0;


    {

        int index = fullLatticeIndex(ga_idx, oddBit);

        int i4 = index /(X3*X2*X1);

        int i3 = (index - i4*(X3*X2*X1))/(X2*X1);

        int i2 = (index - i4*(X3*X2*X1) - i3*(X2*X1))/X1;

        int i1 = index - i4*(X3*X2*X1) - i3*(X2*X1) - i2*X1;


        if (dir == XUP) {

            if (i4 % 2 == 1){

                coeff *= -1;

            }

        }


        if (dir == YUP){

            if ((i1+i4) % 2 == 1){

                coeff *= -1;

            }

        }

        if (dir == ZUP){

            if ( (i4+i1+i2) % 2 == 1){

                coeff *= -1;

            }

        }

        if (dir == TUP){

          if (last_node_in_t && i4 == (X4-1) ){

            coeff *= -1;

          }

        }

    }


    refc[0]*=coeff; refc[1]*=coeff; refc[2]*=coeff; refc[3]*=coeff; refc[4]*=coeff; refc[5]*=coeff;

 #endif


     double delta = 0.0001;

     int i;

     for (i =0;i < 6; i++){

         double diff =  refc[i] -  c[i];

         double absdiff = diff > 0? diff: (-diff);

         if (absdiff  > delta){

             printf("ERROR: sanity check failed for site link\n");

             display_link_internal(link);

             printf("refc = (%.10f,%.10f) (%.10f,%.10f) (%.10f,%.10f)\n",

                    refc[0], refc[1], refc[2], refc[3], refc[4], refc[5]);

             printf("X=%d %d %d %d, X1h=%d\n", gaugeParam->X[0], X2, X3, X4, X1h);

             return -1;

         }


     }


     return ret;

 }


 // a+=b

 template <typename Float>

 void complexAddTo(Float *a, Float *b) {

   a[0] += b[0];

   a[1] += b[1];

 }


 // a = b*c

 template <typename Float>

 void complexProduct(Float *a, Float *b, Float *c) {

     a[0] = b[0]*c[0] - b[1]*c[1];

     a[1] = b[0]*c[1] + b[1]*c[0];

 }


 // a = conj(b)*conj(c)

 template <typename Float>

 void complexConjugateProduct(Float *a, Float *b, Float *c) {

     a[0] = b[0]*c[0] - b[1]*c[1];

     a[1] = -b[0]*c[1] - b[1]*c[0];

 }


 // a = conj(b)*c

 template <typename Float>

 void complexDotProduct(Float *a, Float *b, Float *c) {

     a[0] = b[0]*c[0] + b[1]*c[1];

     a[1] = b[0]*c[1] - b[1]*c[0];

 }


 // a += b*c

 template <typename Float>

 void accumulateComplexProduct(Float *a, Float *b, Float *c, Float sign) {

   a[0] += sign*(b[0]*c[0] - b[1]*c[1]);

   a[1] += sign*(b[0]*c[1] + b[1]*c[0]);

 }


 // a += conj(b)*c)

 template <typename Float>

 void accumulateComplexDotProduct(Float *a, Float *b, Float *c) {

     a[0] += b[0]*c[0] + b[1]*c[1];

     a[1] += b[0]*c[1] - b[1]*c[0];

 }


 template<typename Float>

 int link_sanity_check_internal_8(Float* link, int dir, int ga_idx, QudaGaugeParam* gaugeParam, int oddBit)

 {

     int ret =0;


     Float ref_link_buf[18];

     Float* ref = & ref_link_buf[0];

     memset(ref, 0, sizeof(ref_link_buf));


     ref[0] = atan2(link[1], link[0]);

     ref[1] = atan2(link[13], link[12]);

     for (int i=2; i<7; i++) {

         ref[i] = link[i];

     }


     int X1h=gaugeParam->X[0]/2;

     int X2 =gaugeParam->X[1];

     int X3 =gaugeParam->X[2];

     int X4 =gaugeParam->X[3];

     double t_boundary = (gaugeParam->t_boundary ==QUDA_ANTI_PERIODIC_T)? -1.0:1.0;


     // First reconstruct first row

     Float row_sum = 0.0;

     row_sum += ref[2]*ref[2];

     row_sum += ref[3]*ref[3];

     row_sum += ref[4]*ref[4];

     row_sum += ref[5]*ref[5];


 #define SMALL_NUM 1e-24

     row_sum = (row_sum != 0)?row_sum: SMALL_NUM;

 #if 1

     Float u0= -gaugeParam->tadpole_coeff*gaugeParam->tadpole_coeff*24;

     {

         int X1h=gaugeParam->X[0]/2;

         int X1 =gaugeParam->X[0];

         int X2 =gaugeParam->X[1];

         int X3 =gaugeParam->X[2];

         int X4 =gaugeParam->X[3];


         int index = fullLatticeIndex(ga_idx, oddBit);

         int i4 = index /(X3*X2*X1);

         int i3 = (index - i4*(X3*X2*X1))/(X2*X1);

         int i2 = (index - i4*(X3*X2*X1) - i3*(X2*X1))/X1;

         int i1 = index - i4*(X3*X2*X1) - i3*(X2*X1) - i2*X1;


         if (dir == 0) {

             if (i4 % 2 == 1){

                 u0 *= -1;

             }

         }


         if (dir == 1){

             if ((i1+i4) % 2 == 1){

                 u0 *= -1;

             }

         }

         if (dir == 2){

             if ( (i4+i1+i2) % 2 == 1){

                 u0 *= -1;

             }

         }

         if (dir == 3){

             if (ga_idx >= (X4-3)*X1h*X2*X3 ){

                 u0 *= -1;

             }

         }


         //printf("local ga_idx =%d, index=%d, i4,3,2,1 =%d %d %d %d\n", ga_idx, index, i4, i3, i2,i1);


     }

 #endif


     Float U00_mag = sqrt( (1.f/(u0*u0) - row_sum)>0? (1.f/(u0*u0)-row_sum):0);


     ref[14] = ref[0];

     ref[15] = ref[1];


     ref[0] = U00_mag * cos(ref[14]);

     ref[1] = U00_mag * sin(ref[14]);


     Float column_sum = 0.0;

     for (int i=0; i<2; i++) column_sum += ref[i]*ref[i];

     for (int i=6; i<8; i++) column_sum += ref[i]*ref[i];

     Float U20_mag = sqrt( (1.f/(u0*u0) - column_sum) > 0? (1.f/(u0*u0)-column_sum) : 0);


     ref[12] = U20_mag * cos(ref[15]);

     ref[13] = U20_mag * sin(ref[15]);


     // First column now restored


     // finally reconstruct last elements from SU(2) rotation

     Float r_inv2 = 1.0/(u0*row_sum);


     // U11

     Float A[2];

     complexDotProduct(A, ref+0, ref+6);

     complexConjugateProduct(ref+8, ref+12, ref+4);

     accumulateComplexProduct(ref+8, A, ref+2, u0);

     ref[8] *= -r_inv2;

     ref[9] *= -r_inv2;


     // U12

     complexConjugateProduct(ref+10, ref+12, ref+2);

     accumulateComplexProduct(ref+10, A, ref+4, -u0);

     ref[10] *= r_inv2;

     ref[11] *= r_inv2;


     // U21

     complexDotProduct(A, ref+0, ref+12);

     complexConjugateProduct(ref+14, ref+6, ref+4);

     accumulateComplexProduct(ref+14, A, ref+2, -u0);

     ref[14] *= r_inv2;

     ref[15] *= r_inv2;


     // U12

     complexConjugateProduct(ref+16, ref+6, ref+2);

     accumulateComplexProduct(ref+16, A, ref+4, u0);

     ref[16] *= -r_inv2;

     ref[17] *= -r_inv2;


     double delta = 0.0001;

     int i;

     for (i =0;i < 18; i++){


         double diff =  ref[i] -  link[i];

         double absdiff = diff > 0? diff: (-diff);

         if ( (ref[i] !=  ref[i]) || (absdiff  > delta)){

             printf("ERROR: sanity check failed for link\n");

             display_link_internal(link);

             printf("reconstructed link is\n");

             display_link_internal(ref);

             printf("dir=%d, ga_idx=%d, u0=%f, t_boundary=%f\n",dir, ga_idx, u0, t_boundary);

             printf("X=%d %d %d %d, X1h=%d\n", gaugeParam->X[0], X2, X3, X4, X1h);

             return -1;

         }


     }


     return ret;

 }


 //this len must be V

 int

 link_sanity_check(void* link, int len, int precision, int dir, QudaGaugeParam* gaugeParam)

 {

     int i;

     int rc = 0;


     if (precision == QUDA_DOUBLE_PRECISION){

         double* mylink = (double*)link;

         //even

         for (i = 0;i < len/2; i++){

             rc = link_sanity_check_internal_12(mylink + gaugeSiteSize*i, dir, i, gaugeParam, 0);

             if (rc != 0){

                 printf("ERROR: even link sanity check failed, i=%d\n",i);

                 display_link_internal(mylink+gaugeSiteSize*i);

                 exit(1);

             }

         }


         mylink = mylink + gaugeSiteSize*len/2;

         //odd

         for (i = 0;i < len/2; i++){

             rc = link_sanity_check_internal_12(mylink + gaugeSiteSize*i, dir, i, gaugeParam, 1);

             if (rc != 0){

                 printf("ERROR: odd link sanity check failed, i=%d\n",i);

                 display_link_internal(mylink+gaugeSiteSize*i);

                 exit(1);

             }

         }


     }else if (precision == QUDA_SINGLE_PRECISION){

         float* mylink = (float*)link;


         //even

         for (i=0;i < len/2 ;i++){

             rc = link_sanity_check_internal_12(mylink + gaugeSiteSize*i, dir, i, gaugeParam, 0);

             if (rc != 0){

                 printf("ERROR: even link sanity check 12 failed, i=%d\n",i);

                 exit(1);

             }

             /*

             rc = link_sanity_check_internal_8(mylink + gaugeSiteSize*i, dir, i, gaugeParam, 0);

             if (rc != 0){

                 printf("ERROR: even link sanity check 8 failed, i=%d\n",i);

                 exit(1);

             }

             */


         }

         mylink = mylink + gaugeSiteSize*len/2;

         //odd

         for (i=0;i < len/2 ;i++){

             rc = link_sanity_check_internal_12(mylink + gaugeSiteSize*i, dir, i, gaugeParam, 1);

             if (rc != 0){

                 printf("ERROR: odd link sanity check 12 failed, i=%d\n", i);

                 exit(1);

             }

             /*

             rc = link_sanity_check_internal_8(mylink + gaugeSiteSize*i, dir, i, gaugeParam, 0);

             if (rc != 0){

                 printf("ERROR: even link sanity check 8 failed, i=%d\n",i);

                 exit(1);

             }

             */

         }


     }


     return rc;

 }


 //this len must be V

 int

 site_link_sanity_check(void* link, int len, int precision, QudaGaugeParam* gaugeParam)

 {

     int i;

     int rc = 0;

     int dir;


     if (precision == QUDA_DOUBLE_PRECISION){

         double* mylink = (double*)link;

         //even

         for (i = 0;i < len/2; i++){

             for(dir=XUP;dir <= TUP; dir++){

                 rc = site_link_sanity_check_internal_12(mylink + gaugeSiteSize*(4*i+dir), dir, i, gaugeParam, 0);

                 if (rc != 0){

                     printf("ERROR: even link sanity check failed, i=%d, function %s\n",i, __FUNCTION__);

                     display_link_internal(mylink+gaugeSiteSize*i);

                     exit(1);

                 }

             }

         }


         mylink = mylink + 4*gaugeSiteSize*len/2;

         //odd

         for (i = 0;i < len/2; i++){

             for(dir=XUP;dir <= TUP; dir++){

                 rc = site_link_sanity_check_internal_12(mylink + gaugeSiteSize*(4*i+dir), dir, i, gaugeParam, 1);

                 if (rc != 0){

                     printf("ERROR: odd link sanity check failed, i=%d, function %s\n",i, __FUNCTION__);

                     display_link_internal(mylink+gaugeSiteSize*i);

                     exit(1);

                 }

             }

         }


     }else if (precision == QUDA_SINGLE_PRECISION){

         float* mylink = (float*)link;


         //even

         for (i=0;i < len/2 ;i++){

             for(dir=XUP;dir <= TUP; dir++){

                 rc = site_link_sanity_check_internal_12(mylink + gaugeSiteSize*(4*i+dir), dir, i, gaugeParam, 0);

                 if (rc != 0){

                     printf("ERROR: even link sanity check 12 failed, i=%d, function %s\n",i, __FUNCTION__);

                     exit(1);

                 }

             }

         }

         mylink = mylink + 4*gaugeSiteSize*len/2;

         //odd

         for (i=0;i < len/2 ;i++){

             for(dir=XUP;dir <= TUP; dir++){

                 rc = site_link_sanity_check_internal_12(mylink + gaugeSiteSize*(4*i+dir), dir, i, gaugeParam, 1);

                 if (rc != 0){

                     printf("ERROR: odd link sanity check 12 failed, i=%d, function %s\n", i, __FUNCTION__);

                     exit(1);

                 }

             }

         }


     }


     return rc;

 }


 QudaReconstructType

 get_recon(char* s)

 {

     QudaReconstructType  ret;


     if (strcmp(s, "8") == 0){

         ret =  QUDA_RECONSTRUCT_8;

     }else if (strcmp(s, "9") == 0){

         ret =  QUDA_RECONSTRUCT_9;

     }else if (strcmp(s, "12") == 0){

         ret =  QUDA_RECONSTRUCT_12;

     }else if (strcmp(s, "13") == 0){

         ret =  QUDA_RECONSTRUCT_13;

     }else if (strcmp(s, "18") == 0){

         ret =  QUDA_RECONSTRUCT_NO;

     }else{

         fprintf(stderr, "Error: invalid reconstruct type\n");

         exit(1);

     }


     return ret;


 }


 QudaPrecision

 get_prec(char* s)

 {

     QudaPrecision ret = QUDA_DOUBLE_PRECISION;


     if (strcmp(s, "double") == 0){

         ret = QUDA_DOUBLE_PRECISION;

     }else if (strcmp(s, "single") == 0){

         ret = QUDA_SINGLE_PRECISION;

     }else if (strcmp(s, "half") == 0){

         ret = QUDA_HALF_PRECISION;

     }else{

         fprintf(stderr, "Error: invalid precision type\n");

         exit(1);

     }


     return ret;

 }


 const char*

 get_prec_str(QudaPrecision prec)

 {

     const char* ret;


     switch( prec){


     case QUDA_DOUBLE_PRECISION:

         ret=  "double";

         break;

     case QUDA_SINGLE_PRECISION:

         ret= "single";

         break;

     case QUDA_HALF_PRECISION:

         ret= "half";

         break;

     default:

         ret = "unknown";

         break;

     }


     return ret;

 }


 const char*

 get_unitarization_str(bool svd_only)

 {

   const char* ret;


   if(svd_only){

     ret = "SVD";

   }else{

     ret = "Cayley-Hamilton/SVD";

   }

   return ret;

 }


 const char*

 get_gauge_order_str(QudaGaugeFieldOrder order)

 {

   const char* ret;


   switch(order){

     case QUDA_QDP_GAUGE_ORDER:

         ret = "qdp";

         break;


     case QUDA_MILC_GAUGE_ORDER:

         ret = "milc";

         break;


     case QUDA_CPS_WILSON_GAUGE_ORDER:

         ret = "cps_wilson";

         break;


     default:

         ret = "unknown";

         break;

   }


   return ret;

 }


 const char*

 get_recon_str(QudaReconstructType recon)

 {

     const char* ret;

     switch(recon){

     case QUDA_RECONSTRUCT_13:

         ret="13";

         break;

     case QUDA_RECONSTRUCT_12:

         ret= "12";

         break;

     case QUDA_RECONSTRUCT_9:

         ret="9";

         break;

     case QUDA_RECONSTRUCT_8:

         ret = "8";

         break;

     case QUDA_RECONSTRUCT_NO:

         ret = "18";

         break;

     default:

         ret="unknown";

         break;

     }


     return ret;

 }


 const char*

 get_test_type(int t)

 {

     const char* ret;

     switch(t){

     case 0:

         ret = "even";

         break;

     case 1:

         ret = "odd";

         break;

     case 2:

         ret = "full";

         break;

     case 3:

         ret = "mcg_even";

         break;

     case 4:

         ret = "mcg_odd";

         break;

     case 5:

         ret = "mcg_full";

         break;

     default:

         ret = "unknown";

         break;

     }


     return ret;

 }


 QudaDslashType

 get_dslash_type(char* s)

 {

   QudaDslashType ret =  QUDA_INVALID_DSLASH;


   if (strcmp(s, "wilson") == 0){

     ret = QUDA_WILSON_DSLASH;

   }else if (strcmp(s, "clover") == 0){

     ret = QUDA_CLOVER_WILSON_DSLASH;

   }else if (strcmp(s, "twisted_mass") == 0){

     ret = QUDA_TWISTED_MASS_DSLASH;

   }else if (strcmp(s, "twisted_clover") == 0){

     ret = QUDA_TWISTED_CLOVER_DSLASH;

   }else if (strcmp(s, "staggered") == 0){

     ret =  QUDA_STAGGERED_DSLASH;

   }else if (strcmp(s, "asqtad") == 0){

     ret =  QUDA_ASQTAD_DSLASH;

   }else if (strcmp(s, "domain_wall") == 0){

     ret =  QUDA_DOMAIN_WALL_DSLASH;

   }else if (strcmp(s, "domain_wall_4d") == 0){

     ret =  QUDA_DOMAIN_WALL_4D_DSLASH;

   }else if (strcmp(s, "mobius") == 0){

     ret =  QUDA_MOBIUS_DWF_DSLASH;

   }else{

     fprintf(stderr, "Error: invalid dslash type\n");

     exit(1);

   }


   return ret;

 }


 const char*

 get_dslash_str(QudaDslashType type)

 {

   const char* ret;


   switch( type){

   case QUDA_WILSON_DSLASH:

     ret=  "wilson";

     break;

   case QUDA_CLOVER_WILSON_DSLASH:

     ret= "clover";

     break;

   case QUDA_TWISTED_MASS_DSLASH:

     ret= "twisted_mass";

     break;

   case QUDA_TWISTED_CLOVER_DSLASH:

     ret= "twisted_clover";

     break;

   case QUDA_STAGGERED_DSLASH:

     ret = "staggered";

     break;

   case QUDA_ASQTAD_DSLASH:

     ret = "asqtad";

     break;

   case QUDA_DOMAIN_WALL_DSLASH:

     ret = "domain_wall";

       break;

   case QUDA_DOMAIN_WALL_4D_DSLASH:

     ret = "domain_wall_4d";

       break;

   case QUDA_MOBIUS_DWF_DSLASH:

     ret = "mobius";

       break;

   default:

     ret = "unknown";

     break;

   }


   return ret;


 }


 QudaMassNormalization

 get_mass_normalization_type(char* s)

 {

   QudaMassNormalization ret =  QUDA_INVALID_NORMALIZATION;


   if (strcmp(s, "kappa") == 0){

     ret = QUDA_KAPPA_NORMALIZATION;

   }else if (strcmp(s, "mass") == 0){

     ret = QUDA_MASS_NORMALIZATION;

   }else if (strcmp(s, "asym_mass") == 0){

     ret = QUDA_ASYMMETRIC_MASS_NORMALIZATION;

   }else{

     fprintf(stderr, "Error: invalid mass normalization\n");

     exit(1);

   }


   return ret;

 }


 const char*

 get_mass_normalization_str(QudaMassNormalization type)

 {

   const char *s;


   switch (type) {

   case QUDA_KAPPA_NORMALIZATION:

     s = "kappa";

     break;

   case QUDA_MASS_NORMALIZATION:

     s = "mass";

     break;

   case QUDA_ASYMMETRIC_MASS_NORMALIZATION:

     s = "asym_mass";

     break;

   default:

     fprintf(stderr, "Error: invalid mass normalization\n");

     exit(1);

   }


   return s;

 }


 QudaMatPCType

 get_matpc_type(char* s)

 {

   QudaMatPCType ret =  QUDA_MATPC_INVALID;


   if (strcmp(s, "even_even") == 0){

     ret = QUDA_MATPC_EVEN_EVEN;

   }else if (strcmp(s, "odd_odd") == 0){

     ret = QUDA_MATPC_ODD_ODD;

   }else if (strcmp(s, "even_even_asym") == 0){

     ret = QUDA_MATPC_EVEN_EVEN_ASYMMETRIC;

   }else if (strcmp(s, "odd_odd_asym") == 0){

     ret = QUDA_MATPC_ODD_ODD_ASYMMETRIC;

   }else{

     fprintf(stderr, "Error: invalid matpc type\n");

     exit(1);

   }


   return ret;

 }


 const char *

 get_matpc_str(QudaMatPCType type)

 {

   const char* ret;


   switch(type) {

   case QUDA_MATPC_EVEN_EVEN:

     ret = "even_even";

     break;

   case QUDA_MATPC_ODD_ODD:

     ret = "odd_odd";

     break;

   case QUDA_MATPC_EVEN_EVEN_ASYMMETRIC:

     ret = "even_even_asym";

     break;

   case QUDA_MATPC_ODD_ODD_ASYMMETRIC:

     ret = "odd_odd_asym";

     break;

   default:

     fprintf(stderr, "Error: invalid matpc type\n");

     exit(1);

   }


   return ret;

 }


 QudaTwistFlavorType

 get_flavor_type(char* s)

 {

   QudaTwistFlavorType ret =  QUDA_TWIST_MINUS;


   if (strcmp(s, "minus") == 0){

     ret = QUDA_TWIST_MINUS;

   }else if (strcmp(s, "plus") == 0){

     ret = QUDA_TWIST_PLUS;

   }else if (strcmp(s, "deg_doublet") == 0){

     ret = QUDA_TWIST_DEG_DOUBLET;

   }else if (strcmp(s, "nondeg_doublet") == 0){

     ret = QUDA_TWIST_NONDEG_DOUBLET;

   }else if (strcmp(s, "no") == 0){

     ret =  QUDA_TWIST_NO;

   }else{

     fprintf(stderr, "Error: invalid flavor type\n");

     exit(1);

   }


   return ret;

 }


 const char*

 get_flavor_str(QudaTwistFlavorType type)

 {

   const char* ret;


   switch(type) {

   case QUDA_TWIST_MINUS:

     ret = "minus";

     break;

   case QUDA_TWIST_PLUS:

     ret = "plus";

     break;

   case QUDA_TWIST_DEG_DOUBLET:

     ret = "deg_doublet";

     break;

   case QUDA_TWIST_NONDEG_DOUBLET:

     ret = "nondeg_doublet";

     break;

   case QUDA_TWIST_NO:

     ret = "no";

     break;

   default:

     ret = "unknown";

     break;

   }


   return ret;

 }


 QudaInverterType

 get_solver_type(char* s)

 {

   QudaInverterType ret =  QUDA_INVALID_INVERTER;


   if (strcmp(s, "cg") == 0){

     ret = QUDA_CG_INVERTER;

   }else if (strcmp(s, "bicgstab") == 0){

     ret = QUDA_BICGSTAB_INVERTER;

   }else if (strcmp(s, "gcr") == 0){

     ret = QUDA_GCR_INVERTER;

   }else if (strcmp(s, "pcg") == 0){

     ret = QUDA_PCG_INVERTER;

   }else if (strcmp(s, "mpcg") == 0){

     ret = QUDA_MPCG_INVERTER;

   }else if (strcmp(s, "mpbicgstab") == 0){

     ret = QUDA_MPBICGSTAB_INVERTER;

   }else if (strcmp(s, "mr") == 0){

     ret = QUDA_MR_INVERTER;

   }else{

     fprintf(stderr, "Error: invalid solver type\n");

     exit(1);

   }


   return ret;

 }


 const char*

 get_solver_str(QudaInverterType type)

 {

   const char* ret;


   switch( type){

   case QUDA_CG_INVERTER:

     ret=  "cg";

     break;

   case QUDA_BICGSTAB_INVERTER:

     ret= "bicgstab";

     break;

   case QUDA_GCR_INVERTER:

     ret= "gcr";

     break;

   default:

     ret = "unknown";

     break;

   }


   return ret;


 }


 const char*

 get_quda_ver_str()

 {

   static char vstr[32];

   int major_num = QUDA_VERSION_MAJOR;

   int minor_num = QUDA_VERSION_MINOR;

   int ext_num = QUDA_VERSION_SUBMINOR;

   sprintf(vstr, "%1d.%1d.%1d",

           major_num,

           minor_num,

           ext_num);

   return vstr;

 }


commDim
int commDim(int)
Definition: face_buffer.cpp:535

invert_quda.h

ZUP
Definition: force_common.h:7

QudaMassNormalization
enum QudaMassNormalization_s QudaMassNormalization

QUDA_RECONSTRUCT_NO
Definition: enum_quda.h:55

QUDA_GCR_INVERTER
Definition: enum_quda.h:100

SMALL_NUM
#define SMALL_NUM

X1h
__constant__ int X1h
Definition: dslash_constants.h:104

complexDotProduct
void complexDotProduct(Float *a, Float *b, Float *c)
Definition: misc.cpp:309

X2
__constant__ int X2
Definition: dslash_constants.h:107

QudaPrecision
enum QudaPrecision_s QudaPrecision

misc.h

get_flavor_type
QudaTwistFlavorType get_flavor_type(char *s)
Definition: misc.cpp:946

QUDA_MATPC_ODD_ODD
Definition: enum_quda.h:164

QUDA_MASS_NORMALIZATION
Definition: enum_quda.h:178

get_prec
QudaPrecision get_prec(char *s)
Definition: misc.cpp:639

accumulateComplexDotProduct
void accumulateComplexDotProduct(Float *a, Float *b, Float *c)
Definition: misc.cpp:323

site_link_sanity_check
int site_link_sanity_check(void *link, int len, int precision, QudaGaugeParam *gaugeParam)
Definition: misc.cpp:549

QUDA_ASQTAD_DSLASH
Definition: enum_quda.h:81

QUDA_TWIST_PLUS
Definition: enum_quda.h:332

stSpinorSiteSize
#define stSpinorSiteSize
Definition: misc.cpp:12

test_util.h

gaugeParam
QudaGaugeParam gaugeParam
Definition: staggered_dslash_test.cpp:39

YUP
Definition: force_common.h:6

QUDA_INVALID_NORMALIZATION
Definition: enum_quda.h:180

X1
__constant__ int X1
Definition: dslash_constants.h:106

QUDA_MR_INVERTER
Definition: enum_quda.h:101

QUDA_HALF_PRECISION
Definition: enum_quda.h:48

QUDA_QDP_GAUGE_ORDER
Definition: enum_quda.h:32

quda::sqrt
__host__ __device__ ValueType sqrt(ValueType x)
Definition: complex_quda.h:105

ga_idx
const int ga_idx
Definition: asym_wilson_clover_dslash_dagger_fermi_core.h:934

QUDA_VERSION_MINOR
#define QUDA_VERSION_MINOR
Definition: quda_constants.h:2

gaugeSiteSize
#define gaugeSiteSize
Definition: fat_force_quda.h:11

get_matpc_str
const char * get_matpc_str(QudaMatPCType type)
Definition: misc.cpp:920

QUDA_CG_INVERTER
Definition: enum_quda.h:98

get_gauge_order_str
const char * get_gauge_order_str(QudaGaugeFieldOrder order)
Definition: misc.cpp:697

util_quda.h

QUDA_MPBICGSTAB_INVERTER
Definition: enum_quda.h:102

spinor
cpuColorSpinorField * spinor
Definition: dslash_test.cpp:40

QUDA_TWIST_NONDEG_DOUBLET
Definition: enum_quda.h:333

get_prec_str
const char * get_prec_str(QudaPrecision prec)
Definition: misc.cpp:658

get_recon
QudaReconstructType get_recon(char *s)
Definition: misc.cpp:614

TUP
Definition: force_common.h:8

accumulateConjugateProduct
void accumulateConjugateProduct(Float *a, Float *b, Float *c, int sign)
Definition: misc.cpp:84

accumulateComplexProduct
void accumulateComplexProduct(Float *a, Float *b, Float *c, Float sign)
Definition: misc.cpp:316

XUP
Definition: force_common.h:5

get_flavor_str
const char * get_flavor_str(QudaTwistFlavorType type)
Definition: misc.cpp:969

get_test_type
const char * get_test_type(int t)
Definition: misc.cpp:752

get_solver_str
const char * get_solver_str(QudaInverterType type)
Definition: misc.cpp:1025

fullLatticeIndex
int fullLatticeIndex(int dim[4], int index, int oddBit)
Definition: test_util.cpp:400

QUDA_TWIST_DEG_DOUBLET
Definition: enum_quda.h:334

complexProduct
void complexProduct(Float *a, Float *b, Float *c)
Definition: misc.cpp:295

QUDA_RECONSTRUCT_9
Definition: enum_quda.h:58

QUDA_MATPC_EVEN_EVEN_ASYMMETRIC
Definition: enum_quda.h:165

get_unitarization_str
const char * get_unitarization_str(bool svd_only)
Definition: misc.cpp:684

QUDA_INVALID_DSLASH
Definition: enum_quda.h:84

QUDA_RECONSTRUCT_12
Definition: enum_quda.h:56

get_solver_type
QudaInverterType get_solver_type(char *s)
Definition: misc.cpp:998

display_link_internal
void display_link_internal(Float *link)
Definition: misc.cpp:47

QudaGaugeParam_s
Definition: quda.h:25

quda::sin
__host__ __device__ ValueType sin(ValueType x)
Definition: complex_quda.h:40

display_spinor
void display_spinor(void *spinor, int len, int precision)
Definition: misc.cpp:26

testing::internal::Float
FloatingPoint< float > Float
Definition: gtest.h:7350

get_mass_normalization_str
const char * get_mass_normalization_str(QudaMassNormalization type)
Definition: misc.cpp:876

QUDA_MILC_GAUGE_ORDER
Definition: enum_quda.h:35

get_dslash_type
QudaDslashType get_dslash_type(char *s)
Definition: misc.cpp:783

get_recon_str
const char * get_recon_str(QudaReconstructType recon)
Definition: misc.cpp:724

quda::atan2
__host__ __device__ ValueType atan2(ValueType x, ValueType y)
Definition: complex_quda.h:65

QudaMatPCType
enum QudaMatPCType_s QudaMatPCType

QUDA_CLOVER_WILSON_DSLASH
Definition: enum_quda.h:76

link_sanity_check
int link_sanity_check(void *link, int len, int precision, int dir, QudaGaugeParam *gaugeParam)
Definition: misc.cpp:476

QUDA_CPS_WILSON_GAUGE_ORDER
Definition: enum_quda.h:34

QUDA_VERSION_SUBMINOR
#define QUDA_VERSION_SUBMINOR
Definition: quda_constants.h:3

QUDA_PCG_INVERTER
Definition: enum_quda.h:105

coeff
__constant__ double coeff
Definition: dslash_constants.h:180

get_matpc_type
QudaMatPCType get_matpc_type(char *s)
Definition: misc.cpp:899

get_dslash_str
const char * get_dslash_str(QudaDslashType type)
Definition: misc.cpp:814

QudaGaugeFieldOrder
enum QudaGaugeFieldOrder_s QudaGaugeFieldOrder

link_sanity_check_internal_8
int link_sanity_check_internal_8(Float *link, int dir, int ga_idx, QudaGaugeParam *gaugeParam, int oddBit)
Definition: misc.cpp:330

QUDA_KAPPA_NORMALIZATION
Definition: enum_quda.h:177

QudaGaugeParam_s::X
int X[4]
Definition: quda.h:29

commCoords
int commCoords(int)
Definition: face_buffer.cpp:537

QUDA_MPCG_INVERTER
Definition: enum_quda.h:106

QUDA_BICGSTAB_INVERTER
Definition: enum_quda.h:99

QUDA_TWISTED_CLOVER_DSLASH
Definition: enum_quda.h:83

display_link
void display_link(void *link, int len, int precision)
Definition: misc.cpp:63

QUDA_WILSON_DSLASH
Definition: enum_quda.h:75

QUDA_RECONSTRUCT_8
Definition: enum_quda.h:57

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:50

QudaGaugeParam_s::tadpole_coeff
double tadpole_coeff
Definition: quda.h:32

link_sanity_check_internal_12
int link_sanity_check_internal_12(Float *link, int dir, int ga_idx, QudaGaugeParam *gaugeParam, int oddBit)
Definition: misc.cpp:91

memset
void * memset(void *s, int c, size_t n)

QUDA_TWISTED_MASS_DSLASH
Definition: enum_quda.h:82

QUDA_MATPC_ODD_ODD_ASYMMETRIC
Definition: enum_quda.h:166

ref
cpuColorSpinorField * ref
Definition: staggered_invert_test.cpp:52

QUDA_STAGGERED_DSLASH
Definition: enum_quda.h:80

QUDA_INVALID_INVERTER
Definition: enum_quda.h:109

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:49

QudaReconstructType
enum QudaReconstructType_s QudaReconstructType

quda.h
Main header file for the QUDA library.

X3
__constant__ int X3
Definition: dslash_constants.h:108

QudaGaugeParam_s::t_boundary
QudaTboundary t_boundary
Definition: quda.h:38

complexConjugateProduct
void complexConjugateProduct(Float *a, Float *b, Float *c)
Definition: misc.cpp:302

QUDA_TWIST_NO
Definition: enum_quda.h:335

get_mass_normalization_type
QudaMassNormalization get_mass_normalization_type(char *s)
Definition: misc.cpp:857

QUDA_ASYMMETRIC_MASS_NORMALIZATION
Definition: enum_quda.h:179

QUDA_RECONSTRUCT_13
Definition: enum_quda.h:59

QudaDslashType
enum QudaDslashType_s QudaDslashType

QUDA_ANTI_PERIODIC_T
Definition: enum_quda.h:42

display_spinor_internal
void display_spinor_internal(Float *spinor)
Definition: misc.cpp:14

site_link_sanity_check_internal_12
int site_link_sanity_check_internal_12(Float *link, int dir, int ga_idx, QudaGaugeParam *gaugeParam, int oddBit)
Definition: misc.cpp:190

quda::cos
__host__ __device__ ValueType cos(ValueType x)
Definition: complex_quda.h:35

t_boundary
__constant__ double t_boundary
Definition: dslash_constants.h:179

QUDA_DOMAIN_WALL_DSLASH
Definition: enum_quda.h:77

QUDA_MATPC_INVALID
Definition: enum_quda.h:167

s
VOLATILE spinorFloat * s
Definition: asym_wilson_clover_dslash_dagger_g80_core.h:387

prec
QudaPrecision prec
Definition: test_util.cpp:1551

QUDA_MATPC_EVEN_EVEN
Definition: enum_quda.h:163

QUDA_TWIST_MINUS
Definition: enum_quda.h:331

get_quda_ver_str
const char * get_quda_ver_str()
Definition: misc.cpp:1050

QUDA_VERSION_MAJOR
#define QUDA_VERSION_MAJOR
Definition: quda_constants.h:1

QUDA_DOMAIN_WALL_4D_DSLASH
Definition: enum_quda.h:78

complexAddTo
void complexAddTo(Float *a, Float *b)
Definition: misc.cpp:288

QudaInverterType
enum QudaInverterType_s QudaInverterType

oddBit
int oddBit
Definition: hisq_paths_force_core.h:263

X4
__constant__ int X4
Definition: dslash_constants.h:109

QUDA_MOBIUS_DWF_DSLASH
Definition: enum_quda.h:79

QudaTwistFlavorType
enum QudaTwistFlavorType_s QudaTwistFlavorType