quda-ref/v0.7.0/deflation__test_8cpp_source.html

 #include <stdlib.h>

 #include <stdio.h>

 #include <time.h>

 #include <math.h>

 #include <string.h>


 #include <util_quda.h>

 #include <test_util.h>

 #include <dslash_util.h>

 #include <blas_reference.h>

 #include <wilson_dslash_reference.h>

 #include <domain_wall_dslash_reference.h>

 #include "misc.h"


 #include "face_quda.h"


 #if defined(QMP_COMMS)

 #include <qmp.h>

 #elif defined(MPI_COMMS)

 #include <mpi.h>

 #endif


 #include <gauge_qio.h>


 #define MAX(a,b) ((a)>(b)?(a):(b))


 // In a typical application, quda.h is the only QUDA header required.

 #include <quda.h>


 // Wilson, clover-improved Wilson, twisted mass, and domain wall are supported.

 extern QudaDslashType dslash_type;

 extern bool tune;

 extern int device;

 extern int xdim;

 extern int ydim;

 extern int zdim;

 extern int tdim;

 extern int Lsdim;

 extern int gridsize_from_cmdline[];

 extern QudaReconstructType link_recon;

 extern QudaPrecision prec;

 extern QudaReconstructType link_recon_sloppy;

 extern QudaPrecision  prec_sloppy;


 extern char latfile[];


 extern void usage(char** );


 void

 display_test_info()

 {

   printfQuda("running the following test:\n");


   printfQuda("prec    sloppy_prec    link_recon  sloppy_link_recon S_dimension T_dimension Ls_dimension\n");

   printfQuda("%s   %s             %s            %s            %d/%d/%d          %d         %d\n",

              get_prec_str(prec),get_prec_str(prec_sloppy),

              get_recon_str(link_recon),

              get_recon_str(link_recon_sloppy),  xdim, ydim, zdim, tdim, Lsdim);


   printfQuda("Grid partition info:     X  Y  Z  T\n");

   printfQuda("                         %d  %d  %d  %d\n",

              dimPartitioned(0),

              dimPartitioned(1),

              dimPartitioned(2),

              dimPartitioned(3));


   return ;


 }


 int main(int argc, char **argv)

 {


   for (int i = 1; i < argc; i++){

     if(process_command_line_option(argc, argv, &i) == 0){

       continue;

     }

     printfQuda("ERROR: Invalid option:%s\n", argv[i]);

     usage(argv);

   }


   if (prec_sloppy == QUDA_INVALID_PRECISION){

     prec_sloppy = prec;

   }

   if (link_recon_sloppy == QUDA_RECONSTRUCT_INVALID){

     link_recon_sloppy = link_recon;

   }


   // initialize QMP/MPI, QUDA comms grid and RNG (test_util.cpp)

   initComms(argc, argv, gridsize_from_cmdline);


   display_test_info();


   // *** QUDA parameters begin here.

   if (dslash_type != QUDA_WILSON_DSLASH &&

       dslash_type != QUDA_CLOVER_WILSON_DSLASH &&

       dslash_type != QUDA_TWISTED_MASS_DSLASH &&

       dslash_type != QUDA_DOMAIN_WALL_DSLASH) {

     printfQuda("dslash_type %d not supported\n", dslash_type);

     exit(0);

   }


   QudaPrecision cpu_prec = QUDA_DOUBLE_PRECISION;

   QudaPrecision cuda_prec = prec;

   QudaPrecision cuda_prec_sloppy = prec_sloppy;

   QudaPrecision cuda_prec_precondition = QUDA_HALF_PRECISION;


   QudaGaugeParam gauge_param = newQudaGaugeParam();

   QudaInvertParam inv_param = newQudaInvertParam();


   double kappa5;


   gauge_param.X[0] = xdim;

   gauge_param.X[1] = ydim;

   gauge_param.X[2] = zdim;

   gauge_param.X[3] = tdim;

   inv_param.Ls = 1;


   gauge_param.anisotropy = 1.0;

   gauge_param.type = QUDA_WILSON_LINKS;

   gauge_param.gauge_order = QUDA_QDP_GAUGE_ORDER;

   gauge_param.t_boundary = QUDA_ANTI_PERIODIC_T;


   gauge_param.cpu_prec = cpu_prec;

   gauge_param.cuda_prec = cuda_prec;

   gauge_param.reconstruct = link_recon;

   gauge_param.cuda_prec_sloppy = cuda_prec_sloppy;

   gauge_param.reconstruct_sloppy = link_recon_sloppy;

   gauge_param.cuda_prec_precondition = cuda_prec_precondition;

   gauge_param.reconstruct_precondition = link_recon_sloppy;

   gauge_param.gauge_fix = QUDA_GAUGE_FIXED_NO;


   inv_param.dslash_type = dslash_type;


   double mass = -0.4086;

   inv_param.kappa = 1.0 / (2.0 * (1 + 3/gauge_param.anisotropy + mass));


   if (dslash_type == QUDA_TWISTED_MASS_DSLASH) {

     inv_param.mu = 0.12;

     inv_param.epsilon = 0.1385;

     //inv_param.twist_flavor = QUDA_TWIST_NONDEG_DOUBLET;

     inv_param.twist_flavor = QUDA_TWIST_PLUS;

     inv_param.Ls = (inv_param.twist_flavor == QUDA_TWIST_NONDEG_DOUBLET) ? 2 : 1;

   } else if (dslash_type == QUDA_DOMAIN_WALL_DSLASH) {

     inv_param.mass = 0.02;

     inv_param.m5 = -1.8;

     kappa5 = 0.5/(5 + inv_param.m5);

     inv_param.Ls = Lsdim;

   }


   // offsets used only by multi-shift solver

   inv_param.num_offset = 4;

   double offset[4] = {0.01, 0.02, 0.03, 0.04};

   for (int i=0; i<inv_param.num_offset; i++) inv_param.offset[i] = offset[i];


   if (inv_param.dslash_type == QUDA_TWISTED_MASS_DSLASH) {

     inv_param.matpc_type = QUDA_MATPC_EVEN_EVEN_ASYMMETRIC;

     //inv_param.matpc_type = QUDA_MATPC_EVEN_EVEN;

     //inv_param.solution_type = QUDA_MATPC_SOLUTION;

     inv_param.solution_type = QUDA_MAT_SOLUTION;

   } else {

     inv_param.matpc_type = QUDA_MATPC_EVEN_EVEN;

     inv_param.solution_type = QUDA_MATPC_SOLUTION;

   }


   inv_param.dagger = QUDA_DAG_NO;

   inv_param.mass_normalization = QUDA_KAPPA_NORMALIZATION;

   inv_param.solver_normalization = QUDA_DEFAULT_NORMALIZATION;


   inv_param.solve_type = QUDA_NORMOP_PC_SOLVE;


   inv_param.pipeline = 0;


   inv_param.gcrNkrylov = 10;

   inv_param.tol = 1e-10;


   //inv_param.inv_type = QUDA_EIGCG_INVERTER;

   inv_param.inv_type = QUDA_INC_EIGCG_INVERTER;


   inv_param.rhs_idx = 0;


   if(inv_param.inv_type == QUDA_EIGCG_INVERTER || inv_param.inv_type == QUDA_INC_EIGCG_INVERTER ){

     inv_param.solve_type = QUDA_NORMOP_PC_SOLVE;

     inv_param.nev = 8;

     inv_param.max_search_dim = 128;

     inv_param.deflation_grid = 24;//to test the stuff

     inv_param.cuda_prec_ritz = cuda_prec;

     inv_param.tol_restart = 5e+3*inv_param.tol;//think about this...

   }else{

     inv_param.nev = 0;

     inv_param.max_search_dim = 0;

     inv_param.tol_restart = 0.0;//restart is not requested...

   }


 #if __COMPUTE_CAPABILITY__ >= 200

   // require both L2 relative and heavy quark residual to determine convergence

   inv_param.residual_type = static_cast<QudaResidualType>(QUDA_L2_RELATIVE_RESIDUAL | QUDA_HEAVY_QUARK_RESIDUAL);

   inv_param.tol_hq = 1e-3; // specify a tolerance for the residual for heavy quark residual

 #else

   // Pre Fermi architecture only supports L2 relative residual norm

   inv_param.residual_type = QUDA_L2_RELATIVE_RESIDUAL;

 #endif

   // these can be set individually

   for (int i=0; i<inv_param.num_offset; i++) {

     inv_param.tol_offset[i] = inv_param.tol;

     inv_param.tol_hq_offset[i] = inv_param.tol_hq;

   }


   inv_param.maxiter = 5000;

   inv_param.reliable_delta = 1e-1; // ignored by multi-shift solver


   // domain decomposition preconditioner parameters

   inv_param.inv_type_precondition = QUDA_INVALID_INVERTER;

   inv_param.schwarz_type = QUDA_ADDITIVE_SCHWARZ;

   inv_param.precondition_cycle = 1;

   inv_param.tol_precondition = 1e-1;

   inv_param.maxiter_precondition = 10;

   inv_param.verbosity_precondition = QUDA_SILENT;

   inv_param.cuda_prec_precondition = cuda_prec_precondition;

   inv_param.omega = 1.0;


   inv_param.use_sloppy_partial_accumulator = 1;


   inv_param.cpu_prec = cpu_prec;

   inv_param.cuda_prec = cuda_prec;

   inv_param.cuda_prec_sloppy = cuda_prec_sloppy;

   inv_param.preserve_source = QUDA_PRESERVE_SOURCE_NO;

   inv_param.gamma_basis = QUDA_DEGRAND_ROSSI_GAMMA_BASIS;

   inv_param.dirac_order = QUDA_DIRAC_ORDER;


   inv_param.input_location = QUDA_CPU_FIELD_LOCATION;

   inv_param.output_location = QUDA_CPU_FIELD_LOCATION;


   inv_param.tune = tune ? QUDA_TUNE_YES : QUDA_TUNE_NO;


   gauge_param.ga_pad = 0;//24*24*24/2;

   inv_param.sp_pad = 0;//24*24*24/2;

   inv_param.cl_pad = 0; // 24*24*24/2;


   // For multi-GPU, ga_pad must be large enough to store a time-slice

 #ifdef MULTI_GPU

   int x_face_size = gauge_param.X[1]*gauge_param.X[2]*gauge_param.X[3]/2;

   int y_face_size = gauge_param.X[0]*gauge_param.X[2]*gauge_param.X[3]/2;

   int z_face_size = gauge_param.X[0]*gauge_param.X[1]*gauge_param.X[3]/2;

   int t_face_size = gauge_param.X[0]*gauge_param.X[1]*gauge_param.X[2]/2;

   int pad_size =MAX(x_face_size, y_face_size);

   pad_size = MAX(pad_size, z_face_size);

   pad_size = MAX(pad_size, t_face_size);

   gauge_param.ga_pad = pad_size;

 #endif


   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH) {

     inv_param.clover_cpu_prec = cpu_prec;

     inv_param.clover_cuda_prec = cuda_prec;

     inv_param.clover_cuda_prec_sloppy = cuda_prec_sloppy;

     inv_param.clover_cuda_prec_precondition = cuda_prec_precondition;

     inv_param.clover_order = QUDA_PACKED_CLOVER_ORDER;

   }


   inv_param.verbosity = QUDA_VERBOSE;


   // *** Everything between here and the call to initQuda() is

   // *** application-specific.


   // set parameters for the reference Dslash, and prepare fields to be loaded

   if (dslash_type == QUDA_DOMAIN_WALL_DSLASH) {

     dw_setDims(gauge_param.X, inv_param.Ls);

   } else {

     setDims(gauge_param.X);

   }


   setSpinorSiteSize(24);


   size_t gSize = (gauge_param.cpu_prec == QUDA_DOUBLE_PRECISION) ? sizeof(double) : sizeof(float);

   size_t sSize = (inv_param.cpu_prec == QUDA_DOUBLE_PRECISION) ? sizeof(double) : sizeof(float);


   void *gauge[4], *clover_inv=0, *clover=0;


   for (int dir = 0; dir < 4; dir++) {

     gauge[dir] = malloc(V*gaugeSiteSize*gSize);

   }


   if (strcmp(latfile,"")) {  // load in the command line supplied gauge field

     read_gauge_field(latfile, gauge, gauge_param.cpu_prec, gauge_param.X, argc, argv);

     construct_gauge_field(gauge, 2, gauge_param.cpu_prec, &gauge_param);

     //printfQuda("Configuration load: done.");

   } else { // else generate a random SU(3) field

     construct_gauge_field(gauge, 1, gauge_param.cpu_prec, &gauge_param);

   }


   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH) {

     double norm = 0.0; // clover components are random numbers in the range (-norm, norm)

     double diag = 1.0; // constant added to the diagonal


     size_t cSize = (inv_param.clover_cpu_prec == QUDA_DOUBLE_PRECISION) ? sizeof(double) : sizeof(float);

     clover_inv = malloc(V*cloverSiteSize*cSize);

     construct_clover_field(clover_inv, norm, diag, inv_param.clover_cpu_prec);


     // The uninverted clover term is only needed when solving the unpreconditioned

     // system or when using "asymmetric" even/odd preconditioning.

     int preconditioned = (inv_param.solve_type == QUDA_DIRECT_PC_SOLVE ||

                           inv_param.solve_type == QUDA_NORMOP_PC_SOLVE);

     int asymmetric = preconditioned &&

                          (inv_param.matpc_type == QUDA_MATPC_EVEN_EVEN_ASYMMETRIC ||

                           inv_param.matpc_type == QUDA_MATPC_ODD_ODD_ASYMMETRIC);

     if (!preconditioned) {

       clover = clover_inv;

       clover_inv = NULL;

     } else if (asymmetric) { // fake it by using the same random matrix

       clover = clover_inv;   // for both clover and clover_inv

     } else {

       clover = NULL;

     }

   }


   void *spinorIn = malloc(V*spinorSiteSize*sSize*inv_param.Ls);

   void *spinorCheck = malloc(V*spinorSiteSize*sSize*inv_param.Ls);


   void *spinorOut = NULL;

   spinorOut = malloc(V*spinorSiteSize*sSize*inv_param.Ls);


   void *ritzVects = 0;


   double *inverse_ritzVals = 0;


   const int defl_dim  = inv_param.deflation_grid*inv_param.nev;


   ritzVects = malloc(defl_dim*(Vh)*spinorSiteSize*sSize*inv_param.Ls);


   memset(ritzVects, 0, defl_dim*inv_param.Ls*(Vh)*spinorSiteSize*sSize);


   inverse_ritzVals = (double*)malloc(defl_dim*sizeof(double));


   //printf("\nDeflation: %p :: %u\n", ritzVects, defl_size);


   // create a point source at 0 (in each subvolume...  FIXME)

   memset(spinorIn, 0, inv_param.Ls*V*spinorSiteSize*sSize);


   memset(spinorCheck, 0, inv_param.Ls*V*spinorSiteSize*sSize);


   memset(spinorOut, 0, inv_param.Ls*V*spinorSiteSize*sSize);


   if (inv_param.cpu_prec == QUDA_SINGLE_PRECISION)

   {

     //((float*)spinorIn)[0] = 1.0;

     for (int i=0; i<inv_param.Ls*V*spinorSiteSize; i++) ((float*)spinorIn)[i] = rand() / (float)RAND_MAX;

   }

   else

   {

     //((double*)spinorIn)[0] = 1.0;

     for (int i=0; i<inv_param.Ls*V*spinorSiteSize; i++) ((double*)spinorIn)[i] = rand() / (double)RAND_MAX;

     //for (int i=0; i<inv_param.Ls*24*24*24*spinorSiteSize; i++) ((double*)spinorIn)[i] = comm_rank() == 0 ? rand() / (double)RAND_MAX: 0.0;

   }


   // start the timer

   double time0 = -((double)clock());


   // initialize the QUDA library

   initQuda(device);


   printfQuda("\nOpen MAGMA...\n");


   openMagma();


   printfQuda("\n...done.\n");


   // load the gauge field

   loadGaugeQuda((void*)gauge, &gauge_param);


   // load the clover term, if desired

   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH) loadCloverQuda(clover, clover_inv, &inv_param);


   // perform the inversions

   printfQuda("\nStart the incremental stage.\n");


   for(int is = 0; is < inv_param.deflation_grid; is++)

   {

     if (inv_param.cpu_prec == QUDA_SINGLE_PRECISION)

     {

       for (int i=0; i<inv_param.Ls*V*spinorSiteSize; i++) ((float*)spinorIn)[i] = rand() / (float)RAND_MAX;

     }

     else

     {

       memset(spinorIn, 0, inv_param.Ls*V*spinorSiteSize*sSize);

       memset(spinorOut, 0, inv_param.Ls*V*spinorSiteSize*sSize);


       for (int i=0; i<inv_param.Ls*V*spinorSiteSize; i++) ((double*)spinorIn)[i] = rand() / (double)RAND_MAX;

       //for (int i=0; i<inv_param.Ls*24*24*24*spinorSiteSize; i++) ((double*)spinorIn)[i] = comm_rank() == 0 ? rand() / (double)RAND_MAX: 0.0;

     }


     double time1 = -((double)clock());


     inv_param.cuda_prec_sloppy = cuda_prec_sloppy;

     incrementalEigQuda(spinorOut, spinorIn, &inv_param, NULL, NULL, 0);


     time1 += clock();

     time1 /= CLOCKS_PER_SEC;


     printfQuda("\nDone: %i iter / %g secs = %g Gflops, total time = %g secs\n",

          inv_param.iter, inv_param.secs, inv_param.gflops/inv_param.secs, time1);


     printfQuda("\n Current RHS : %d\n", inv_param.rhs_idx);

   }


   printfQuda("\n Total eigCG RHS : %d\n", inv_param.rhs_idx);

 //***

   printfQuda("\nStart the initCG stage.\n");


   const int initCGruns = 16;


   int last_rhs  = 0;


   for(int is = inv_param.deflation_grid; is < (inv_param.deflation_grid+initCGruns); is++)

   {

     if (inv_param.cpu_prec == QUDA_SINGLE_PRECISION)

     {

       for (int i=0; i<inv_param.Ls*V*spinorSiteSize; i++) ((float*)spinorIn)[i] = rand() / (float)RAND_MAX;

     }

     else

     {

       memset(spinorIn, 0, inv_param.Ls*V*spinorSiteSize*sSize);

       memset(spinorOut, 0, inv_param.Ls*V*spinorSiteSize*sSize);


       for (int i=0; i<inv_param.Ls*V*spinorSiteSize; i++) ((double*)spinorIn)[i] = rand() / (double)RAND_MAX;

       //for (int i=0; i<inv_param.Ls*24*24*24*spinorSiteSize; i++) ((double*)spinorIn)[i] = comm_rank() == 0 ? rand() / (double)RAND_MAX: 0.0;

     }


     if(is == (inv_param.deflation_grid+initCGruns-1)) last_rhs = 1;


     double time1 = -((double)clock());


     inv_param.cuda_prec_sloppy = cuda_prec_precondition;//QUDA_HALF_PRECISION

     incrementalEigQuda(spinorOut, spinorIn, &inv_param, ritzVects, inverse_ritzVals, last_rhs);


     time1 += clock();

     time1 /= CLOCKS_PER_SEC;


     printfQuda("\nDone: %i iter / %g secs = %g Gflops, total time = %g secs\n", inv_param.iter, inv_param.secs, inv_param.gflops/inv_param.secs, time1);

   }


   printfQuda("\nTotal  InitCG RHS : %d\n", inv_param.rhs_idx);


   // stop the timer

   time0 += clock();

   time0 /= CLOCKS_PER_SEC;


   closeMagma();


   printfQuda("Device memory used:\n   Spinor: %f GiB\n    Gauge: %f GiB\n",

          inv_param.spinorGiB, gauge_param.gaugeGiB);

   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH) printfQuda("   Clover: %f GiB\n", inv_param.cloverGiB);

   printfQuda("\nDone: %i iter / %g secs = %g Gflops, total time = %g secs\n",

          inv_param.iter, inv_param.secs, inv_param.gflops/inv_param.secs, time0);


     if (inv_param.solution_type == QUDA_MAT_SOLUTION) {


       if (dslash_type == QUDA_TWISTED_MASS_DSLASH) {

         if(inv_param.twist_flavor == QUDA_TWIST_PLUS || inv_param.twist_flavor == QUDA_TWIST_MINUS)

           tm_mat(spinorCheck, gauge, spinorOut, inv_param.kappa, inv_param.mu, inv_param.twist_flavor, 0, inv_param.cpu_prec, gauge_param);

         else

         {

           int tm_offset = V*spinorSiteSize; //12*spinorRef->Volume();

           void *evenOut = spinorCheck;

           void *oddOut  = cpu_prec == sizeof(double) ? (void*)((double*)evenOut + tm_offset): (void*)((float*)evenOut + tm_offset);


           void *evenIn  = spinorOut;

           void *oddIn   = cpu_prec == sizeof(double) ? (void*)((double*)evenIn + tm_offset): (void*)((float*)evenIn + tm_offset);


           tm_ndeg_mat(evenOut, oddOut, gauge, evenIn, oddIn, inv_param.kappa, inv_param.mu, inv_param.epsilon, 0, inv_param.cpu_prec, gauge_param);

         }

       } else if (dslash_type == QUDA_WILSON_DSLASH || dslash_type == QUDA_CLOVER_WILSON_DSLASH) {

         wil_mat(spinorCheck, gauge, spinorOut, inv_param.kappa, 0, inv_param.cpu_prec, gauge_param);

       } else if (dslash_type == QUDA_DOMAIN_WALL_DSLASH) {

         dw_mat(spinorCheck, gauge, spinorOut, kappa5, inv_param.dagger, inv_param.cpu_prec, gauge_param, inv_param.mass);

       } else {

         printfQuda("Unsupported dslash_type\n");

         exit(-1);

       }

       if (inv_param.mass_normalization == QUDA_MASS_NORMALIZATION) {

         if (dslash_type == QUDA_DOMAIN_WALL_DSLASH) {

           ax(0.5/kappa5, spinorCheck, V*spinorSiteSize*inv_param.Ls, inv_param.cpu_prec);

         } else {

           ax(0.5/inv_param.kappa, spinorCheck, V*spinorSiteSize, inv_param.cpu_prec);

         }

       }


     } else if(inv_param.solution_type == QUDA_MATPC_SOLUTION) {


       if (dslash_type == QUDA_TWISTED_MASS_DSLASH) {

         if (inv_param.twist_flavor != QUDA_TWIST_MINUS && inv_param.twist_flavor != QUDA_TWIST_PLUS)

           errorQuda("Twisted mass solution type not supported");

         tm_matpc(spinorCheck, gauge, spinorOut, inv_param.kappa, inv_param.mu, inv_param.twist_flavor,

                  inv_param.matpc_type, 0, inv_param.cpu_prec, gauge_param);

       } else if (dslash_type == QUDA_WILSON_DSLASH || dslash_type == QUDA_CLOVER_WILSON_DSLASH) {

         wil_matpc(spinorCheck, gauge, spinorOut, inv_param.kappa, inv_param.matpc_type, 0,

                   inv_param.cpu_prec, gauge_param);

       } else if (dslash_type == QUDA_DOMAIN_WALL_DSLASH) {

         dw_matpc(spinorCheck, gauge, spinorOut, kappa5, inv_param.matpc_type, 0, inv_param.cpu_prec, gauge_param, inv_param.mass);

       } else {

         printfQuda("Unsupported dslash_type\n");

         exit(-1);

       }


       if (inv_param.mass_normalization == QUDA_MASS_NORMALIZATION) {

         if (dslash_type == QUDA_DOMAIN_WALL_DSLASH) {

           ax(0.25/(kappa5*kappa5), spinorCheck, Vh*spinorSiteSize*inv_param.Ls, inv_param.cpu_prec);

         } else {

           ax(0.25/(inv_param.kappa*inv_param.kappa), spinorCheck, Vh*spinorSiteSize, inv_param.cpu_prec);


         }

       }


     }


     int vol = inv_param.solution_type == QUDA_MAT_SOLUTION ? V : Vh;

     mxpy(spinorIn, spinorCheck, vol*spinorSiteSize*inv_param.Ls, inv_param.cpu_prec);

     double nrm2 = norm_2(spinorCheck, vol*spinorSiteSize*inv_param.Ls, inv_param.cpu_prec);

     double src2 = norm_2(spinorIn, vol*spinorSiteSize*inv_param.Ls, inv_param.cpu_prec);

     double l2r = sqrt(nrm2 / src2);


     printfQuda("Residuals: (L2 relative) tol %g, QUDA = %g, host = %g; (heavy-quark) tol %g, QUDA = %g\n",

                inv_param.tol, inv_param.true_res, l2r, inv_param.tol_hq, inv_param.true_res_hq);


   free(ritzVects);


   free(inverse_ritzVals);


   freeGaugeQuda();

   if (dslash_type == QUDA_CLOVER_WILSON_DSLASH) freeCloverQuda();


   // finalize the QUDA library

   endQuda();


   // finalize the communications layer

   finalizeComms();


   return 0;

 }

QudaInvertParam_s::maxiter_precondition
int maxiter_precondition
Definition: quda.h:216

QUDA_TUNE_NO
Definition: enum_quda.h:223

gauge_param
QudaGaugeParam gauge_param
Definition: dslash_test.cpp:37

QudaInvertParam_s::secs
double secs
Definition: quda.h:183

dimPartitioned
int dimPartitioned(int dim)
Definition: test_util.cpp:1577

QudaInvertParam_s::dirac_order
QudaDiracFieldOrder dirac_order
Definition: quda.h:156

QUDA_VERBOSE
Definition: enum_quda.h:217

QudaInvertParam_s::mass_normalization
QudaMassNormalization mass_normalization
Definition: quda.h:146

QudaInvertParam_s::tol_hq_offset
double tol_hq_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:134

QudaGaugeParam_s::reconstruct_sloppy
QudaReconstructType reconstruct_sloppy
Definition: quda.h:46

QudaGaugeParam_s::anisotropy
double anisotropy
Definition: quda.h:31

freeCloverQuda
void freeCloverQuda(void)
Definition: interface_quda.cpp:996

Vh
__constant__ int Vh
Definition: dslash_constants.h:152

latfile
char latfile[]
Definition: test_util.cpp:1561

QUDA_MAT_SOLUTION
Definition: enum_quda.h:119

QUDA_PACKED_CLOVER_ORDER
Definition: enum_quda.h:208

endQuda
void endQuda(void)
Definition: interface_quda.cpp:1018

construct_gauge_field
void construct_gauge_field(void **gauge, int type, QudaPrecision precision, QudaGaugeParam *param)
Definition: test_util.cpp:1003

QudaInvertParam_s::solve_type
QudaSolveType solve_type
Definition: quda.h:143

QudaInvertParam_s::verbosity_precondition
QudaVerbosity verbosity_precondition
Definition: quda.h:210

QudaPrecision
enum QudaPrecision_s QudaPrecision

V
int V
Definition: test_util.cpp:29

QudaGaugeParam_s::ga_pad
int ga_pad
Definition: quda.h:53

misc.h

dw_setDims
void dw_setDims(int *X, const int L5)
Definition: test_util.cpp:125

link_recon_sloppy
QudaReconstructType link_recon_sloppy
Definition: test_util.cpp:1550

QudaInvertParam_s::mu
double mu
Definition: quda.h:97

QudaGaugeParam_s::gauge_fix
QudaGaugeFixed gauge_fix
Definition: quda.h:51

QudaInvertParam_s::tune
QudaTune tune
Definition: quda.h:185

QudaInvertParam_s::schwarz_type
QudaSchwarzType schwarz_type
Definition: quda.h:225

quda::norm
__host__ __device__ ValueType norm(const complex< ValueType > &z)
Returns the magnitude of z squared.
Definition: complex_quda.h:859

ydim
int ydim
Definition: test_util.cpp:1554

tm_mat
void tm_mat(void *out, void **gauge, void *in, double kappa, double mu, QudaTwistFlavorType flavor, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:312

QudaResidualType
enum QudaResidualType_s QudaResidualType

QUDA_MASS_NORMALIZATION
Definition: enum_quda.h:178

QudaInvertParam_s::inv_type_precondition
QudaInverterType inv_type_precondition
Definition: quda.h:203

QUDA_INVALID_PRECISION
Definition: enum_quda.h:51

QUDA_TWIST_PLUS
Definition: enum_quda.h:332

QudaGaugeParam_s::type
QudaLinkType type
Definition: quda.h:35

QudaInvertParam_s::kappa
double kappa
Definition: quda.h:89

QudaInvertParam_s::cuda_prec_ritz
QudaPrecision cuda_prec_ritz
Definition: quda.h:238

errorQuda
#define errorQuda(...)
Definition: util_quda.h:73

QudaInvertParam_s::tol
double tol
Definition: quda.h:102

QudaInvertParam_s::dslash_type
QudaDslashType dslash_type
Definition: quda.h:85

QUDA_GAUGE_FIXED_NO
Definition: enum_quda.h:65

QudaGaugeParam_s::reconstruct_precondition
QudaReconstructType reconstruct_precondition
Definition: quda.h:49

QudaInvertParam_s::inv_type
QudaInverterType inv_type
Definition: quda.h:86

test_util.h

QudaInvertParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:152

cloverSiteSize
#define cloverSiteSize
Definition: test_util.h:8

setDims
void setDims(int *)
Definition: test_util.cpp:88

QUDA_HALF_PRECISION
Definition: enum_quda.h:48

QUDA_QDP_GAUGE_ORDER
Definition: enum_quda.h:32

quda::sqrt
__host__ __device__ ValueType sqrt(ValueType x)
Definition: complex_quda.h:105

loadGaugeQuda
void loadGaugeQuda(void *h_gauge, QudaGaugeParam *param)
Definition: interface_quda.cpp:452

QUDA_WILSON_LINKS
Definition: enum_quda.h:20

QudaInvertParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:151

process_command_line_option
int process_command_line_option(int argc, char **argv, int *idx)
Definition: test_util.cpp:1635

tm_ndeg_mat
void tm_ndeg_mat(void *evenOut, void *oddOut, void **gauge, void *evenIn, void *oddIn, double kappa, double mu, double epsilon, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:556

QUDA_EIGCG_INVERTER
Definition: enum_quda.h:107

gaugeSiteSize
#define gaugeSiteSize
Definition: fat_force_quda.h:11

gridsize_from_cmdline
int gridsize_from_cmdline[]
Definition: test_util.cpp:1559

gauge_qio.h

QudaInvertParam_s::dagger
QudaDagType dagger
Definition: quda.h:145

finalizeComms
void finalizeComms()
Definition: test_util.cpp:65

QudaGaugeParam_s::gauge_order
QudaGaugeFieldOrder gauge_order
Definition: quda.h:36

dw_mat
void dw_mat(void *out, void **gauge, void *in, double kappa, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:1279

QudaInvertParam_s::true_res
double true_res
Definition: quda.h:105

util_quda.h

tm_matpc
void tm_matpc(void *outEven, void **gauge, void *inEven, double kappa, double mu, QudaTwistFlavorType flavor, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:361

QUDA_TWIST_NONDEG_DOUBLET
Definition: enum_quda.h:333

get_prec_str
const char * get_prec_str(QudaPrecision prec)
Definition: misc.cpp:658

loadCloverQuda
void loadCloverQuda(void *h_clover, void *h_clovinv, QudaInvertParam *inv_param)
Definition: interface_quda.cpp:659

cpu_prec
QudaPrecision cpu_prec
Definition: dslash_test.cpp:34

openMagma
void openMagma()
Definition: interface_quda.cpp:87

spinorSiteSize
#define spinorSiteSize
Definition: interface_quda.cpp:54

QUDA_DEFAULT_NORMALIZATION
Definition: enum_quda.h:184

QudaInvertParam_s::clover_cuda_prec_sloppy
QudaPrecision clover_cuda_prec_sloppy
Definition: quda.h:163

QudaInvertParam_s::input_location
QudaFieldLocation input_location
Definition: quda.h:82

freeGaugeQuda
void freeGaugeQuda(void)
Definition: interface_quda.cpp:929

ax
void ax(double a, void *x, int len, QudaPrecision precision)
Definition: blas_reference.cpp:22

QudaInvertParam_s::reliable_delta
double reliable_delta
Definition: quda.h:108

QudaInvertParam_s::pipeline
int pipeline
Definition: quda.h:121

QudaInvertParam_s::solution_type
QudaSolutionType solution_type
Definition: quda.h:142

QUDA_MATPC_SOLUTION
Definition: enum_quda.h:121

QudaInvertParam_s::solver_normalization
QudaSolverNormalization solver_normalization
Definition: quda.h:147

QUDA_TUNE_YES
Definition: enum_quda.h:224

QudaInvertParam_s::clover_cuda_prec
QudaPrecision clover_cuda_prec
Definition: quda.h:162

QudaInvertParam_s::precondition_cycle
int precondition_cycle
Definition: quda.h:222

QUDA_MATPC_EVEN_EVEN_ASYMMETRIC
Definition: enum_quda.h:165

QUDA_SILENT
Definition: enum_quda.h:215

MAX
#define MAX(a, b)
Definition: deflation_test.cpp:25

initQuda
void initQuda(int device)
Definition: interface_quda.cpp:428

dw_matpc
void dw_matpc(void *out, void **gauge, void *in, double kappa, QudaMatPCType matpc_type, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param, double mferm)
Definition: domain_wall_dslash_reference.cpp:1336

QudaInvertParam_s::spinorGiB
double spinorGiB
Definition: quda.h:180

device
int device
Definition: test_util.cpp:1546

QudaInvertParam_s::output_location
QudaFieldLocation output_location
Definition: quda.h:83

QudaInvertParam_s::clover_cuda_prec_precondition
QudaPrecision clover_cuda_prec_precondition
Definition: quda.h:164

tune
bool tune
Definition: test_util.cpp:1562

QudaInvertParam_s::m5
double m5
Definition: quda.h:91

Lsdim
int Lsdim
Definition: test_util.cpp:1557

QUDA_PRESERVE_SOURCE_NO
Definition: enum_quda.h:189

QudaGaugeParam_s
Definition: quda.h:25

QudaInvertParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:153

QudaInvertParam_s::verbosity
QudaVerbosity verbosity
Definition: quda.h:174

setSpinorSiteSize
void setSpinorSiteSize(int n)
Definition: test_util.cpp:150

QUDA_ADDITIVE_SCHWARZ
Definition: enum_quda.h:141

QudaInvertParam_s::tol_offset
double tol_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:131

newQudaInvertParam
QudaInvertParam newQudaInvertParam(void)

QudaInvertParam_s::gflops
double gflops
Definition: quda.h:182

get_recon_str
const char * get_recon_str(QudaReconstructType recon)
Definition: misc.cpp:724

QudaGaugeParam_s::cuda_prec_precondition
QudaPrecision cuda_prec_precondition
Definition: quda.h:48

QudaInvertParam_s::clover_order
QudaCloverFieldOrder clover_order
Definition: quda.h:166

QudaInvertParam_s::tol_hq
double tol_hq
Definition: quda.h:104

face_quda.h

QudaInvertParam_s::nev
int nev
Definition: quda.h:240

QUDA_CLOVER_WILSON_DSLASH
Definition: enum_quda.h:76

blas_reference.h

QudaInvertParam_s::true_res_hq
double true_res_hq
Definition: quda.h:106

QudaInvertParam_s::gamma_basis
QudaGammaBasis gamma_basis
Definition: quda.h:158

link_recon
QudaReconstructType link_recon
Definition: test_util.cpp:1549

QudaGaugeParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:45

QudaInvertParam_s::max_search_dim
int max_search_dim
Definition: quda.h:242

QudaInvertParam_s::tol_precondition
double tol_precondition
Definition: quda.h:213

dslash_util.h

mxpy
void mxpy(void *x, void *y, int len, QudaPrecision precision)
Definition: blas_reference.cpp:33

QudaInvertParam_s::offset
double offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:128

incrementalEigQuda
void incrementalEigQuda(void *_h_x, void *_h_b, QudaInvertParam *param, void *_h_u, double *inv_eigenvals, int last_rhs)
Definition: interface_quda.cpp:3071

QudaInvertParam_s::use_sloppy_partial_accumulator
int use_sloppy_partial_accumulator
Definition: quda.h:109

QudaGaugeParam_s::reconstruct
QudaReconstructType reconstruct
Definition: quda.h:43

read_gauge_field
void read_gauge_field(char *filename, void *gauge[], QudaPrecision precision, int *X, int argc, char *argv[])
Definition: gauge_qio.cpp:86

QudaGaugeParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:42

QUDA_KAPPA_NORMALIZATION
Definition: enum_quda.h:177

QudaGaugeParam_s::X
int X[4]
Definition: quda.h:29

QudaInvertParam_s::mass
double mass
Definition: quda.h:88

QUDA_HEAVY_QUARK_RESIDUAL
Definition: enum_quda.h:149

QudaInvertParam_s::gcrNkrylov
int gcrNkrylov
Definition: quda.h:192

QudaInvertParam_s::maxiter
int maxiter
Definition: quda.h:107

norm_2
double norm_2(void *v, int len, QudaPrecision precision)
Definition: blas_reference.cpp:48

QudaInvertParam_s::sp_pad
int sp_pad
Definition: quda.h:176

QUDA_WILSON_DSLASH
Definition: enum_quda.h:75

cuda_prec
QudaPrecision cuda_prec
Definition: dslash_test.cpp:35

construct_clover_field
void construct_clover_field(void *clover, double norm, double diag, QudaPrecision precision)
Definition: test_util.cpp:1103

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:50

closeMagma
void closeMagma()
Definition: interface_quda.cpp:98

inv_param
QudaInvertParam inv_param
Definition: dslash_test.cpp:38

wil_mat
void wil_mat(void *out, void **gauge, void *in, double kappa, int dagger_bit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:296

QudaGaugeParam_s::gaugeGiB
double gaugeGiB
Definition: quda.h:60

QudaInvertParam_s::cuda_prec_precondition
QudaPrecision cuda_prec_precondition
Definition: quda.h:154

memset
void * memset(void *s, int c, size_t n)

QUDA_TWISTED_MASS_DSLASH
Definition: enum_quda.h:82

QUDA_MATPC_ODD_ODD_ASYMMETRIC
Definition: enum_quda.h:166

QudaInvertParam_s::iter
int iter
Definition: quda.h:179

QudaInvertParam_s::deflation_grid
int deflation_grid
Definition: quda.h:246

QudaInvertParam_s::tol_restart
double tol_restart
Definition: quda.h:103

if
if(x2 >=X2) return

display_test_info
void display_test_info()
Definition: deflation_test.cpp:50

QUDA_INVALID_INVERTER
Definition: enum_quda.h:109

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:49

QudaReconstructType
enum QudaReconstructType_s QudaReconstructType

quda.h
Main header file for the QUDA library.

spinorOut
cpuColorSpinorField * spinorOut
Definition: dslash_test.cpp:40

QUDA_DEGRAND_ROSSI_GAMMA_BASIS
Definition: enum_quda.h:311

QudaInvertParam_s::Ls
int Ls
Definition: quda.h:92

printfQuda
#define printfQuda(...)
Definition: util_quda.h:67

QUDA_DAG_NO
Definition: enum_quda.h:171

QudaGaugeParam_s::t_boundary
QudaTboundary t_boundary
Definition: quda.h:38

QudaInvertParam_s::twist_flavor
QudaTwistFlavorType twist_flavor
Definition: quda.h:100

QUDA_INC_EIGCG_INVERTER
Definition: enum_quda.h:108

main
int main(int argc, char **argv)
Definition: deflation_test.cpp:71

QUDA_DIRAC_ORDER
Definition: enum_quda.h:196

QudaDslashType
enum QudaDslashType_s QudaDslashType

QUDA_ANTI_PERIODIC_T
Definition: enum_quda.h:42

domain_wall_dslash_reference.h

usage
void usage(char **)
Definition: test_util.cpp:1584

QudaInvertParam_s::cl_pad
int cl_pad
Definition: quda.h:177

QUDA_DIRECT_PC_SOLVE
Definition: enum_quda.h:131

QudaInvertParam_s::residual_type
QudaResidualType residual_type
Definition: quda.h:235

QudaInvertParam_s::rhs_idx
int rhs_idx
Definition: quda.h:244

wil_matpc
void wil_matpc(void *outEven, void **gauge, void *inEven, double kappa, QudaMatPCType matpc_type, int daggerBit, QudaPrecision precision, QudaGaugeParam &gauge_param)
Definition: wilson_dslash_reference.cpp:336

QudaInvertParam_s::num_offset
int num_offset
Definition: quda.h:123

QudaInvertParam_s::cloverGiB
double cloverGiB
Definition: quda.h:181

return
return
Definition: hisq_paths_force_core.h:380

wilson_dslash_reference.h

QudaInvertParam_s::epsilon
double epsilon
Definition: quda.h:98

QUDA_DOMAIN_WALL_DSLASH
Definition: enum_quda.h:77

QudaInvertParam_s::omega
double omega
Definition: quda.h:219

prec_sloppy
QudaPrecision prec_sloppy
Definition: test_util.cpp:1552

mass
double mass
Definition: test_util.cpp:1569

QUDA_NORMOP_PC_SOLVE
Definition: enum_quda.h:132

prec
QudaPrecision prec
Definition: test_util.cpp:1551

QUDA_MATPC_EVEN_EVEN
Definition: enum_quda.h:163

xdim
int xdim
Definition: test_util.cpp:1553

tdim
int tdim
Definition: test_util.cpp:1556

dslash_type
QudaDslashType dslash_type
Definition: test_util.cpp:1560

QudaInvertParam_s::clover_cpu_prec
QudaPrecision clover_cpu_prec
Definition: quda.h:161

QUDA_TWIST_MINUS
Definition: enum_quda.h:331

QudaInvertParam_s
Definition: quda.h:80

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:270

initComms
void initComms(int argc, char **argv, const int *commDims)
Definition: test_util.cpp:48

gauge
void * gauge[4]
Definition: su3_test.cpp:15

QudaInvertParam_s::matpc_type
QudaMatPCType matpc_type
Definition: quda.h:144

zdim
int zdim
Definition: test_util.cpp:1555

QUDA_L2_RELATIVE_RESIDUAL
Definition: enum_quda.h:147

kappa5
double kappa5
Definition: dslash_test.cpp:32

QudaGaugeParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:40

newQudaGaugeParam
QudaGaugeParam newQudaGaugeParam(void)

QUDA_RECONSTRUCT_INVALID
Definition: enum_quda.h:61

QudaInvertParam_s::preserve_source
QudaPreserveSource preserve_source
Definition: quda.h:149