quda-ref/v1.0.0/milc__interface_8cpp_source.html

 #include <cstdio>
 #include <cstdlib>
 #include <iostream>
 #include <quda.h>
 #include <quda_milc_interface.h>
 #include <quda_internal.h>
 #include <color_spinor_field.h>
 #include <string.h>
 #include <unitarization_links.h>
 #include <ks_improved_force.h>
 #include <dslash_quda.h>

 #define MAX(a,b) ((a)>(b)?(a):(b))

 #ifdef BUILD_MILC_INTERFACE

 // code for NVTX taken from Jiri Kraus' blog post:
 // http://devblogs.nvidia.com/parallelforall/cuda-pro-tip-generate-custom-application-profile-timelines-nvtx/

 #ifdef INTERFACE_NVTX

 #if QUDA_NVTX_VERSION == 3
 #include "nvtx3/nvToolsExt.h"
 #else
 #include "nvToolsExt.h"
 #endif

 static const uint32_t colors[] = { 0x0000ff00, 0x000000ff, 0x00ffff00, 0x00ff00ff, 0x0000ffff, 0x00ff0000, 0x00ffffff };
 static const int num_colors = sizeof(colors)/sizeof(uint32_t);

 #define PUSH_RANGE(name,cid) { \
   int color_id = cid; \
   color_id = color_id%num_colors;\
   nvtxEventAttributes_t eventAttrib = {0}; \
   eventAttrib.version = NVTX_VERSION; \
   eventAttrib.size = NVTX_EVENT_ATTRIB_STRUCT_SIZE; \
   eventAttrib.colorType = NVTX_COLOR_ARGB; \
   eventAttrib.color = colors[color_id]; \
   eventAttrib.messageType = NVTX_MESSAGE_TYPE_ASCII; \
   eventAttrib.message.ascii = name; \
   nvtxRangePushEx(&eventAttrib); \
 }
 #define POP_RANGE nvtxRangePop();
 #else
 #define PUSH_RANGE(name,cid)
 #define POP_RANGE
 #endif


 static bool initialized = false;
 static int gridDim[4];
 static int localDim[4];

 static bool invalidate_quda_gauge = true;
 static bool create_quda_gauge = false;

 static bool invalidate_quda_mom = true;

 static void *df_preconditioner = nullptr;

 // set to 1 for GPU resident pipeline (not yet supported in mainline MILC)
 #define MOM_PIPE 0

 using namespace quda;
 using namespace quda::fermion_force;


 #define QUDAMILC_VERBOSE 1

 template <bool start> void inline qudamilc_called(const char *func, QudaVerbosity verb)
 {
   // add NVTX markup if enabled
   if (start) {
     PUSH_RANGE(func, 1);
   } else {
     POP_RANGE;
   }

   #ifdef QUDAMILC_VERBOSE
   if (verb >= QUDA_VERBOSE) {
     if (start) {
       printfQuda("QUDA_MILC_INTERFACE: %s (called) \n", func);
     } else {
       printfQuda("QUDA_MILC_INTERFACE: %s (return) \n", func);
     }
   }
 #endif
 }

 template <bool start> void inline qudamilc_called(const char *func) { qudamilc_called<start>(func, getVerbosity()); }

 void qudaSetMPICommHandle(void *mycomm) { setMPICommHandleQuda(mycomm); }

 void qudaInit(QudaInitArgs_t input)
 {
   if (initialized) return;
   setVerbosityQuda(input.verbosity, "", stdout);
   qudamilc_called<true>(__func__);
   qudaSetLayout(input.layout);
   initialized = true;
   qudamilc_called<false>(__func__);
 }

 void qudaFinalize()
 {
   qudamilc_called<true>(__func__);
   endQuda();
   qudamilc_called<false>(__func__);
 }
 #if defined(MULTI_GPU) && !defined(QMP_COMMS)

 static int rankFromCoords(const int *coords, void *fdata)
 {
   int *dims = static_cast<int *>(fdata);

   int rank = coords[3];
   for (int i = 2; i >= 0; i--) {
     rank = dims[i] * rank + coords[i];
   }
   return rank;
 }
 #endif

 void qudaSetLayout(QudaLayout_t input)
 {
   int local_dim[4];
   for(int dir=0; dir<4; ++dir){ local_dim[dir] = input.latsize[dir]; }
 #ifdef MULTI_GPU
   for(int dir=0; dir<4; ++dir){ local_dim[dir] /= input.machsize[dir]; }
 #endif
   for(int dir=0; dir<4; ++dir){
     if(local_dim[dir]%2 != 0){
       printf("Error: Odd lattice dimensions are not supported\n");
       exit(1);
     }
   }

   for(int dir=0; dir<4; ++dir) localDim[dir] = local_dim[dir];

 #ifdef MULTI_GPU
   for(int dir=0; dir<4; ++dir)  gridDim[dir] = input.machsize[dir];
 #ifdef QMP_COMMS
   initCommsGridQuda(4, gridDim, nullptr, nullptr);
 #else
   initCommsGridQuda(4, gridDim, rankFromCoords, (void *)(gridDim));
 #endif
   static int device = -1;
 #else
   for(int dir=0; dir<4; ++dir)  gridDim[dir] = 1;
   static int device = input.device;
 #endif

   initQuda(device);
 }

 void* qudaAllocatePinned(size_t bytes) {
   return pool_pinned_malloc(bytes);
 }

 void qudaFreePinned(void *ptr) {
   pool_pinned_free(ptr);
 }

 void qudaHisqParamsInit(QudaHisqParams_t params)
 {

   static bool initialized = false;

   if(initialized) return;
   qudamilc_called<true>(__func__);

 #if defined(GPU_HISQ_FORCE) || defined(GPU_UNITARIZE)
   const bool reunit_allow_svd = (params.reunit_allow_svd) ? true : false;
   const bool reunit_svd_only  = (params.reunit_svd_only) ? true : false;
   const double unitarize_eps = 1e-14;
   const double max_error = 1e-10;
 #endif

 #ifdef GPU_HISQ_FORCE
   quda::fermion_force::setUnitarizeForceConstants(unitarize_eps,
       params.force_filter,
       max_error,
       reunit_allow_svd,
       reunit_svd_only,
       params.reunit_svd_rel_error,
       params.reunit_svd_abs_error);
 #endif

 #ifdef GPU_UNITARIZE
   setUnitarizeLinksConstants(unitarize_eps,
       max_error,
       reunit_allow_svd,
       reunit_svd_only,
       params.reunit_svd_rel_error,
       params.reunit_svd_abs_error);
 #endif // UNITARIZE_GPU

   initialized = true;
   qudamilc_called<false>(__func__);
   return;
 }


 static QudaGaugeParam newMILCGaugeParam(const int* dim, QudaPrecision prec, QudaLinkType link_type)
 {
   QudaGaugeParam gParam = newQudaGaugeParam();
   for(int dir=0; dir<4; ++dir) gParam.X[dir] = dim[dir];
   gParam.cuda_prec_sloppy = gParam.cpu_prec = gParam.cuda_prec = prec;
   gParam.type = link_type;

   gParam.reconstruct_sloppy = gParam.reconstruct = ((link_type == QUDA_SU3_LINKS) ? QUDA_RECONSTRUCT_12 : QUDA_RECONSTRUCT_NO);
   gParam.gauge_order   = QUDA_MILC_GAUGE_ORDER;
   gParam.t_boundary    = QUDA_PERIODIC_T;
   gParam.gauge_fix     = QUDA_GAUGE_FIXED_NO;
   gParam.scale         = 1.0;
   gParam.anisotropy    = 1.0;
   gParam.tadpole_coeff = 1.0;
   gParam.scale         = 0;
   gParam.ga_pad        = 0;
   gParam.site_ga_pad   = 0;
   gParam.mom_ga_pad    = 0;
   gParam.llfat_ga_pad  = 0;
   return gParam;
 }

 static  void invalidateGaugeQuda() {
   qudamilc_called<true>(__func__);
   freeGaugeQuda();
   invalidate_quda_gauge = true;
   qudamilc_called<false>(__func__);
 }

 void qudaLoadKSLink(int prec, QudaFatLinkArgs_t fatlink_args,
     const double act_path_coeff[6], void* inlink, void* fatlink, void* longlink)
 {
   qudamilc_called<true>(__func__);

   QudaGaugeParam param = newMILCGaugeParam(localDim,
       (prec==1) ? QUDA_SINGLE_PRECISION : QUDA_DOUBLE_PRECISION,
       QUDA_GENERAL_LINKS);

   param.staggered_phase_applied = 1;
   param.staggered_phase_type = QUDA_STAGGERED_PHASE_MILC;

   computeKSLinkQuda(fatlink, longlink, nullptr, inlink, const_cast<double*>(act_path_coeff), &param);

   // requires loadGaugeQuda to be called in subequent solver
   invalidateGaugeQuda();

   // this flags that we are using QUDA to create the HISQ links
   create_quda_gauge = true;
   qudamilc_called<false>(__func__);
 }


 void qudaLoadUnitarizedLink(int prec, QudaFatLinkArgs_t fatlink_args,
           const double act_path_coeff[6], void* inlink, void* fatlink, void* ulink)
 {
   qudamilc_called<true>(__func__);

   QudaGaugeParam param = newMILCGaugeParam(localDim,
              (prec==1) ? QUDA_SINGLE_PRECISION : QUDA_DOUBLE_PRECISION,
              QUDA_GENERAL_LINKS);

   computeKSLinkQuda(fatlink, nullptr, ulink, inlink, const_cast<double*>(act_path_coeff), &param);
   qudamilc_called<false>(__func__);

   // requires loadGaugeQuda to be called in subequent solver
   invalidateGaugeQuda();

   // this flags that we are using QUDA to create the HISQ links
   create_quda_gauge = true;
   qudamilc_called<false>(__func__);
 }


 void qudaHisqForce(int prec, int num_terms, int num_naik_terms, double dt, double** coeff, void** quark_field,
                    const double level2_coeff[6], const double fat7_coeff[6],
                    const void* const w_link, const void* const v_link, const void* const u_link,
                    void* const milc_momentum)
 {
   qudamilc_called<true>(__func__);

   QudaGaugeParam gParam = newMILCGaugeParam(localDim, (prec==1) ? QUDA_SINGLE_PRECISION : QUDA_DOUBLE_PRECISION, QUDA_GENERAL_LINKS);

   if (!invalidate_quda_mom) {
     gParam.use_resident_mom = true;
     gParam.make_resident_mom = true;
     gParam.return_result_mom = false;
   } else {
     gParam.use_resident_mom = false;
     gParam.make_resident_mom = false;
     gParam.return_result_mom = true;
   }

   computeHISQForceQuda(milc_momentum, dt, level2_coeff, fat7_coeff,
                        w_link, v_link, u_link,
                        quark_field, num_terms, num_naik_terms, coeff,
                        &gParam);
   qudamilc_called<false>(__func__);
   return;
 }


 void qudaAsqtadForce(int prec, const double act_path_coeff[6],
                      const void* const one_link_src[4], const void* const naik_src[4],
                      const void* const link, void* const milc_momentum)
 {
   errorQuda("This interface has been removed and is no longer supported");
 }


 void qudaComputeOprod(int prec, int num_terms, int num_naik_terms, double** coeff, double scale,
                       void** quark_field, void* oprod[3])
 {
   errorQuda("This interface has been removed and is no longer supported");
 }


 void qudaUpdateU(int prec, double eps, QudaMILCSiteArg_t *arg)
 {
   qudamilc_called<true>(__func__);
   QudaGaugeParam gaugeParam = newMILCGaugeParam(localDim,
       (prec==1) ? QUDA_SINGLE_PRECISION : QUDA_DOUBLE_PRECISION,
       QUDA_GENERAL_LINKS);
   void *gauge = arg->site ? arg->site : arg->link;
   void *mom = arg->site ? arg->site : arg->mom;

   gaugeParam.gauge_offset = arg->link_offset;
   gaugeParam.mom_offset = arg->mom_offset;
   gaugeParam.site_size = arg->size;
   gaugeParam.gauge_order = arg->site ? QUDA_MILC_SITE_GAUGE_ORDER : QUDA_MILC_GAUGE_ORDER;

   if (!invalidate_quda_mom) {
     gaugeParam.use_resident_mom = true;
     gaugeParam.make_resident_mom = true;
   } else {
     gaugeParam.use_resident_mom = false;
     gaugeParam.make_resident_mom = false;
   }

   updateGaugeFieldQuda(gauge, mom, eps, 0, 0, &gaugeParam);
   qudamilc_called<false>(__func__);
   return;
 }

 void qudaRephase(int prec, void *gauge, int flag, double i_mu)
 {
   qudamilc_called<true>(__func__);
   QudaGaugeParam gaugeParam = newMILCGaugeParam(localDim,
       (prec==1) ? QUDA_SINGLE_PRECISION : QUDA_DOUBLE_PRECISION,
             QUDA_GENERAL_LINKS);

   gaugeParam.staggered_phase_applied = 1-flag;
   gaugeParam.staggered_phase_type = QUDA_STAGGERED_PHASE_MILC;
   gaugeParam.i_mu = i_mu;
   gaugeParam.t_boundary    = QUDA_ANTI_PERIODIC_T;

   staggeredPhaseQuda(gauge, &gaugeParam);
   qudamilc_called<false>(__func__);
   return;
 }

 void qudaUnitarizeSU3(int prec, double tol, QudaMILCSiteArg_t *arg)
 {
   qudamilc_called<true>(__func__);
   QudaGaugeParam gaugeParam = newMILCGaugeParam(localDim,
       (prec==1) ? QUDA_SINGLE_PRECISION : QUDA_DOUBLE_PRECISION,
             QUDA_GENERAL_LINKS);

   void *gauge = arg->site ? arg->site : arg->link;
   gaugeParam.gauge_offset = arg->link_offset;
   gaugeParam.site_size = arg->size;
   gaugeParam.gauge_order = arg->site ? QUDA_MILC_SITE_GAUGE_ORDER : QUDA_MILC_GAUGE_ORDER;

   projectSU3Quda(gauge, tol, &gaugeParam);
   qudamilc_called<false>(__func__);
   return;
 }

 double qudaMomAction(int prec, void *momentum)
 {
   qudamilc_called<true>(__func__);

   QudaGaugeParam momParam = newMILCGaugeParam(localDim,
       (prec==1) ? QUDA_SINGLE_PRECISION : QUDA_DOUBLE_PRECISION,
       QUDA_GENERAL_LINKS);

   if (MOM_PIPE) {
     if (invalidate_quda_mom) {
       // beginning of trajectory so download the momentum and make
       // resident
       momParam.use_resident_mom = false;
       momParam.make_resident_mom = true;
       invalidate_quda_mom = false;
     } else {
       // end of trajectory so use resident and then invalidate
       momParam.use_resident_mom = true;
       momParam.make_resident_mom = false;
       invalidate_quda_mom = true;
     }
   } else { // no momentum residency
     momParam.use_resident_mom = false;
     momParam.make_resident_mom = false;
     invalidate_quda_mom = true;
   }

   double action = momActionQuda(momentum, &momParam);

   qudamilc_called<false>(__func__);

   return action;
 }

 static inline int opp(int dir){
   return 7-dir;
 }


 static void createGaugeForcePaths(int **paths, int dir, int num_loop_types){

   int index=0;
   // Plaquette paths
   if (num_loop_types >= 1)
     for(int i=0; i<4; ++i){
       if(i==dir) continue;
       paths[index][0] = i;        paths[index][1] = opp(dir);   paths[index++][2] = opp(i);
       paths[index][0] = opp(i);   paths[index][1] = opp(dir);   paths[index++][2] = i;
     }

   // Rectangle Paths
   if (num_loop_types >= 2)
     for(int i=0; i<4; ++i){
       if(i==dir) continue;
       paths[index][0] = paths[index][1] = i;       paths[index][2] = opp(dir); paths[index][3] = paths[index][4] = opp(i);
       index++;
       paths[index][0] = paths[index][1] = opp(i);  paths[index][2] = opp(dir); paths[index][3] = paths[index][4] = i;
       index++;
       paths[index][0] = dir; paths[index][1] = i; paths[index][2] = paths[index][3] = opp(dir); paths[index][4] = opp(i);
       index++;
       paths[index][0] = dir; paths[index][1] = opp(i); paths[index][2] = paths[index][3] = opp(dir); paths[index][4] = i;
       index++;
       paths[index][0] = i;  paths[index][1] = paths[index][2] = opp(dir); paths[index][3] = opp(i); paths[index][4] = dir;
       index++;
       paths[index][0] = opp(i);  paths[index][1] = paths[index][2] = opp(dir); paths[index][3] = i; paths[index][4] = dir;
       index++;
     }

   if (num_loop_types >= 3) {
     // Staple paths
     for(int i=0; i<4; ++i){
       for(int j=0; j<4; ++j){
   if(i==dir || j==dir || i==j) continue;
   paths[index][0] = i; paths[index][1] = j; paths[index][2] = opp(dir); paths[index][3] = opp(i), paths[index][4] = opp(j);
   index++;
   paths[index][0] = i; paths[index][1] = opp(j); paths[index][2] = opp(dir); paths[index][3] = opp(i), paths[index][4] = j;
   index++;
   paths[index][0] = opp(i); paths[index][1] = j; paths[index][2] = opp(dir); paths[index][3] = i, paths[index][4] = opp(j);
   index++;
   paths[index][0] = opp(i); paths[index][1] = opp(j); paths[index][2] = opp(dir); paths[index][3] = i, paths[index][4] = j;
   index++;
       }
     }
   }

 }


 void qudaGaugeForce( int precision,
          int num_loop_types,
          double milc_loop_coeff[3],
          double eb3,
          QudaMILCSiteArg_t *arg)
 {
   qudamilc_called<true>(__func__);

   int numPaths = 0;
   switch (num_loop_types) {
   case 1:
     numPaths = 6;
     break;
   case 2:
     numPaths = 24;
     break;
   case 3:
     numPaths = 48;
     break;
   default:
     errorQuda("Invalid num_loop_types = %d\n", num_loop_types);
   }

   QudaGaugeParam qudaGaugeParam = newMILCGaugeParam(localDim,
       (precision==1) ? QUDA_SINGLE_PRECISION : QUDA_DOUBLE_PRECISION,
       QUDA_SU3_LINKS);
   void *gauge = arg->site ? arg->site : arg->link;
   void *mom = arg->site ? arg->site : arg->mom;

   qudaGaugeParam.gauge_offset = arg->link_offset;
   qudaGaugeParam.mom_offset = arg->mom_offset;
   qudaGaugeParam.site_size = arg->size;
   qudaGaugeParam.gauge_order = arg->site ? QUDA_MILC_SITE_GAUGE_ORDER : QUDA_MILC_GAUGE_ORDER;

   double *loop_coeff = static_cast<double*>(safe_malloc(numPaths*sizeof(double)));
   int *length = static_cast<int*>(safe_malloc(numPaths*sizeof(int)));

   if (num_loop_types >= 1) for(int i= 0; i< 6; ++i) {
       loop_coeff[i] = milc_loop_coeff[0];
       length[i] = 3;
     }
   if (num_loop_types >= 2) for(int i= 6; i<24; ++i) {
       loop_coeff[i] = milc_loop_coeff[1];
       length[i] = 5;
     }
   if (num_loop_types >= 3) for(int i=24; i<48; ++i) {
       loop_coeff[i] = milc_loop_coeff[2];
       length[i] = 5;
     }

   int** input_path_buf[4];
   for(int dir=0; dir<4; ++dir){
     input_path_buf[dir] = static_cast<int**>(safe_malloc(numPaths*sizeof(int*)));
     for(int i=0; i<numPaths; ++i){
       input_path_buf[dir][i] = static_cast<int*>(safe_malloc(length[i]*sizeof(int)));
     }
     createGaugeForcePaths(input_path_buf[dir], dir, num_loop_types);
   }

   if (!invalidate_quda_mom) {
     qudaGaugeParam.use_resident_mom = true;
     qudaGaugeParam.make_resident_mom = true;
     qudaGaugeParam.return_result_mom = false;

     // this means when we compute the momentum, we acummulate to the
     // preexisting resident momentum instead of overwriting it
     qudaGaugeParam.overwrite_mom = false;
   } else {
     qudaGaugeParam.use_resident_mom = false;
     qudaGaugeParam.make_resident_mom = false;
     qudaGaugeParam.return_result_mom = true;

     // this means we compute momentum into a fresh field, copy it back
     // and sum to current momentum in MILC.  This saves an initial
     // CPU->GPU download of the current momentum.
     qudaGaugeParam.overwrite_mom = false;
   }

   int max_length = 6;

   computeGaugeForceQuda(mom, gauge, input_path_buf, length,
       loop_coeff, numPaths, max_length, eb3, &qudaGaugeParam);

   for(int dir=0; dir<4; ++dir){
     for(int i=0; i<numPaths; ++i) host_free(input_path_buf[dir][i]);
     host_free(input_path_buf[dir]);
   }

   host_free(length);
   host_free(loop_coeff);

   qudamilc_called<false>(__func__);
   return;
 }


 static int getLinkPadding(const int dim[4])
 {
   int padding = MAX(dim[1]*dim[2]*dim[3]/2, dim[0]*dim[2]*dim[3]/2);
   padding = MAX(padding, dim[0]*dim[1]*dim[3]/2);
   padding = MAX(padding, dim[0]*dim[1]*dim[2]/2);
   return padding;
 }

 // set the params for the single mass solver
 static void setInvertParams(const int dim[4], QudaPrecision cpu_prec, QudaPrecision cuda_prec,
                             QudaPrecision cuda_prec_sloppy, double mass, double target_residual,
                             double target_residual_hq, int maxiter, double reliable_delta, QudaParity parity,
                             QudaVerbosity verbosity, QudaInverterType inverter, QudaInvertParam *invertParam)
 {
   invertParam->verbosity = verbosity;
   invertParam->mass = mass;
   invertParam->tol = target_residual;
   invertParam->tol_hq = target_residual_hq;

   invertParam->residual_type = static_cast<QudaResidualType_s>(0);
   invertParam->residual_type = (target_residual != 0) ?
     static_cast<QudaResidualType_s>(invertParam->residual_type | QUDA_L2_RELATIVE_RESIDUAL) :
     invertParam->residual_type;
   invertParam->residual_type = (target_residual_hq != 0) ?
     static_cast<QudaResidualType_s>(invertParam->residual_type | QUDA_HEAVY_QUARK_RESIDUAL) :
     invertParam->residual_type;

   invertParam->heavy_quark_check = (invertParam->residual_type & QUDA_HEAVY_QUARK_RESIDUAL ? 1 : 0);
   if (invertParam->heavy_quark_check) {
     invertParam->max_hq_res_increase = 5;       // this caps the number of consecutive hq residual increases
     invertParam->max_hq_res_restart_total = 10; // this caps the number of hq restarts in case of solver stalling
   }

   invertParam->use_sloppy_partial_accumulator = 0;
   invertParam->num_offset = 0;

   invertParam->inv_type = inverter;
   invertParam->maxiter = maxiter;
   invertParam->reliable_delta = reliable_delta;

   invertParam->mass_normalization = QUDA_MASS_NORMALIZATION;
   invertParam->cpu_prec = cpu_prec;
   invertParam->cuda_prec = cuda_prec;
   invertParam->cuda_prec_sloppy = invertParam->heavy_quark_check ? cuda_prec : cuda_prec_sloppy;
   invertParam->cuda_prec_precondition = cuda_prec_sloppy;

   invertParam->solution_type = QUDA_MATPC_SOLUTION;
   invertParam->solve_type = QUDA_DIRECT_PC_SOLVE;
   invertParam->preserve_source = QUDA_PRESERVE_SOURCE_YES;
   invertParam->gamma_basis = QUDA_DEGRAND_ROSSI_GAMMA_BASIS; // not used, but required by the code.
   invertParam->dirac_order = QUDA_DIRAC_ORDER;

   invertParam->dslash_type = QUDA_ASQTAD_DSLASH;
   invertParam->Ls = 1;
   invertParam->gflops = 0.0;

   invertParam->input_location = QUDA_CPU_FIELD_LOCATION;
   invertParam->output_location = QUDA_CPU_FIELD_LOCATION;

   if (parity == QUDA_EVEN_PARITY) { // even parity
     invertParam->matpc_type = QUDA_MATPC_EVEN_EVEN;
   } else if (parity == QUDA_ODD_PARITY) {
     invertParam->matpc_type = QUDA_MATPC_ODD_ODD;
   } else {
     errorQuda("Invalid parity\n");
   }

   invertParam->dagger = QUDA_DAG_NO;
   invertParam->sp_pad = 0;
   invertParam->use_init_guess = QUDA_USE_INIT_GUESS_YES;

   // for the preconditioner
   invertParam->inv_type_precondition = QUDA_CG_INVERTER;
   invertParam->tol_precondition = 1e-1;
   invertParam->maxiter_precondition = 2;
   invertParam->verbosity_precondition = QUDA_SILENT;

   invertParam->compute_action = 0;
 }


 // Set params for the multi-mass solver.
 static void setInvertParams(const int dim[4], QudaPrecision cpu_prec, QudaPrecision cuda_prec,
                             QudaPrecision cuda_prec_sloppy, int num_offset, const double offset[],
                             const double target_residual_offset[], const double target_residual_hq_offset[],
                             int maxiter, double reliable_delta, QudaParity parity, QudaVerbosity verbosity,
                             QudaInverterType inverter, QudaInvertParam *invertParam)
 {
   const double null_mass = -1;

   setInvertParams(dim, cpu_prec, cuda_prec, cuda_prec_sloppy, null_mass, target_residual_offset[0],
                   target_residual_hq_offset[0], maxiter, reliable_delta, parity, verbosity, inverter, invertParam);

   invertParam->num_offset = num_offset;
   for (int i = 0; i < num_offset; ++i) {
     invertParam->offset[i] = offset[i];
     invertParam->tol_offset[i] = target_residual_offset[i];
     invertParam->tol_hq_offset[i] = target_residual_hq_offset[i];
   }
 }

 static void getReconstruct(QudaReconstructType &reconstruct, QudaReconstructType &reconstruct_sloppy)
 {
   {
     char *reconstruct_env = getenv("QUDA_MILC_HISQ_RECONSTRUCT");
     if (!reconstruct_env || strcmp(reconstruct_env, "18") == 0) {
       reconstruct = QUDA_RECONSTRUCT_NO;
     } else if (strcmp(reconstruct_env, "13") == 0) {
       reconstruct = QUDA_RECONSTRUCT_13;
     } else if (strcmp(reconstruct_env, "9") == 0) {
       reconstruct = QUDA_RECONSTRUCT_9;
     } else {
       errorQuda("QUDA_MILC_HISQ_RECONSTRUCT=%s not supported", reconstruct_env);
     }
   }

   {
     char *reconstruct_sloppy_env = getenv("QUDA_MILC_HISQ_RECONSTRUCT_SLOPPY");
     if (!reconstruct_sloppy_env) { // if env is not set, default to using outer reconstruct type
       reconstruct_sloppy = reconstruct;
     } else if (strcmp(reconstruct_sloppy_env, "18") == 0) {
       reconstruct_sloppy = QUDA_RECONSTRUCT_NO;
     } else if (strcmp(reconstruct_sloppy_env, "13") == 0) {
       reconstruct_sloppy = QUDA_RECONSTRUCT_13;
     } else if (strcmp(reconstruct_sloppy_env, "9") == 0) {
       reconstruct_sloppy = QUDA_RECONSTRUCT_9;
     } else {
       errorQuda("QUDA_MILC_HISQ_RECONSTRUCT_SLOPPY=%s not supported", reconstruct_sloppy_env);
     }
   }
 }

 static void setGaugeParams(QudaGaugeParam &fat_param, QudaGaugeParam &long_param, const void *const fatlink,
                            const void *const longlink, const int dim[4], QudaPrecision cpu_prec,
                            QudaPrecision cuda_prec, QudaPrecision cuda_prec_sloppy, double tadpole, double naik_epsilon)
 {
   for (int dir = 0; dir < 4; ++dir) fat_param.X[dir] = dim[dir];

   fat_param.cpu_prec = cpu_prec;
   fat_param.cuda_prec = cuda_prec;
   fat_param.cuda_prec_sloppy = cuda_prec_sloppy;
   fat_param.cuda_prec_precondition = cuda_prec_sloppy;
   fat_param.reconstruct = QUDA_RECONSTRUCT_NO;
   fat_param.reconstruct_sloppy = QUDA_RECONSTRUCT_NO;
   fat_param.reconstruct_precondition = QUDA_RECONSTRUCT_NO;
   fat_param.gauge_fix = QUDA_GAUGE_FIXED_NO;
   fat_param.anisotropy = 1.0;
   fat_param.t_boundary = QUDA_PERIODIC_T; // anti-periodic boundary conditions are built into the gauge field
   fat_param.gauge_order = QUDA_MILC_GAUGE_ORDER;
   fat_param.ga_pad = getLinkPadding(dim);

   if (longlink != nullptr) {
     // improved staggered parameters
     fat_param.type = QUDA_ASQTAD_FAT_LINKS;

     // now set the long link parameters needed
     long_param = fat_param;
     long_param.tadpole_coeff = tadpole;
     long_param.scale = -(1.0 + naik_epsilon) / (24.0 * long_param.tadpole_coeff * long_param.tadpole_coeff);
     long_param.type = QUDA_THREE_LINKS;
     long_param.ga_pad = 3*fat_param.ga_pad;
     getReconstruct(long_param.reconstruct, long_param.reconstruct_sloppy);
     long_param.reconstruct_precondition = long_param.reconstruct_sloppy;
   } else {
     // naive staggered parameters
     fat_param.type = QUDA_SU3_LINKS;
     fat_param.staggered_phase_type = QUDA_STAGGERED_PHASE_MILC;
   }

 }

 static void setColorSpinorParams(const int dim[4], QudaPrecision precision, ColorSpinorParam *param)
 {
   param->nColor = 3;
   param->nSpin = 1;
   param->nDim = 4;

   for (int dir = 0; dir < 4; ++dir) param->x[dir] = dim[dir];
   param->x[0] /= 2;

   param->setPrecision(precision);
   param->pad = 0;
   param->siteSubset = QUDA_PARITY_SITE_SUBSET;
   param->siteOrder = QUDA_EVEN_ODD_SITE_ORDER;
   param->fieldOrder = QUDA_SPACE_SPIN_COLOR_FIELD_ORDER;
   param->gammaBasis = QUDA_DEGRAND_ROSSI_GAMMA_BASIS; // meaningless, but required by the code.
   param->create = QUDA_ZERO_FIELD_CREATE;
 }

 void setDeflationParam(QudaPrecision ritz_prec, QudaFieldLocation location_ritz, QudaMemoryType mem_type_ritz,
                        QudaExtLibType deflation_ext_lib, char vec_infile[], char vec_outfile[], QudaEigParam *df_param)
 {

   df_param->import_vectors = strcmp(vec_infile,"") ? QUDA_BOOLEAN_TRUE : QUDA_BOOLEAN_FALSE;

   df_param->cuda_prec_ritz = ritz_prec;
   df_param->location       = location_ritz;
   df_param->mem_type_ritz  = mem_type_ritz;


   df_param->run_verify     = QUDA_BOOLEAN_FALSE;

   df_param->nk       = df_param->invert_param->nev;
   df_param->np       = df_param->invert_param->nev*df_param->invert_param->deflation_grid;

   // set file i/o parameters
   strcpy(df_param->vec_infile, vec_infile);
   strcpy(df_param->vec_outfile, vec_outfile);
 }

 static size_t getColorVectorOffset(QudaParity local_parity, bool even_odd_exchange, const int dim[4])
 {
   size_t offset;
   int volume = dim[0]*dim[1]*dim[2]*dim[3];

   if(local_parity == QUDA_EVEN_PARITY){
     offset = even_odd_exchange ? volume*6/2 : 0;
   }else{
     offset = even_odd_exchange ? 0 : volume*6/2;
   }
   return offset;
 }

 void qudaMultishiftInvert(int external_precision, int quda_precision, int num_offsets, double *const offset,
                           QudaInvertArgs_t inv_args, const double target_residual[],
                           const double target_fermilab_residual[], const void *const fatlink,
                           const void *const longlink, void *source, void **solutionArray, double *const final_residual,
                           double *const final_fermilab_residual, int *num_iters)
 {
   static const QudaVerbosity verbosity = getVerbosity();
   qudamilc_called<true>(__func__, verbosity);

   if (target_residual[0] == 0) errorQuda("qudaMultishiftInvert: zeroth target residual cannot be zero\n");

   QudaPrecision host_precision = (external_precision == 2) ? QUDA_DOUBLE_PRECISION : QUDA_SINGLE_PRECISION;
   QudaPrecision device_precision = (quda_precision == 2) ? QUDA_DOUBLE_PRECISION : QUDA_SINGLE_PRECISION;
   const bool use_mixed_precision = (((quda_precision==2) && inv_args.mixed_precision) ||
                                      ((quda_precision==1) && (inv_args.mixed_precision==2)) ) ? true : false;
   QudaPrecision device_precision_sloppy;
   switch(inv_args.mixed_precision) {
   case 2: device_precision_sloppy = QUDA_HALF_PRECISION; break;
   case 1: device_precision_sloppy = QUDA_SINGLE_PRECISION; break;
   default: device_precision_sloppy = device_precision;
   }

   QudaGaugeParam fat_param = newQudaGaugeParam();
   QudaGaugeParam long_param = newQudaGaugeParam();
   setGaugeParams(fat_param, long_param, fatlink, longlink, localDim, host_precision, device_precision,
                  device_precision_sloppy, inv_args.tadpole, inv_args.naik_epsilon);

   QudaInvertParam invertParam = newQudaInvertParam();

   QudaParity local_parity = inv_args.evenodd;
   const double reliable_delta = (use_mixed_precision ? 1e-1 : 0.0);
   setInvertParams(localDim, host_precision, device_precision, device_precision_sloppy, num_offsets, offset,
                   target_residual, target_fermilab_residual, inv_args.max_iter, reliable_delta, local_parity, verbosity,
                   QUDA_CG_INVERTER, &invertParam);

   if (inv_args.mixed_precision == 1) {
     fat_param.cuda_prec_refinement_sloppy = QUDA_HALF_PRECISION;
     long_param.cuda_prec_refinement_sloppy = QUDA_HALF_PRECISION;
     long_param.reconstruct_refinement_sloppy = long_param.reconstruct_sloppy;
     invertParam.cuda_prec_refinement_sloppy = QUDA_HALF_PRECISION;
     invertParam.reliable_delta_refinement = 0.1;
   }

   ColorSpinorParam csParam;
   setColorSpinorParams(localDim, host_precision, &csParam);

   // dirty hack to invalidate the cached gauge field without breaking interface compatability
   if (*num_iters == -1) invalidateGaugeQuda();

   // set the solver
   if (invalidate_quda_gauge || !create_quda_gauge) {
     loadGaugeQuda(const_cast<void *>(fatlink), &fat_param);
     if (longlink != nullptr) loadGaugeQuda(const_cast<void *>(longlink), &long_param);
     invalidate_quda_gauge = false;
   }

   if (longlink == nullptr) invertParam.dslash_type = QUDA_STAGGERED_DSLASH;

   void** sln_pointer = (void**)malloc(num_offsets*sizeof(void*));
   int quark_offset = getColorVectorOffset(local_parity, false, localDim) * host_precision;
   void* src_pointer = static_cast<char*>(source) + quark_offset;

   for (int i = 0; i < num_offsets; ++i) sln_pointer[i] = static_cast<char *>(solutionArray[i]) + quark_offset;

   invertMultiShiftQuda(sln_pointer, src_pointer, &invertParam);
   free(sln_pointer);

   // return the number of iterations taken by the inverter
   *num_iters = invertParam.iter;
   for (int i = 0; i < num_offsets; ++i) {
     final_residual[i] = invertParam.true_res_offset[i];
     final_fermilab_residual[i] = invertParam.true_res_hq_offset[i];
   } // end loop over number of offsets

   if (!create_quda_gauge) invalidateGaugeQuda();

   qudamilc_called<false>(__func__, verbosity);
 } // qudaMultiShiftInvert

 void qudaInvert(int external_precision, int quda_precision, double mass, QudaInvertArgs_t inv_args,
                 double target_residual, double target_fermilab_residual, const void *const fatlink,
                 const void *const longlink, void *source, void *solution, double *const final_residual,
                 double *const final_fermilab_residual, int *num_iters)
 {
   static const QudaVerbosity verbosity = getVerbosity();
   qudamilc_called<true>(__func__, verbosity);

   if (target_fermilab_residual == 0 && target_residual == 0) errorQuda("qudaInvert: requesting zero residual\n");

   // static const QudaVerbosity verbosity = getVerbosity();
   QudaPrecision host_precision = (external_precision == 2) ? QUDA_DOUBLE_PRECISION : QUDA_SINGLE_PRECISION;
   QudaPrecision device_precision = (quda_precision == 2) ? QUDA_DOUBLE_PRECISION : QUDA_SINGLE_PRECISION;
   QudaPrecision device_precision_sloppy;

   switch(inv_args.mixed_precision) {
   case 2: device_precision_sloppy = QUDA_HALF_PRECISION; break;
   case 1: device_precision_sloppy = QUDA_SINGLE_PRECISION; break;
   default: device_precision_sloppy = device_precision;
   }

   QudaGaugeParam fat_param = newQudaGaugeParam();
   QudaGaugeParam long_param = newQudaGaugeParam();
   setGaugeParams(fat_param, long_param, fatlink, longlink, localDim, host_precision, device_precision,
                  device_precision_sloppy, inv_args.tadpole, inv_args.naik_epsilon);

   QudaInvertParam invertParam = newQudaInvertParam();

   QudaParity local_parity = inv_args.evenodd;
   const double reliable_delta = 1e-1;

   setInvertParams(localDim, host_precision, device_precision, device_precision_sloppy, mass, target_residual,
                   target_fermilab_residual, inv_args.max_iter, reliable_delta, local_parity, verbosity,
                   QUDA_CG_INVERTER, &invertParam);

   ColorSpinorParam csParam;
   setColorSpinorParams(localDim, host_precision, &csParam);

   // dirty hack to invalidate the cached gauge field without breaking interface compatability
   if (*num_iters == -1 || !canReuseResidentGauge(&invertParam)) invalidateGaugeQuda();

   if (invalidate_quda_gauge || !create_quda_gauge) {
     loadGaugeQuda(const_cast<void *>(fatlink), &fat_param);
     if (longlink != nullptr) loadGaugeQuda(const_cast<void *>(longlink), &long_param);
     invalidate_quda_gauge = false;
   }

   if (longlink == nullptr) invertParam.dslash_type = QUDA_STAGGERED_DSLASH;

   int quark_offset = getColorVectorOffset(local_parity, false, localDim) * host_precision;

   invertQuda(static_cast<char *>(solution) + quark_offset, static_cast<char *>(source) + quark_offset, &invertParam);

   // return the number of iterations taken by the inverter
   *num_iters = invertParam.iter;
   *final_residual = invertParam.true_res;
   *final_fermilab_residual = invertParam.true_res_hq;

   if (!create_quda_gauge) invalidateGaugeQuda();

   qudamilc_called<false>(__func__, verbosity);
 } // qudaInvert


 void qudaDslash(int external_precision, int quda_precision, QudaInvertArgs_t inv_args, const void *const fatlink,
                 const void *const longlink, void* src, void* dst, int* num_iters)
 {
   static const QudaVerbosity verbosity = getVerbosity();
   qudamilc_called<true>(__func__, verbosity);

   // static const QudaVerbosity verbosity = getVerbosity();
   QudaPrecision host_precision = (external_precision == 2) ? QUDA_DOUBLE_PRECISION : QUDA_SINGLE_PRECISION;
   QudaPrecision device_precision = (quda_precision == 2) ? QUDA_DOUBLE_PRECISION : QUDA_SINGLE_PRECISION;
   QudaPrecision device_precision_sloppy = device_precision;

   QudaGaugeParam fat_param = newQudaGaugeParam();
   QudaGaugeParam long_param = newQudaGaugeParam();
   setGaugeParams(fat_param, long_param, fatlink, longlink, localDim, host_precision, device_precision,
                  device_precision_sloppy, inv_args.tadpole, inv_args.naik_epsilon);

   QudaInvertParam invertParam = newQudaInvertParam();

   QudaParity local_parity = inv_args.evenodd;
   QudaParity other_parity = local_parity == QUDA_EVEN_PARITY ? QUDA_ODD_PARITY : QUDA_EVEN_PARITY;

   setInvertParams(localDim, host_precision, device_precision, device_precision_sloppy, 0.0, 0, 0, 0, 0.0, local_parity,
                   verbosity, QUDA_CG_INVERTER, &invertParam);

   ColorSpinorParam csParam;
   setColorSpinorParams(localDim, host_precision, &csParam);

   // dirty hack to invalidate the cached gauge field without breaking interface compatability
   if (*num_iters == -1 || !canReuseResidentGauge(&invertParam)) invalidateGaugeQuda();

   if (invalidate_quda_gauge || !create_quda_gauge) {
     loadGaugeQuda(const_cast<void *>(fatlink), &fat_param);
     if (longlink != nullptr) loadGaugeQuda(const_cast<void *>(longlink), &long_param);
     invalidate_quda_gauge = false;
   }

   if (longlink == nullptr) invertParam.dslash_type = QUDA_STAGGERED_DSLASH;

   int src_offset = getColorVectorOffset(other_parity, false, localDim);
   int dst_offset = getColorVectorOffset(local_parity, false, localDim);

   dslashQuda(static_cast<char*>(dst) + dst_offset*host_precision,
        static_cast<char*>(src) + src_offset*host_precision,
        &invertParam, local_parity);

   if (!create_quda_gauge) invalidateGaugeQuda();

   qudamilc_called<false>(__func__, verbosity);
 } // qudaDslash

 void qudaInvertMsrc(int external_precision, int quda_precision, double mass, QudaInvertArgs_t inv_args,
                     double target_residual, double target_fermilab_residual, const void *const fatlink,
                     const void *const longlink, void **sourceArray, void **solutionArray, double *const final_residual,
                     double *const final_fermilab_residual, int *num_iters, int num_src)
 {
   static const QudaVerbosity verbosity = getVerbosity();
   qudamilc_called<true>(__func__, verbosity);

   if (target_fermilab_residual == 0 && target_residual == 0) errorQuda("qudaInvert: requesting zero residual\n");

   // static const QudaVerbosity verbosity = getVerbosity();
   QudaPrecision host_precision = (external_precision == 2) ? QUDA_DOUBLE_PRECISION : QUDA_SINGLE_PRECISION;
   QudaPrecision device_precision = (quda_precision == 2) ? QUDA_DOUBLE_PRECISION : QUDA_SINGLE_PRECISION;
   QudaPrecision device_precision_sloppy;

   switch(inv_args.mixed_precision) {
   case 2: device_precision_sloppy = QUDA_HALF_PRECISION; break;
   case 1: device_precision_sloppy = QUDA_SINGLE_PRECISION; break;
   default: device_precision_sloppy = device_precision;
   }

   QudaGaugeParam fat_param = newQudaGaugeParam();
   QudaGaugeParam long_param = newQudaGaugeParam();
   setGaugeParams(fat_param, long_param, fatlink, longlink, localDim, host_precision, device_precision,
                  device_precision_sloppy, inv_args.tadpole, inv_args.naik_epsilon);

   QudaInvertParam invertParam = newQudaInvertParam();

   QudaParity local_parity = inv_args.evenodd;
   const double reliable_delta = 1e-1;

   setInvertParams(localDim, host_precision, device_precision, device_precision_sloppy, mass, target_residual,
                   target_fermilab_residual, inv_args.max_iter, reliable_delta, local_parity, verbosity,
                   QUDA_CG_INVERTER, &invertParam);
   invertParam.num_src = num_src;

   ColorSpinorParam csParam;
   setColorSpinorParams(localDim, host_precision, &csParam);

   // dirty hack to invalidate the cached gauge field without breaking interface compatability
   if (*num_iters == -1 || !canReuseResidentGauge(&invertParam)) invalidateGaugeQuda();

   if (invalidate_quda_gauge || !create_quda_gauge) {
     loadGaugeQuda(const_cast<void *>(fatlink), &fat_param);
     if (longlink != nullptr) loadGaugeQuda(const_cast<void *>(longlink), &long_param);
     invalidate_quda_gauge = false;
   }

   if (longlink == nullptr) invertParam.dslash_type = QUDA_STAGGERED_DSLASH;

   int quark_offset = getColorVectorOffset(local_parity, false, localDim) * host_precision;
   void** sln_pointer = (void**)malloc(num_src*sizeof(void*));
   void** src_pointer = (void**)malloc(num_src*sizeof(void*));

   for (int i = 0; i < num_src; ++i) sln_pointer[i] = static_cast<char *>(solutionArray[i]) + quark_offset;
   for (int i = 0; i < num_src; ++i) src_pointer[i] = static_cast<char *>(sourceArray[i]) + quark_offset;

   invertMultiSrcQuda(sln_pointer, src_pointer, &invertParam);

   free(sln_pointer);
   free(src_pointer);

   // return the number of iterations taken by the inverter
   *num_iters = invertParam.iter;
   *final_residual = invertParam.true_res;
   *final_fermilab_residual = invertParam.true_res_hq;

   if (!create_quda_gauge) invalidateGaugeQuda();

   qudamilc_called<false>(__func__, verbosity);
 } // qudaInvert

 void qudaEigCGInvert(int external_precision, int quda_precision, double mass, QudaInvertArgs_t inv_args,
                      double target_residual, double target_fermilab_residual, const void *const fatlink,
                      const void *const longlink,
                      void *source,   // array of source vectors -> overwritten on exit
                      void *solution, // temporary
                      QudaEigArgs_t eig_args,
                      const int rhs_idx,       // current rhs
                      const int last_rhs_flag, // is this the last rhs to solve
                      double *const final_residual, double *const final_fermilab_residual, int *num_iters)
 {
   static const QudaVerbosity verbosity = getVerbosity();
   qudamilc_called<true>(__func__, verbosity);

   if (target_fermilab_residual == 0 && target_residual == 0) errorQuda("qudaInvert: requesting zero residual\n");

   QudaPrecision host_precision = (external_precision == 2) ? QUDA_DOUBLE_PRECISION : QUDA_SINGLE_PRECISION;
   QudaPrecision device_precision = (quda_precision == 2) ? QUDA_DOUBLE_PRECISION : QUDA_SINGLE_PRECISION;
   QudaPrecision device_precision_sloppy;

   switch(inv_args.mixed_precision) {
   case 2: device_precision_sloppy = QUDA_HALF_PRECISION; break;
   case 1: device_precision_sloppy = QUDA_SINGLE_PRECISION; break;
   default: device_precision_sloppy = device_precision;
   }

   QudaGaugeParam fat_param = newQudaGaugeParam();
   QudaGaugeParam long_param = newQudaGaugeParam();
   setGaugeParams(fat_param, long_param, fatlink, longlink, localDim, host_precision, device_precision,
                  device_precision_sloppy, inv_args.tadpole, inv_args.naik_epsilon);

   QudaInvertParam invertParam = newQudaInvertParam();

   QudaParity local_parity = inv_args.evenodd;
   double& target_res = target_residual;
   double& target_res_hq = target_fermilab_residual;
   const double reliable_delta = 1e-1;

   setInvertParams(localDim, host_precision, device_precision, device_precision_sloppy, mass, target_res, target_res_hq,
                   inv_args.max_iter, reliable_delta, local_parity, verbosity, QUDA_CG_INVERTER, &invertParam);

   QudaEigParam  df_param = newQudaEigParam();
   df_param.invert_param = &invertParam;

   invertParam.nev                = eig_args.nev;
   invertParam.max_search_dim     = eig_args.max_search_dim;
   invertParam.deflation_grid     = eig_args.deflation_grid;
   invertParam.cuda_prec_ritz     = eig_args.prec_ritz;
   invertParam.tol_restart        = eig_args.tol_restart;
   invertParam.eigcg_max_restarts = eig_args.eigcg_max_restarts;
   invertParam.max_restart_num    = eig_args.max_restart_num;
   invertParam.inc_tol            = eig_args.inc_tol;
   invertParam.eigenval_tol       = eig_args.eigenval_tol;
   invertParam.rhs_idx            = rhs_idx;

   if ((inv_args.solver_type != QUDA_INC_EIGCG_INVERTER) && (inv_args.solver_type != QUDA_EIGCG_INVERTER))
     errorQuda("Incorrect inverter type.\n");
   invertParam.inv_type = inv_args.solver_type;

   if (inv_args.solver_type == QUDA_INC_EIGCG_INVERTER) invertParam.inv_type_precondition = QUDA_INVALID_INVERTER;

   setDeflationParam(eig_args.prec_ritz, eig_args.location_ritz, eig_args.mem_type_ritz, eig_args.deflation_ext_lib, eig_args.vec_infile, eig_args.vec_outfile, &df_param);

   ColorSpinorParam csParam;
   setColorSpinorParams(localDim, host_precision, &csParam);

   // dirty hack to invalidate the cached gauge field without breaking interface compatability
   if (*num_iters == -1 || !canReuseResidentGauge(&invertParam)) invalidateGaugeQuda();

   if ((invalidate_quda_gauge || !create_quda_gauge) && (rhs_idx == 0)) { // do this for the first RHS
     loadGaugeQuda(const_cast<void *>(fatlink), &fat_param);
     if (longlink != nullptr) loadGaugeQuda(const_cast<void *>(longlink), &long_param);
     invalidate_quda_gauge = false;
   }

   if (longlink == nullptr) invertParam.dslash_type = QUDA_STAGGERED_DSLASH;

   int quark_offset = getColorVectorOffset(local_parity, false, localDim) * host_precision;

   if(rhs_idx == 0) df_preconditioner = newDeflationQuda(&df_param);

   invertParam.deflation_op = df_preconditioner;

   invertQuda(static_cast<char *>(solution) + quark_offset, static_cast<char *>(source) + quark_offset, &invertParam);

   if (last_rhs_flag) destroyDeflationQuda(df_preconditioner);

   // return the number of iterations taken by the inverter
   *num_iters = invertParam.iter;
   *final_residual = invertParam.true_res;
   *final_fermilab_residual = invertParam.true_res_hq;

   if (!create_quda_gauge && last_rhs_flag) invalidateGaugeQuda();

   qudamilc_called<false>(__func__, verbosity);
 } // qudaEigCGInvert


 static int clover_alloc = 0;

 void* qudaCreateGaugeField(void* gauge, int geometry, int precision)
 {
   qudamilc_called<true>(__func__);
   QudaPrecision qudaPrecision = (precision==2) ? QUDA_DOUBLE_PRECISION : QUDA_SINGLE_PRECISION;
   QudaGaugeParam gaugeParam = newMILCGaugeParam(localDim, qudaPrecision,
       (geometry==1) ? QUDA_GENERAL_LINKS : QUDA_SU3_LINKS);
   qudamilc_called<false>(__func__);
   return createGaugeFieldQuda(gauge, geometry, &gaugeParam);
 }


 void qudaSaveGaugeField(void* gauge, void* inGauge)
 {
   qudamilc_called<true>(__func__);
   cudaGaugeField* cudaGauge = reinterpret_cast<cudaGaugeField*>(inGauge);
   QudaGaugeParam gaugeParam = newMILCGaugeParam(localDim, cudaGauge->Precision(), QUDA_GENERAL_LINKS);
   saveGaugeFieldQuda(gauge, inGauge, &gaugeParam);
   qudamilc_called<false>(__func__);
 }


 void qudaDestroyGaugeField(void* gauge)
 {
   qudamilc_called<true>(__func__);
   destroyGaugeFieldQuda(gauge);
   qudamilc_called<false>(__func__);
 }


 void setInvertParam(QudaInvertParam &invertParam, QudaInvertArgs_t &inv_args,
         int external_precision, int quda_precision, double kappa, double reliable_delta);

 void qudaCloverForce(void *mom, double dt, void **x, void **p, double *coeff, double kappa, double ck,
          int nvec, double multiplicity, void *gauge, int precision, QudaInvertArgs_t inv_args)
 {
   qudamilc_called<true>(__func__);
   QudaGaugeParam gaugeParam = newMILCGaugeParam(localDim,
             (precision==1) ? QUDA_SINGLE_PRECISION : QUDA_DOUBLE_PRECISION,
             QUDA_GENERAL_LINKS);
   gaugeParam.gauge_order = QUDA_MILC_GAUGE_ORDER; // refers to momentume gauge order

   QudaInvertParam invertParam = newQudaInvertParam();
   setInvertParam(invertParam, inv_args, precision, precision, kappa, 0);
   invertParam.num_offset = nvec;
   for (int i=0; i<nvec; ++i) invertParam.offset[i] = 0.0; // not needed
   invertParam.clover_coeff = 0.0; // not needed

   // solution types
   invertParam.solution_type      = QUDA_MATPCDAG_MATPC_SOLUTION;
   invertParam.solve_type         = QUDA_NORMOP_PC_SOLVE;
   invertParam.inv_type           = QUDA_CG_INVERTER;
   invertParam.matpc_type         = QUDA_MATPC_EVEN_EVEN_ASYMMETRIC;

   invertParam.verbosity = getVerbosity();
   invertParam.verbosity_precondition = QUDA_SILENT;
   invertParam.use_resident_solution = inv_args.use_resident_solution;

   computeCloverForceQuda(mom, dt, x, p, coeff, -kappa*kappa, ck, nvec, multiplicity,
        gauge, &gaugeParam, &invertParam);
   qudamilc_called<false>(__func__);
 }


 void setGaugeParams(QudaGaugeParam &gaugeParam, const int dim[4], QudaInvertArgs_t &inv_args,
                     int external_precision, int quda_precision) {

   const QudaPrecision host_precision = (external_precision == 2) ? QUDA_DOUBLE_PRECISION : QUDA_SINGLE_PRECISION;
   const QudaPrecision device_precision = (quda_precision == 2) ? QUDA_DOUBLE_PRECISION : QUDA_SINGLE_PRECISION;
   QudaPrecision device_precision_sloppy;

   switch(inv_args.mixed_precision) {
   case 2: device_precision_sloppy = QUDA_HALF_PRECISION; break;
   case 1: device_precision_sloppy = QUDA_SINGLE_PRECISION; break;
   default: device_precision_sloppy = device_precision;
   }

   for(int dir=0; dir<4; ++dir) gaugeParam.X[dir] = dim[dir];

   gaugeParam.anisotropy               = 1.0;
   gaugeParam.type                     = QUDA_WILSON_LINKS;
   gaugeParam.gauge_order              = QUDA_MILC_GAUGE_ORDER;

   // Check the boundary conditions
   // Can't have twisted or anti-periodic boundary conditions in the spatial
   // directions with 12 reconstruct at the moment.
   bool trivial_phase = true;
   for(int dir=0; dir<3; ++dir){
     if(inv_args.boundary_phase[dir] != 0) trivial_phase = false;
   }
   if(inv_args.boundary_phase[3] != 0 && inv_args.boundary_phase[3] != 1) trivial_phase = false;

   if(trivial_phase){
     gaugeParam.t_boundary               = (inv_args.boundary_phase[3]) ? QUDA_ANTI_PERIODIC_T : QUDA_PERIODIC_T;
     gaugeParam.reconstruct              = QUDA_RECONSTRUCT_12;
     gaugeParam.reconstruct_sloppy       = QUDA_RECONSTRUCT_12;
   }else{
     gaugeParam.t_boundary               = QUDA_PERIODIC_T;
     gaugeParam.reconstruct              = QUDA_RECONSTRUCT_NO;
     gaugeParam.reconstruct_sloppy       = QUDA_RECONSTRUCT_NO;
   }

   gaugeParam.cpu_prec                 = host_precision;
   gaugeParam.cuda_prec                = device_precision;
   gaugeParam.cuda_prec_sloppy         = device_precision_sloppy;
   gaugeParam.cuda_prec_precondition   = device_precision_sloppy;
   gaugeParam.gauge_fix                = QUDA_GAUGE_FIXED_NO;
   gaugeParam.ga_pad                   = getLinkPadding(dim);
 }


 void setInvertParam(QudaInvertParam &invertParam, QudaInvertArgs_t &inv_args,
         int external_precision, int quda_precision, double kappa, double reliable_delta) {

   const QudaPrecision host_precision = (external_precision == 2) ? QUDA_DOUBLE_PRECISION : QUDA_SINGLE_PRECISION;
   const QudaPrecision device_precision = (quda_precision == 2) ? QUDA_DOUBLE_PRECISION : QUDA_SINGLE_PRECISION;
   QudaPrecision device_precision_sloppy;
   switch(inv_args.mixed_precision) {
   case 2: device_precision_sloppy = QUDA_HALF_PRECISION; break;
   case 1: device_precision_sloppy = QUDA_SINGLE_PRECISION; break;
   default: device_precision_sloppy = device_precision;
   }

   static const QudaVerbosity verbosity = getVerbosity();

   invertParam.dslash_type                   = QUDA_CLOVER_WILSON_DSLASH;
   invertParam.kappa                         = kappa;
   invertParam.dagger                        = QUDA_DAG_NO;
   invertParam.mass_normalization            = QUDA_KAPPA_NORMALIZATION;
   invertParam.gcrNkrylov                    = 30;
   invertParam.reliable_delta                = reliable_delta;
   invertParam.maxiter                       = inv_args.max_iter;

   invertParam.cuda_prec_precondition        = device_precision_sloppy;
   invertParam.verbosity_precondition        = verbosity;
   invertParam.verbosity        = verbosity;
   invertParam.cpu_prec                      = host_precision;
   invertParam.cuda_prec                     = device_precision;
   invertParam.cuda_prec_sloppy              = device_precision_sloppy;
   invertParam.preserve_source               = QUDA_PRESERVE_SOURCE_NO;
   invertParam.gamma_basis                   = QUDA_DEGRAND_ROSSI_GAMMA_BASIS;
   invertParam.dirac_order                   = QUDA_DIRAC_ORDER;
   invertParam.sp_pad                        = 0;
   invertParam.cl_pad                        = 0;
   invertParam.clover_cpu_prec               = host_precision;
   invertParam.clover_cuda_prec              = device_precision;
   invertParam.clover_cuda_prec_sloppy       = device_precision_sloppy;
   invertParam.clover_cuda_prec_precondition = device_precision_sloppy;
   invertParam.clover_order                  = QUDA_PACKED_CLOVER_ORDER;

   invertParam.compute_action = 0;
 }


 void qudaLoadGaugeField(int external_precision,
     int quda_precision,
     QudaInvertArgs_t inv_args,
     const void* milc_link) {
   qudamilc_called<true>(__func__);
   QudaGaugeParam gaugeParam = newQudaGaugeParam();
   setGaugeParams(gaugeParam, localDim,  inv_args, external_precision, quda_precision);

   loadGaugeQuda(const_cast<void*>(milc_link), &gaugeParam);
     qudamilc_called<false>(__func__);
 } // qudaLoadGaugeField


 void qudaFreeGaugeField() {
     qudamilc_called<true>(__func__);
   freeGaugeQuda();
     qudamilc_called<false>(__func__);
 } // qudaFreeGaugeField

 void qudaLoadCloverField(int external_precision, int quda_precision, QudaInvertArgs_t inv_args, void *milc_clover,
                          void *milc_clover_inv, QudaSolutionType solution_type, QudaSolveType solve_type, QudaInverterType inverter,
                          double clover_coeff, int compute_trlog, double *trlog)
 {
   qudamilc_called<true>(__func__);
   QudaInvertParam invertParam = newQudaInvertParam();
   setInvertParam(invertParam, inv_args, external_precision, quda_precision, 0.0, 0.0);
   invertParam.solution_type = solution_type;
   invertParam.solve_type = solve_type;
   invertParam.inv_type = inverter;
   invertParam.matpc_type = QUDA_MATPC_EVEN_EVEN_ASYMMETRIC;
   invertParam.compute_clover_trlog = compute_trlog;
   invertParam.clover_coeff = clover_coeff;

   // Hacks to mollify checkInvertParams which is called from
   // loadCloverQuda. These "required" parameters are irrelevant here.
   // Better procedure: invertParam should be defined in
   // qudaCloverInvert and qudaEigCGCloverInvert and passed here
   // instead of redefining a partial version here
   invertParam.tol = 0.;
   invertParam.tol_hq = 0.;
   invertParam.residual_type = static_cast<QudaResidualType_s>(0);

   if(invertParam.dslash_type == QUDA_CLOVER_WILSON_DSLASH) {
     if (clover_alloc == 0) {
       loadCloverQuda(milc_clover, milc_clover_inv, &invertParam);
       clover_alloc = 1;
     } else {
       errorQuda("Clover term already allocated");
     }
   }

   if (compute_trlog) {
     trlog[0] = invertParam.trlogA[0];
     trlog[1] = invertParam.trlogA[1];
   }
   qudamilc_called<false>(__func__);
 } // qudaLoadCoverField

 void qudaFreeCloverField() {
   qudamilc_called<true>(__func__);
   if (clover_alloc==1) {
     freeCloverQuda();
     clover_alloc = 0;
   } else {
     errorQuda("Trying to free non-allocated clover term");
   }
   qudamilc_called<false>(__func__);
 } // qudaFreeCloverField


 void qudaCloverInvert(int external_precision,
     int quda_precision,
     double kappa,
     double clover_coeff,
     QudaInvertArgs_t inv_args,
     double target_residual,
     double target_fermilab_residual,
     const void* link,
     void* clover, // could be stored in Milc format
     void* cloverInverse,
     void* source,
     void* solution,
     double* const final_residual,
     double* const final_fermilab_residual,
     int* num_iters)
 {
   qudamilc_called<true>(__func__);
   if (target_fermilab_residual == 0 && target_residual == 0) errorQuda("qudaCloverInvert: requesting zero residual\n");

   if (link) qudaLoadGaugeField(external_precision, quda_precision, inv_args, link);

   if (clover || cloverInverse) {
     qudaLoadCloverField(external_precision, quda_precision, inv_args, clover, cloverInverse, QUDA_MAT_SOLUTION,
                         QUDA_DIRECT_PC_SOLVE, QUDA_BICGSTAB_INVERTER, clover_coeff, 0, 0);
   }

   double reliable_delta = 1e-1;

   QudaInvertParam invertParam = newQudaInvertParam();
   setInvertParam(invertParam, inv_args, external_precision, quda_precision, kappa, reliable_delta);
   invertParam.residual_type = static_cast<QudaResidualType_s>(0);
   invertParam.residual_type = (target_residual != 0) ? static_cast<QudaResidualType_s> ( invertParam.residual_type | QUDA_L2_RELATIVE_RESIDUAL) : invertParam.residual_type;
   invertParam.residual_type = (target_fermilab_residual != 0) ? static_cast<QudaResidualType_s> (invertParam.residual_type | QUDA_HEAVY_QUARK_RESIDUAL) : invertParam.residual_type;

   invertParam.tol =  target_residual;
   invertParam.tol_hq = target_fermilab_residual;
   invertParam.heavy_quark_check = (invertParam.residual_type & QUDA_HEAVY_QUARK_RESIDUAL ? 1 : 0);
   invertParam.clover_coeff = clover_coeff;

   // solution types
   invertParam.solution_type      = QUDA_MAT_SOLUTION;
   invertParam.inv_type           = inv_args.solver_type == QUDA_CG_INVERTER ? QUDA_CG_INVERTER : QUDA_BICGSTAB_INVERTER;
   invertParam.solve_type         = invertParam.inv_type == QUDA_CG_INVERTER ? QUDA_NORMOP_PC_SOLVE : QUDA_DIRECT_PC_SOLVE;
   invertParam.matpc_type         = QUDA_MATPC_ODD_ODD;

   invertQuda(solution, source, &invertParam);

   *num_iters = invertParam.iter;
   *final_residual = invertParam.true_res;
   *final_fermilab_residual = invertParam.true_res_hq;

   if (clover || cloverInverse) qudaFreeCloverField();
   if (link) qudaFreeGaugeField();
   qudamilc_called<false>(__func__);
 } // qudaCloverInvert

 void qudaEigCGCloverInvert(int external_precision, int quda_precision, double kappa, double clover_coeff,
                            QudaInvertArgs_t inv_args, double target_residual, double target_fermilab_residual,
                            const void *link,
                            void *clover, // could be stored in Milc format
                            void *cloverInverse,
                            void *source,   // array of source vectors -> overwritten on exit!
                            void *solution, // temporary
                            QudaEigArgs_t eig_args,
                            const int rhs_idx,       // current rhs
                            const int last_rhs_flag, // is this the last rhs to solve?
                            double *const final_residual, double *const final_fermilab_residual, int *num_iters)
 {
   qudamilc_called<true>(__func__);
   if (target_fermilab_residual == 0 && target_residual == 0) errorQuda("qudaCloverInvert: requesting zero residual\n");

   if (link && (rhs_idx == 0)) qudaLoadGaugeField(external_precision, quda_precision, inv_args, link);

   if ( (clover || cloverInverse) && (rhs_idx == 0)) {
     qudaLoadCloverField(external_precision, quda_precision, inv_args, clover, cloverInverse, QUDA_MAT_SOLUTION,
                         QUDA_DIRECT_PC_SOLVE, QUDA_INC_EIGCG_INVERTER, clover_coeff, 0, 0);
   }

   double reliable_delta = 1e-1;

   QudaInvertParam invertParam = newQudaInvertParam();
   setInvertParam(invertParam, inv_args, external_precision, quda_precision, kappa, reliable_delta);
   invertParam.residual_type = static_cast<QudaResidualType_s>(0);
   invertParam.residual_type = (target_residual != 0) ? static_cast<QudaResidualType_s> ( invertParam.residual_type | QUDA_L2_RELATIVE_RESIDUAL) : invertParam.residual_type;
   invertParam.residual_type = (target_fermilab_residual != 0) ? static_cast<QudaResidualType_s> (invertParam.residual_type | QUDA_HEAVY_QUARK_RESIDUAL) : invertParam.residual_type;

   invertParam.tol =  target_residual;
   invertParam.tol_hq = target_fermilab_residual;
   invertParam.heavy_quark_check = (invertParam.residual_type & QUDA_HEAVY_QUARK_RESIDUAL ? 1 : 0);
   invertParam.clover_coeff = clover_coeff;

   // solution types
   invertParam.solution_type      = QUDA_MAT_SOLUTION;
   invertParam.matpc_type         = QUDA_MATPC_ODD_ODD;

   QudaEigParam  df_param = newQudaEigParam();
   df_param.invert_param = &invertParam;

   invertParam.solve_type = QUDA_NORMOP_PC_SOLVE;
   invertParam.nev                = eig_args.nev;
   invertParam.max_search_dim     = eig_args.max_search_dim;
   invertParam.deflation_grid     = eig_args.deflation_grid;
   invertParam.cuda_prec_ritz     = eig_args.prec_ritz;
   invertParam.tol_restart        = eig_args.tol_restart;
   invertParam.eigcg_max_restarts = eig_args.eigcg_max_restarts;
   invertParam.max_restart_num    = eig_args.max_restart_num;
   invertParam.inc_tol            = eig_args.inc_tol;
   invertParam.eigenval_tol       = eig_args.eigenval_tol;
   invertParam.rhs_idx            = rhs_idx;


   if((inv_args.solver_type != QUDA_INC_EIGCG_INVERTER) && (inv_args.solver_type != QUDA_EIGCG_INVERTER)) errorQuda("Incorrect inverter type.\n");
   invertParam.inv_type = inv_args.solver_type;

   if(inv_args.solver_type == QUDA_INC_EIGCG_INVERTER) invertParam.inv_type_precondition = QUDA_INVALID_INVERTER;

   setDeflationParam(eig_args.prec_ritz, eig_args.location_ritz, eig_args.mem_type_ritz, eig_args.deflation_ext_lib, eig_args.vec_infile, eig_args.vec_outfile, &df_param);

   if(rhs_idx == 0)  df_preconditioner = newDeflationQuda(&df_param);
   invertParam.deflation_op = df_preconditioner;

   invertQuda(solution, source, &invertParam);

   if (last_rhs_flag) destroyDeflationQuda(df_preconditioner);

   *num_iters = invertParam.iter;
   *final_residual = invertParam.true_res;
   *final_fermilab_residual = invertParam.true_res_hq;

   if ( (clover || cloverInverse) && last_rhs_flag) qudaFreeCloverField();
   if (link && last_rhs_flag) qudaFreeGaugeField();
   qudamilc_called<false>(__func__);
 } // qudaEigCGCloverInvert


 void qudaCloverMultishiftInvert(int external_precision,
     int quda_precision,
     int num_offsets,
     double* const offset,
     double kappa,
     double clover_coeff,
     QudaInvertArgs_t inv_args,
     const double* target_residual_offset,
     const void* milc_link,
     void* milc_clover,
     void* milc_clover_inv,
     void* source,
     void** solutionArray,
     double* const final_residual,
     int* num_iters)
 {
   static const QudaVerbosity verbosity = getVerbosity();
   qudamilc_called<true>(__func__, verbosity);

   for (int i = 0; i < num_offsets; ++i) {
     if (target_residual_offset[i] == 0) errorQuda("qudaCloverMultishiftInvert: target residual cannot be zero\n");
   }

   // if doing a pure double-precision multi-shift solve don't use reliable updates
   const bool use_mixed_precision = (((quda_precision==2) && inv_args.mixed_precision) ||
                                      ((quda_precision==1) && (inv_args.mixed_precision==2)) ) ? true : false;
   double reliable_delta = (use_mixed_precision) ? 1e-2 : 0.0;
   QudaInvertParam invertParam = newQudaInvertParam();
   setInvertParam(invertParam, inv_args, external_precision, quda_precision, kappa, reliable_delta);
   invertParam.residual_type = QUDA_L2_RELATIVE_RESIDUAL;
   invertParam.num_offset = num_offsets;
   for(int i=0; i<num_offsets; ++i){
     invertParam.offset[i] = offset[i];
     invertParam.tol_offset[i] = target_residual_offset[i];
   }
   invertParam.tol = target_residual_offset[0];
   invertParam.clover_coeff = clover_coeff;

   // solution types
   invertParam.solution_type      = QUDA_MATPCDAG_MATPC_SOLUTION;
   invertParam.solve_type         = QUDA_NORMOP_PC_SOLVE;
   invertParam.inv_type           = QUDA_CG_INVERTER;
   invertParam.matpc_type         = QUDA_MATPC_EVEN_EVEN_ASYMMETRIC;

   invertParam.verbosity = verbosity;
   invertParam.verbosity_precondition = QUDA_SILENT;

   invertParam.make_resident_solution = inv_args.make_resident_solution;
   invertParam.compute_true_res = 0;

   if (num_offsets==1 && offset[0] == 0) {
     // set the solver
     char *quda_solver = getenv("QUDA_MILC_CLOVER_SOLVER");

     // default is chronological CG
     if (!quda_solver || strcmp(quda_solver,"CHRONO_CG_SOLVER")==0) {
       // use CG with chronological forecasting
       invertParam.chrono_use_resident = 1;
       invertParam.chrono_make_resident = 1;
       invertParam.chrono_max_dim = 10;
     } else if (strcmp(quda_solver,"BICGSTAB_SOLVER")==0){
       // use two-step BiCGStab
       invertParam.inv_type = QUDA_BICGSTAB_INVERTER;
       invertParam.solve_type = QUDA_DIRECT_PC_SOLVE;
     } else if (strcmp(quda_solver,"CG_SOLVER")==0){
       // regular CG
       invertParam.chrono_use_resident = 0;
       invertParam.chrono_make_resident = 0;
     }

     invertQuda(solutionArray[0], source, &invertParam);
     *final_residual = invertParam.true_res;
   } else {
     invertMultiShiftQuda(solutionArray, source, &invertParam);
     for (int i=0; i<num_offsets; ++i) final_residual[i] = invertParam.true_res_offset[i];
   }

   // return the number of iterations taken by the inverter
   *num_iters = invertParam.iter;

   qudamilc_called<false>(__func__, verbosity);
 } // qudaCloverMultishiftInvert

 void qudaGaugeFixingOVR(int precision, unsigned int gauge_dir, int Nsteps, int verbose_interval, double relax_boost,
                         double tolerance, unsigned int reunit_interval, unsigned int stopWtheta, void *milc_sitelink)
 {
   QudaGaugeParam qudaGaugeParam = newMILCGaugeParam(localDim,
       (precision==1) ? QUDA_SINGLE_PRECISION : QUDA_DOUBLE_PRECISION,
       QUDA_SU3_LINKS);
   qudaGaugeParam.reconstruct = QUDA_RECONSTRUCT_NO;
   //qudaGaugeParam.reconstruct = QUDA_RECONSTRUCT_12;

   double timeinfo[3];
   computeGaugeFixingOVRQuda(milc_sitelink, gauge_dir, Nsteps, verbose_interval, relax_boost, tolerance, reunit_interval, stopWtheta, \
     &qudaGaugeParam, timeinfo);

   printfQuda("Time H2D: %lf\n", timeinfo[0]);
   printfQuda("Time to Compute: %lf\n", timeinfo[1]);
   printfQuda("Time D2H: %lf\n", timeinfo[2]);
   printfQuda("Time all: %lf\n", timeinfo[0]+timeinfo[1]+timeinfo[2]);
 }

 void qudaGaugeFixingFFT( int precision,
     unsigned int gauge_dir,
     int Nsteps,
     int verbose_interval,
     double alpha,
     unsigned int autotune,
     double tolerance,
     unsigned int stopWtheta,
     void* milc_sitelink
     )
 {
   QudaGaugeParam qudaGaugeParam = newMILCGaugeParam(localDim,
       (precision==1) ? QUDA_SINGLE_PRECISION : QUDA_DOUBLE_PRECISION,
       QUDA_GENERAL_LINKS);
   qudaGaugeParam.reconstruct = QUDA_RECONSTRUCT_NO;
   //qudaGaugeParam.reconstruct = QUDA_RECONSTRUCT_12;


   double timeinfo[3];
   computeGaugeFixingFFTQuda(milc_sitelink, gauge_dir, Nsteps, verbose_interval, alpha, autotune, tolerance, stopWtheta, \
     &qudaGaugeParam, timeinfo);

   printfQuda("Time H2D: %lf\n", timeinfo[0]);
   printfQuda("Time to Compute: %lf\n", timeinfo[1]);
   printfQuda("Time D2H: %lf\n", timeinfo[2]);
   printfQuda("Time all: %lf\n", timeinfo[0]+timeinfo[1]+timeinfo[2]);
 }

 #endif // BUILD_MILC_INTERFACE
computeCloverForceQuda
void computeCloverForceQuda(void *mom, double dt, void **x, void **p, double *coeff, double kappa2, double ck, int nvector, double multiplicity, void *gauge, QudaGaugeParam *gauge_param, QudaInvertParam *inv_param)
Definition: interface_quda.cpp:4684

QudaInvertParam_s::maxiter_precondition
int maxiter_precondition
Definition: quda.h:292

qudaGaugeParam
static QudaGaugeParam qudaGaugeParam
Definition: gauge_force_test.cpp:16

reunit_allow_svd
static bool reunit_allow_svd
Definition: hisq_stencil_test.cpp:55

QudaInvertArgs_t::tadpole
double tadpole
Definition: quda_milc_interface.h:43

QudaInvertParam_s::dirac_order
QudaDiracFieldOrder dirac_order
Definition: quda.h:219

QUDA_VERBOSE
Definition: enum_quda.h:265

QudaInvertParam_s::mass_normalization
QudaMassNormalization mass_normalization
Definition: quda.h:208

QudaInvertParam_s::tol_hq_offset
double tol_hq_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:182

QudaGaugeParam_s::reconstruct_sloppy
QudaReconstructType reconstruct_sloppy
Definition: quda.h:53

QudaGaugeParam_s::anisotropy
double anisotropy
Definition: quda.h:38

QUDA_RECONSTRUCT_NO
Definition: enum_quda.h:67

freeCloverQuda
void freeCloverQuda(void)
Definition: interface_quda.cpp:1440

QudaEigArgs_t
Definition: quda_milc_interface.h:53

QudaInvertArgs_t::max_iter
int max_iter
Definition: quda_milc_interface.h:36

QudaEigParam_s::np
int np
Definition: quda.h:441

gaugeParam
QudaGaugeParam gaugeParam
Definition: covdev_test.cpp:36

quda::ColorSpinorParam::setPrecision
void setPrecision(QudaPrecision precision, QudaPrecision ghost_precision=QUDA_INVALID_PRECISION, bool force_native=false)
Definition: color_spinor_field.h:231

QudaInvertArgs_t::use_resident_solution
int use_resident_solution
Definition: quda_milc_interface.h:41

QUDA_MAT_SOLUTION
Definition: enum_quda.h:151

invertMultiShiftQuda
void invertMultiShiftQuda(void **_hp_x, void *_hp_b, QudaInvertParam *param)
Definition: interface_quda.cpp:3579

setVerbosityQuda
void setVerbosityQuda(QudaVerbosity verbosity, const char prefix[], FILE *outfile)
Definition: interface_quda.cpp:323

QUDA_PACKED_CLOVER_ORDER
Definition: enum_quda.h:256

endQuda
void endQuda(void)
Definition: interface_quda.cpp:1461

QudaInvertParam_s::max_hq_res_increase
int max_hq_res_increase
Definition: quda.h:157

pool_pinned_free
#define pool_pinned_free(ptr)
Definition: malloc_quda.h:128

qudaHisqParamsInit
void qudaHisqParamsInit(QudaHisqParams_t hisq_params)

QudaInvertParam_s::solve_type
QudaSolveType solve_type
Definition: quda.h:205

QudaInvertParam_s::verbosity_precondition
QudaVerbosity verbosity_precondition
Definition: quda.h:286

QudaPrecision
enum QudaPrecision_s QudaPrecision

QudaEigArgs_t::tol_restart
double tol_restart
Definition: quda_milc_interface.h:58

qudaUnitarizeSU3
void qudaUnitarizeSU3(int prec, double tol, QudaMILCSiteArg_t *arg)

QudaGaugeParam_s::ga_pad
int ga_pad
Definition: quda.h:63

destroyDeflationQuda
void destroyDeflationQuda(void *df_instance)
Definition: interface_quda.cpp:2823

QudaGaugeParam_s::make_resident_mom
int make_resident_mom
Definition: quda.h:83

QUDA_MATPC_ODD_ODD
Definition: enum_quda.h:211

qudaGaugeFixingFFT
void qudaGaugeFixingFFT(int precision, unsigned int gauge_dir, int Nsteps, int verbose_interval, double alpha, unsigned int autotune, double tolerance, unsigned int stopWtheta, void *milc_sitelink)
Gauge fixing with Steepest descent method with FFTs with support for single GPU only.

QudaGaugeParam_s::gauge_offset
size_t gauge_offset
Definition: quda.h:87

mass
double mass
Definition: staggered_invertmsrc_test.cpp:71

setMPICommHandleQuda
void setMPICommHandleQuda(void *mycomm)
Definition: interface_quda.cpp:368

QudaGaugeParam_s::gauge_fix
QudaGaugeFixed gauge_fix
Definition: quda.h:61

QudaEigArgs_t::deflation_ext_lib
QudaExtLibType deflation_ext_lib
Definition: quda_milc_interface.h:66

qudaDslash
void qudaDslash(int external_precision, int quda_precision, QudaInvertArgs_t inv_args, const void *const milc_fatlink, const void *const milc_longlink, void *source, void *solution, int *num_iters)

QUDA_PRESERVE_SOURCE_YES
Definition: enum_quda.h:237

quda::fermion_force::setUnitarizeForceConstants
void setUnitarizeForceConstants(double unitarize_eps, double hisq_force_filter, double max_det_error, bool allow_svd, bool svd_only, double svd_rel_error, double svd_abs_error)
Set the constant parameters for the force unitarization.

QUDA_MASS_NORMALIZATION
Definition: enum_quda.h:225

QudaInvertParam_s::inv_type_precondition
QudaInverterType inv_type_precondition
Definition: quda.h:270

quda::ColorSpinorParam::nColor
int nColor
Definition: color_spinor_field.h:85

getVerbosity
QudaVerbosity getVerbosity()
Definition: util_quda.cpp:21

kappa
double kappa
Definition: test_util.cpp:1647

QUDA_ASQTAD_DSLASH
Definition: enum_quda.h:93

QudaGaugeParam_s::type
QudaLinkType type
Definition: quda.h:42

QudaInvertParam_s::kappa
double kappa
Definition: quda.h:106

QudaInvertParam_s::cuda_prec_ritz
QudaPrecision cuda_prec_ritz
Definition: quda.h:324

invertQuda
void invertQuda(void *h_x, void *h_b, QudaInvertParam *param)
Definition: interface_quda.cpp:2830

errorQuda
#define errorQuda(...)
Definition: util_quda.h:121

QudaInvertParam_s::tol
double tol
Definition: quda.h:121

color_spinor_field.h

quda::setUnitarizeLinksConstants
void setUnitarizeLinksConstants(double unitarize_eps, double max_error, bool allow_svd, bool svd_only, double svd_rel_error, double svd_abs_error)
Definition: unitarize_links_quda.cu:72

QudaInvertParam_s::dslash_type
QudaDslashType dslash_type
Definition: quda.h:102

QUDA_GAUGE_FIXED_NO
Definition: enum_quda.h:77

QudaGaugeParam_s::reconstruct_precondition
QudaReconstructType reconstruct_precondition
Definition: quda.h:59

QudaInvertParam_s::inv_type
QudaInverterType inv_type
Definition: quda.h:103

QudaEigArgs_t::prec_ritz
QudaPrecision prec_ritz
Definition: quda_milc_interface.h:54

QudaInvertParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:214

host_free
#define host_free(ptr)
Definition: malloc_quda.h:71

QudaMILCSiteArg_t::link
void * link
Definition: quda_milc_interface.h:25

QUDA_ODD_PARITY
Definition: enum_quda.h:288

QUDA_SPACE_SPIN_COLOR_FIELD_ORDER
Definition: enum_quda.h:350

QUDA_HALF_PRECISION
Definition: enum_quda.h:60

QudaSolveType
enum QudaSolveType_s QudaSolveType

loadGaugeQuda
void loadGaugeQuda(void *h_gauge, QudaGaugeParam *param)
Definition: interface_quda.cpp:729

deflation_ext_lib
QudaExtLibType deflation_ext_lib
Definition: test_util.cpp:1718

QUDA_THREE_LINKS
Definition: enum_quda.h:25

QUDA_WILSON_LINKS
Definition: enum_quda.h:29

qudaInit
void qudaInit(QudaInitArgs_t input)

QudaMILCSiteArg_t::mom_offset
size_t mom_offset
Definition: quda_milc_interface.h:28

QudaHisqParams_t::reunit_svd_rel_error
double reunit_svd_rel_error
Definition: quda_milc_interface.h:103

QudaInvertParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:213

QudaEigArgs_t::mem_type_ritz
QudaMemoryType mem_type_ritz
Definition: quda_milc_interface.h:69

cuda_prec
QudaPrecision & cuda_prec
Definition: contract_test.cpp:67

setDeflationParam
void setDeflationParam(QudaEigParam &df_param)
Definition: deflated_invert_test.cpp:287

QudaHisqParams_t::reunit_allow_svd
int reunit_allow_svd
Definition: quda_milc_interface.h:100

rank
static int rank
Definition: comm_mpi.cpp:44

QudaHisqParams_t
Definition: quda_milc_interface.h:99

momActionQuda
double momActionQuda(void *momentum, QudaGaugeParam *param)
Definition: interface_quda.cpp:5084

QudaGaugeParam_s::staggered_phase_type
QudaStaggeredPhase staggered_phase_type
Definition: quda.h:71

QudaInvertArgs_t::evenodd
QudaParity evenodd
Definition: quda_milc_interface.h:37

QUDA_EIGCG_INVERTER
Definition: enum_quda.h:111

qudaLoadGaugeField
void qudaLoadGaugeField(int external_precision, int quda_precision, QudaInvertArgs_t inv_args, const void *milc_link)

setInvertParam
void setInvertParam(QudaInvertParam &inv_param)
Definition: contract_test.cpp:71

QudaInvertParam_s::dagger
QudaDagType dagger
Definition: quda.h:207

MAX
#define MAX(a, b)
Definition: milc_interface.cpp:13

qudaInvert
void qudaInvert(int external_precision, int quda_precision, double mass, QudaInvertArgs_t inv_args, double target_residual, double target_fermilab_residual, const void *const milc_fatlink, const void *const milc_longlink, void *source, void *solution, double *const final_resid, double *const final_rel_resid, int *num_iters)

qudaEigCGInvert
void qudaEigCGInvert(int external_precision, int quda_precision, double mass, QudaInvertArgs_t inv_args, double target_residual, double target_fermilab_residual, const void *const fatlink, const void *const longlink, void *source, void *solution, QudaEigArgs_t eig_args, const int rhs_idx, const int last_rhs_flag, double *const final_residual, double *const final_fermilab_residual, int *num_iters)

QudaFatLinkArgs_t
Definition: quda_milc_interface.h:111

QudaInvertArgs_t::make_resident_solution
int make_resident_solution
Definition: quda_milc_interface.h:40

reliable_delta
double reliable_delta
Definition: test_util.cpp:1658

QudaInvertParam_s::cuda_prec_refinement_sloppy
QudaPrecision cuda_prec_refinement_sloppy
Definition: quda.h:216

QUDA_CG_INVERTER
Definition: enum_quda.h:102

qudaCloverMultishiftInvert
void qudaCloverMultishiftInvert(int external_precision, int quda_precision, int num_offsets, double *const offset, double kappa, double clover_coeff, QudaInvertArgs_t inv_args, const double *target_residual, const void *milc_link, void *milc_clover, void *milc_clover_inv, void *source, void **solutionArray, double *const final_residual, int *num_iters)

qudaEigCGCloverInvert
void qudaEigCGCloverInvert(int external_precision, int quda_precision, double kappa, double clover_coeff, QudaInvertArgs_t inv_args, double target_residual, double target_fermilab_residual, const void *milc_link, void *milc_clover, void *milc_clover_inv, void *source, void *solution, QudaEigArgs_t eig_args, const int rhs_idx, const int last_rhs_flag, double *const final_residual, double *const final_fermilab_residual, int *num_iters)

QUDA_MILC_SITE_GAUGE_ORDER
Definition: enum_quda.h:45

QudaGaugeParam_s::gauge_order
QudaGaugeFieldOrder gauge_order
Definition: quda.h:43

QudaInvertParam_s::true_res
double true_res
Definition: quda.h:126

QudaGaugeParam_s::mom_offset
size_t mom_offset
Definition: quda.h:88

computeKSLinkQuda
void computeKSLinkQuda(void *fatlink, void *longlink, void *ulink, void *inlink, double *path_coeff, QudaGaugeParam *param)
Definition: interface_quda.cpp:3974

qudaGaugeFixingOVR
void qudaGaugeFixingOVR(const int precision, const unsigned int gauge_dir, const int Nsteps, const int verbose_interval, const double relax_boost, const double tolerance, const unsigned int reunit_interval, const unsigned int stopWtheta, void *milc_sitelink)
Gauge fixing with overrelaxation with support for single and multi GPU.

qudaSaveGaugeField
void qudaSaveGaugeField(void *gauge, void *inGauge)

loadCloverQuda
void loadCloverQuda(void *h_clover, void *h_clovinv, QudaInvertParam *inv_param)
Definition: interface_quda.cpp:985

length
int length[]
Definition: gauge_force_test.cpp:34

QudaInvertParam_s::make_resident_solution
int make_resident_solution
Definition: quda.h:347

QudaGaugeParam_s::overwrite_mom
int overwrite_mom
Definition: quda.h:78

qudaMomAction
double qudaMomAction(int precision, void *momentum)

quda
Definition: blas_cublas.h:5

quda::LatticeFieldParam::siteSubset
QudaSiteSubset siteSubset
Definition: lattice_field.h:71

qudaSetLayout
void qudaSetLayout(QudaLayout_t layout)

QudaInvertParam_s::clover_cuda_prec_sloppy
QudaPrecision clover_cuda_prec_sloppy
Definition: quda.h:226

QudaInvertParam_s::compute_action
int compute_action
Definition: quda.h:197

dslashQuda
void dslashQuda(void *h_out, void *h_in, QudaInvertParam *inv_param, QudaParity parity)
Definition: interface_quda.cpp:1853

QudaInvertParam_s::input_location
QudaFieldLocation input_location
Definition: quda.h:99

freeGaugeQuda
void freeGaugeQuda(void)
Definition: interface_quda.cpp:1259

initCommsGridQuda
void initCommsGridQuda(int nDim, const int *dims, QudaCommsMap func, void *fdata)
Definition: interface_quda.cpp:401

QudaInvertParam_s::true_res_hq_offset
double true_res_hq_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:191

QudaInvertParam_s::reliable_delta
double reliable_delta
Definition: quda.h:129

QudaGaugeParam_s::site_size
size_t site_size
Definition: quda.h:89

QudaInvertParam_s::use_init_guess
QudaUseInitGuess use_init_guess
Definition: quda.h:231

qudaHisqForce
void qudaHisqForce(int precision, int num_terms, int num_naik_terms, double dt, double **coeff, void **quark_field, const double level2_coeff[6], const double fat7_coeff[6], const void *const w_link, const void *const v_link, const void *const u_link, void *const milc_momentum)

computeGaugeFixingOVRQuda
int computeGaugeFixingOVRQuda(void *gauge, const unsigned int gauge_dir, const unsigned int Nsteps, const unsigned int verbose_interval, const double relax_boost, const double tolerance, const unsigned int reunit_interval, const unsigned int stopWtheta, QudaGaugeParam *param, double *timeinfo)
Gauge fixing with overrelaxation with support for single and multi GPU.
Definition: interface_quda.cpp:5634

param
QudaGaugeParam param
Definition: pack_test.cpp:17

QudaEigParam_s::nk
int nk
Definition: quda.h:440

QudaGaugeParam_s::llfat_ga_pad
int llfat_ga_pad
Definition: quda.h:68

QudaInvertParam_s::solution_type
QudaSolutionType solution_type
Definition: quda.h:204

projectSU3Quda
void projectSU3Quda(void *gauge_h, double tol, QudaGaugeParam *param)
Definition: interface_quda.cpp:4971

QUDA_MATPC_SOLUTION
Definition: enum_quda.h:153

QudaEigParam_s::mem_type_ritz
QudaMemoryType mem_type_ritz
Definition: quda.h:450

quda::LatticeFieldParam::x
int x[QUDA_MAX_DIM]
Definition: lattice_field.h:67

QudaInvertParam_s::clover_cuda_prec
QudaPrecision clover_cuda_prec
Definition: quda.h:225

QUDA_RECONSTRUCT_9
Definition: enum_quda.h:70

cuda_prec_sloppy
QudaPrecision & cuda_prec_sloppy
Definition: contract_test.cpp:68

QUDA_MATPC_EVEN_EVEN_ASYMMETRIC
Definition: enum_quda.h:212

QUDA_SILENT
Definition: enum_quda.h:263

QudaInvertParam_s::chrono_use_resident
int chrono_use_resident
Definition: quda.h:359

computeGaugeForceQuda
int computeGaugeForceQuda(void *mom, void *sitelink, int ***input_path_buf, int *path_length, double *loop_coeff, int num_paths, int max_length, double dt, QudaGaugeParam *qudaGaugeParam)
Definition: interface_quda.cpp:4073

solution_type
QudaSolutionType solution_type
Definition: test_util.cpp:1664

QudaEigParam_s::invert_param
QudaInvertParam * invert_param
Definition: quda.h:381

QudaGaugeParam_s::scale
double scale
Definition: quda.h:40

initQuda
void initQuda(int device)
Definition: interface_quda.cpp:679

QUDA_EVEN_ODD_SITE_ORDER
Definition: enum_quda.h:340

tol
double tol
Definition: test_util.cpp:1656

qudaFreePinned
void qudaFreePinned(void *ptr)

qudaUpdateU
void qudaUpdateU(int precision, double eps, QudaMILCSiteArg_t *arg)

QudaInvertParam_s::output_location
QudaFieldLocation output_location
Definition: quda.h:100

QUDA_USE_INIT_GUESS_YES
Definition: enum_quda.h:429

QudaInvertParam_s::clover_cuda_prec_precondition
QudaPrecision clover_cuda_prec_precondition
Definition: quda.h:228

QUDA_RECONSTRUCT_12
Definition: enum_quda.h:68

QudaGaugeParam_s::site_ga_pad
int site_ga_pad
Definition: quda.h:65

POP_RANGE
#define POP_RANGE
Definition: timer.h:168

quda::canReuseResidentGauge
bool canReuseResidentGauge(QudaInvertParam *inv_param)
Definition: interface_quda.cpp:2232

QudaEigParam_s::run_verify
QudaBoolean run_verify
Definition: quda.h:456

qudaFreeCloverField
void qudaFreeCloverField()

QUDA_PRESERVE_SOURCE_NO
Definition: enum_quda.h:236

QudaGaugeParam_s
Definition: quda.h:32

newDeflationQuda
void * newDeflationQuda(QudaEigParam *param)
Definition: interface_quda.cpp:2809

quda::ColorSpinorParam::fieldOrder
QudaFieldOrder fieldOrder
Definition: color_spinor_field.h:93

QudaInvertParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:215

qudaInvertMsrc
void qudaInvertMsrc(int external_precision, int quda_precision, double mass, QudaInvertArgs_t inv_args, double target_residual, double target_fermilab_residual, const void *const fatlink, const void *const longlink, void **sourceArray, void **solutionArray, double *const final_residual, double *const final_fermilab_residual, int *num_iters, int num_src)

initialized
static bool initialized
Profiler for initQuda.
Definition: interface_quda.cpp:159

QudaInvertParam_s::verbosity
QudaVerbosity verbosity
Definition: quda.h:244

reunit_svd_only
static bool reunit_svd_only
Definition: hisq_stencil_test.cpp:56

csParam
ColorSpinorParam csParam
Definition: pack_test.cpp:24

QudaInvertParam_s::tol_offset
double tol_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:179

QUDA_MILC_GAUGE_ORDER
Definition: enum_quda.h:44

QudaInvertParam_s::true_res_offset
double true_res_offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:185

nvec
int nvec[QUDA_MAX_MG_LEVEL]
Definition: test_util.cpp:1637

newQudaInvertParam
QudaInvertParam newQudaInvertParam(void)

QudaInvertParam_s::gflops
double gflops
Definition: quda.h:250

qudaCreateGaugeField
void * qudaCreateGaugeField(void *gauge, int geometry, int precision)

QudaInvertParam_s::eigcg_max_restarts
int eigcg_max_restarts
Definition: quda.h:340

QUDA_BOOLEAN_TRUE
Definition: enum_quda.h:453

QUDA_BOOLEAN_FALSE
Definition: enum_quda.h:452

QudaGaugeParam_s::cuda_prec_precondition
QudaPrecision cuda_prec_precondition
Definition: quda.h:58

QudaInvertParam_s::clover_order
QudaCloverFieldOrder clover_order
Definition: quda.h:230

QudaLayout_t
Definition: quda_milc_interface.h:80

computeHISQForceQuda
void computeHISQForceQuda(void *momentum, double dt, const double level2_coeff[6], const double fat7_coeff[6], const void *const w_link, const void *const v_link, const void *const u_link, void **quark, int num, int num_naik, double **coeff, QudaGaugeParam *param)
Definition: interface_quda.cpp:4433

saveGaugeFieldQuda
void saveGaugeFieldQuda(void *outGauge, void *inGauge, QudaGaugeParam *param)
Definition: interface_quda.cpp:4252

QudaInvertParam_s::tol_hq
double tol_hq
Definition: quda.h:123

quda::ColorSpinorParam::gammaBasis
QudaGammaBasis gammaBasis
Definition: color_spinor_field.h:94

QudaInvertParam_s::nev
int nev
Definition: quda.h:328

QUDA_PERIODIC_T
Definition: enum_quda.h:54

QUDA_CLOVER_WILSON_DSLASH
Definition: enum_quda.h:88

QudaHisqParams_t::force_filter
double force_filter
Definition: quda_milc_interface.h:104

QudaInvertArgs_t::solver_type
QudaInverterType solver_type
Definition: quda_milc_interface.h:42

qudaRephase
void qudaRephase(int prec, void *gauge, int flag, double i_mu)

QudaInvertParam_s::true_res_hq
double true_res_hq
Definition: quda.h:127

quda::cudaGaugeField
Definition: gauge_field.h:404

QudaSolutionType
enum QudaSolutionType_s QudaSolutionType

qudaComputeOprod
void qudaComputeOprod(int precision, int num_terms, int num_naik_terms, double **coeff, double scale, void **quark_field, void *oprod[3])

QUDA_PARITY_SITE_SUBSET
Definition: enum_quda.h:332

QudaInvertParam_s::gamma_basis
QudaGammaBasis gamma_basis
Definition: quda.h:221

QudaLayout_t::machsize
const int * machsize
Definition: quda_milc_interface.h:82

QudaGaugeParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:52

QudaInvertParam_s::max_search_dim
int max_search_dim
Definition: quda.h:332

QudaInvertParam_s::chrono_make_resident
int chrono_make_resident
Definition: quda.h:353

QudaInvertParam_s::tol_precondition
double tol_precondition
Definition: quda.h:289

QudaMILCSiteArg_t
Definition: quda_milc_interface.h:23

QudaHisqParams_t::reunit_svd_abs_error
double reunit_svd_abs_error
Definition: quda_milc_interface.h:102

QudaInvertParam_s::offset
double offset[QUDA_MAX_MULTI_SHIFT]
Definition: quda.h:176

qudaFreeGaugeField
void qudaFreeGaugeField()

QudaInvertParam_s::use_sloppy_partial_accumulator
int use_sloppy_partial_accumulator
Definition: quda.h:132

QudaInvertParam_s::heavy_quark_check
int heavy_quark_check
Definition: quda.h:165

QudaParity
enum QudaParity_s QudaParity

QudaGaugeParam_s::reconstruct
QudaReconstructType reconstruct
Definition: quda.h:50

QudaLinkType
enum QudaLinkType_s QudaLinkType

QudaGaugeParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:49

QUDA_KAPPA_NORMALIZATION
Definition: enum_quda.h:224

QudaGaugeParam_s::X
int X[4]
Definition: quda.h:36

qudaLoadCloverField
void qudaLoadCloverField(int external_precision, int quda_precision, QudaInvertArgs_t inv_args, void *milc_clover, void *milc_clover_inv, QudaSolutionType solution_type, QudaSolveType solve_type, double clover_coeff, int compute_trlog, double *trlog)

QudaInvertParam_s::mass
double mass
Definition: quda.h:105

QudaEigParam_s::import_vectors
QudaBoolean import_vectors
Definition: quda.h:444

QudaEigArgs_t::eigcg_max_restarts
int eigcg_max_restarts
Definition: quda_milc_interface.h:60

QUDA_HEAVY_QUARK_RESIDUAL
Definition: enum_quda.h:189

qudaFinalize
void qudaFinalize()

QudaEigParam_s::location
QudaFieldLocation location
Definition: quda.h:453

QudaInvertParam_s::gcrNkrylov
int gcrNkrylov
Definition: quda.h:259

QudaEigArgs_t::location_ritz
QudaFieldLocation location_ritz
Definition: quda_milc_interface.h:68

QudaEigArgs_t::vec_outfile
char * vec_outfile
Definition: quda_milc_interface.h:72

QudaEigParam_s
Definition: quda.h:376

QudaInvertParam_s::maxiter
int maxiter
Definition: quda.h:128

safe_malloc
#define safe_malloc(size)
Definition: malloc_quda.h:66

qudaCloverInvert
void qudaCloverInvert(int external_precision, int quda_precision, double kappa, double clover_coeff, QudaInvertArgs_t inv_args, double target_residual, double target_fermilab_residual, const void *milc_link, void *milc_clover, void *milc_clover_inv, void *source, void *solution, double *const final_residual, double *const final_fermilab_residual, int *num_iters)

QUDA_BICGSTAB_INVERTER
Definition: enum_quda.h:103

QudaInvertParam_s::max_hq_res_restart_total
int max_hq_res_restart_total
Definition: quda.h:162

solve_type
QudaSolveType solve_type
Definition: test_util.cpp:1663

QudaGaugeParam_s::cuda_prec_refinement_sloppy
QudaPrecision cuda_prec_refinement_sloppy
Definition: quda.h:55

quda::LatticeFieldParam::nDim
int nDim
Definition: lattice_field.h:64

QudaInvertParam_s::sp_pad
int sp_pad
Definition: quda.h:246

dims
static int dims[4]
Definition: face_gauge.cpp:41

staggeredPhaseQuda
void staggeredPhaseQuda(void *gauge_h, QudaGaugeParam *param)
Definition: interface_quda.cpp:5029

QudaEigArgs_t::max_restart_num
int max_restart_num
Definition: quda_milc_interface.h:61

QudaMILCSiteArg_t::site
void * site
Definition: quda_milc_interface.h:24

QudaEigArgs_t::inc_tol
double inc_tol
Definition: quda_milc_interface.h:62

index
static int index(int ndim, const int *dims, const int *x)
Definition: comm_common.cpp:32

pool_pinned_malloc
#define pool_pinned_malloc(size)
Definition: malloc_quda.h:127

QudaLayout_t::device
int device
Definition: quda_milc_interface.h:83

quda::ColorSpinorParam
Definition: color_spinor_field.h:80

computeGaugeFixingFFTQuda
int computeGaugeFixingFFTQuda(void *gauge, const unsigned int gauge_dir, const unsigned int Nsteps, const unsigned int verbose_interval, const double alpha, const unsigned int autotune, const double tolerance, const unsigned int stopWtheta, QudaGaugeParam *param, double *timeinfo)
Gauge fixing with Steepest descent method with FFTs with support for single GPU only.
Definition: interface_quda.cpp:5716

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:62

qudaLoadUnitarizedLink
void qudaLoadUnitarizedLink(int precision, QudaFatLinkArgs_t fatlink_args, const double path_coeff[6], void *inlink, void *fatlink, void *ulink)

QudaEigParam_s::vec_outfile
char vec_outfile[256]
Definition: quda.h:462

unitarization_links.h

destroyGaugeFieldQuda
void destroyGaugeFieldQuda(void *gauge)
Definition: interface_quda.cpp:4265

QudaResidualType_s
QudaResidualType_s
Definition: enum_quda.h:186

QudaFieldLocation
enum QudaFieldLocation_s QudaFieldLocation

QudaInvertArgs_t::mixed_precision
int mixed_precision
Definition: quda_milc_interface.h:38

QudaMILCSiteArg_t::mom
void * mom
Definition: quda_milc_interface.h:27

QudaGaugeParam_s::tadpole_coeff
double tadpole_coeff
Definition: quda.h:39

QudaInvertParam_s::cuda_prec_precondition
QudaPrecision cuda_prec_precondition
Definition: quda.h:217

QudaInvertParam_s::iter
int iter
Definition: quda.h:249

QudaInvertParam_s::deflation_grid
int deflation_grid
Definition: quda.h:336

QUDA_STAGGERED_DSLASH
Definition: enum_quda.h:92

QudaInvertParam_s::num_src
int num_src
Definition: quda.h:171

gParam
GaugeFieldParam gParam
Definition: hisq_paths_force_test.cpp:64

QudaInvertParam_s::tol_restart
double tol_restart
Definition: quda.h:122

QUDA_INVALID_INVERTER
Definition: enum_quda.h:128

qudaSetMPICommHandle
void qudaSetMPICommHandle(void *mycomm)

updateGaugeFieldQuda
void updateGaugeFieldQuda(void *gauge, void *momentum, double dt, int conj_mom, int exact, QudaGaugeParam *param)
Definition: interface_quda.cpp:4869

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:61

clover_coeff
double clover_coeff
Definition: test_util.cpp:1653

quda::ColorSpinorParam::nSpin
int nSpin
Definition: color_spinor_field.h:86

QUDA_GENERAL_LINKS
Definition: enum_quda.h:24

QudaReconstructType
enum QudaReconstructType_s QudaReconstructType

QudaMILCSiteArg_t::link_offset
size_t link_offset
Definition: quda_milc_interface.h:26

quda.h
Main header file for the QUDA library.

invertMultiSrcQuda
void invertMultiSrcQuda(void **_hp_x, void **_hp_b, QudaInvertParam *param)
Definition: interface_quda.cpp:3234

unitarize_eps
static double unitarize_eps
Definition: hisq_stencil_test.cpp:54

QudaLayout_t::latsize
const int * latsize
Definition: quda_milc_interface.h:81

QUDA_DEGRAND_ROSSI_GAMMA_BASIS
Definition: enum_quda.h:367

dslash_quda.h

quda::fermion_force
Definition: ks_improved_force.h:8

QudaGaugeParam_s::mom_ga_pad
int mom_ga_pad
Definition: quda.h:69

qudaCloverForce
void qudaCloverForce(void *mom, double dt, void **x, void **p, double *coeff, double kappa, double ck, int nvec, double multiplicity, void *gauge, int precision, QudaInvertArgs_t inv_args)

qudaAllocatePinned
void * qudaAllocatePinned(size_t bytes)

mem_type_ritz
QudaMemoryType mem_type_ritz
Definition: test_util.cpp:1720

QudaInvertParam_s::Ls
int Ls
Definition: quda.h:109

printfQuda
#define printfQuda(...)
Definition: util_quda.h:115

QUDA_DAG_NO
Definition: enum_quda.h:218

QudaGaugeParam_s::t_boundary
QudaTboundary t_boundary
Definition: quda.h:45

QudaInitArgs_t
Definition: quda_milc_interface.h:90

QUDA_INC_EIGCG_INVERTER
Definition: enum_quda.h:112

quda::ColorSpinorParam::siteOrder
QudaSiteOrder siteOrder
Definition: color_spinor_field.h:91

cudaGauge
cudaGaugeField * cudaGauge
Definition: hisq_paths_force_test.cpp:21

QUDA_STAGGERED_PHASE_MILC
Definition: enum_quda.h:490

QudaInvertParam_s::chrono_max_dim
int chrono_max_dim
Definition: quda.h:362

QudaInvertParam_s::max_restart_num
int max_restart_num
Definition: quda.h:342

QUDA_DIRAC_ORDER
Definition: enum_quda.h:243

quda::arg
__host__ __device__ ValueType arg(const complex< ValueType > &z)
Returns the phase angle of z.
Definition: complex_quda.h:1076

createGaugeFieldQuda
void * createGaugeFieldQuda(void *gauge, int geometry, QudaGaugeParam *param)
Definition: interface_quda.cpp:4229

QudaGaugeParam_s::use_resident_mom
int use_resident_mom
Definition: quda.h:81

QUDA_RECONSTRUCT_13
Definition: enum_quda.h:71

QUDA_ANTI_PERIODIC_T
Definition: enum_quda.h:53

quda_milc_interface.h

device
int device
Definition: test_util.cpp:1602

QudaInvertParam_s::cl_pad
int cl_pad
Definition: quda.h:247

location_ritz
QudaFieldLocation location_ritz
Definition: test_util.cpp:1719

QUDA_DIRECT_PC_SOLVE
Definition: enum_quda.h:163

longlink
void * longlink
Definition: staggered_invertmsrc_test.cpp:30

QudaInvertParam_s::compute_true_res
int compute_true_res
Definition: quda.h:125

QudaInvertParam_s::residual_type
QudaResidualType residual_type
Definition: quda.h:320

QudaInvertParam_s::rhs_idx
int rhs_idx
Definition: quda.h:334

QUDA_EVEN_PARITY
Definition: enum_quda.h:287

QudaInvertParam_s::inc_tol
double inc_tol
Definition: quda.h:344

QudaInvertParam_s::num_offset
int num_offset
Definition: quda.h:169

QudaHisqParams_t::reunit_svd_only
int reunit_svd_only
Definition: quda_milc_interface.h:101

QudaVerbosity
enum QudaVerbosity_s QudaVerbosity

cpu_prec
QudaPrecision & cpu_prec
Definition: contract_test.cpp:66

fatlink
void * fatlink
Definition: staggered_invertmsrc_test.cpp:29

QudaGaugeParam_s::return_result_mom
int return_result_mom
Definition: quda.h:85

PUSH_RANGE
#define PUSH_RANGE(name, cid)
Definition: timer.h:167

QudaInitArgs_t::verbosity
QudaVerbosity verbosity
Definition: quda_milc_interface.h:91

QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:360

QudaInvertParam_s::use_resident_solution
int use_resident_solution
Definition: quda.h:350

QudaInvertArgs_t
Definition: quda_milc_interface.h:35

quda::ColorSpinorParam::create
QudaFieldCreate create
Definition: color_spinor_field.h:95

QUDA_NORMOP_PC_SOLVE
Definition: enum_quda.h:164

qudaLoadKSLink
void qudaLoadKSLink(int precision, QudaFatLinkArgs_t fatlink_args, const double act_path_coeff[6], void *inlink, void *fatlink, void *longlink)

QudaInvertParam_s::deflation_op
void * deflation_op
Definition: quda.h:276

QUDA_MATPCDAG_MATPC_SOLUTION
Definition: enum_quda.h:155

QudaInvertParam_s::eigenval_tol
double eigenval_tol
Definition: quda.h:338

QUDA_MATPC_EVEN_EVEN
Definition: enum_quda.h:210

QUDA_SU3_LINKS
Definition: enum_quda.h:23

QudaEigArgs_t::vec_infile
char * vec_infile
Definition: quda_milc_interface.h:71

QudaInvertParam_s::clover_cpu_prec
QudaPrecision clover_cpu_prec
Definition: quda.h:224

QudaEigParam_s::cuda_prec_ritz
QudaPrecision cuda_prec_ritz
Definition: quda.h:447

parity
QudaParity parity
Definition: covdev_test.cpp:54

QudaInvertParam_s
Definition: quda.h:97

QudaInvertArgs_t::boundary_phase
double boundary_phase[4]
Definition: quda_milc_interface.h:39

qudaGaugeForce
void qudaGaugeForce(int precision, int num_loop_types, double milc_loop_coeff[3], double eb3, QudaMILCSiteArg_t *arg)

opp
static int opp(int dir)
Definition: interface_quda.cpp:5217

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:325

prec
QudaPrecision prec
Definition: test_util.cpp:1608

QUDA_ASQTAD_FAT_LINKS
Definition: enum_quda.h:30

QudaInvertParam_s::matpc_type
QudaMatPCType matpc_type
Definition: quda.h:206

newQudaEigParam
QudaEigParam newQudaEigParam(void)

QudaEigParam_s::vec_infile
char vec_infile[256]
Definition: quda.h:459

QudaEigArgs_t::max_search_dim
int max_search_dim
Definition: quda_milc_interface.h:56

QudaInverterType
enum QudaInverterType_s QudaInverterType

qudaMultishiftInvert
void qudaMultishiftInvert(int external_precision, int precision, int num_offsets, double *const offset, QudaInvertArgs_t inv_args, const double *target_residual, const double *target_fermilab_residual, const void *const milc_fatlink, const void *const milc_longlink, void *source, void **solutionArray, double *const final_residual, double *const final_fermilab_residual, int *num_iters)

QUDA_L2_RELATIVE_RESIDUAL
Definition: enum_quda.h:187

QudaMemoryType
enum QudaMemoryType_s QudaMemoryType

qudaAsqtadForce
void qudaAsqtadForce(int precision, const double act_path_coeff[6], const void *const one_link_src[4], const void *const naik_src[4], const void *const link, void *const milc_momentum)

QudaEigArgs_t::nev
int nev
Definition: quda_milc_interface.h:55

QudaEigArgs_t::deflation_grid
int deflation_grid
Definition: quda_milc_interface.h:57

createGaugeForcePaths
static void createGaugeForcePaths(int **paths, int dir, int num_loop_types)
Definition: interface_quda.cpp:5219

QudaGaugeParam_s::reconstruct_refinement_sloppy
QudaReconstructType reconstruct_refinement_sloppy
Definition: quda.h:56

quda::blas::bytes
unsigned long long bytes
Definition: blas_quda.cu:23

QudaGaugeParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:47

QudaEigArgs_t::eigenval_tol
double eigenval_tol
Definition: quda_milc_interface.h:63

QudaExtLibType
enum QudaExtLibType_s QudaExtLibType

ks_improved_force.h

QudaInitArgs_t::layout
QudaLayout_t layout
Definition: quda_milc_interface.h:92

qudaDestroyGaugeField
void qudaDestroyGaugeField(void *gauge)

QudaMILCSiteArg_t::size
size_t size
Definition: quda_milc_interface.h:29

newQudaGaugeParam
QudaGaugeParam newQudaGaugeParam(void)

QudaInvertArgs_t::naik_epsilon
double naik_epsilon
Definition: quda_milc_interface.h:46

QudaInvertParam_s::preserve_source
QudaPreserveSource preserve_source
Definition: quda.h:211

quda_internal.h

QudaInvertParam_s::reliable_delta_refinement
double reliable_delta_refinement
Definition: quda.h:130

quda::LatticeFieldParam::pad
int pad
Definition: lattice_field.h:69

QudaInvertParam_s::clover_coeff
double clover_coeff
Definition: quda.h:233

verbosity
QudaVerbosity verbosity
Definition: test_util.cpp:1614