quda-ref/v1.1.0/unitarize__link__test_8cpp_source.html

 #include <stdio.h>

 #include <stdlib.h>

 #include <string.h>

 #include <sys/time.h>


 #include "quda.h"

 #include "gauge_field.h"

 #include "host_utils.h"

 #include <command_line_params.h>

 #include "misc.h"

 #include "util_quda.h"

 #include "llfat_quda.h"

 #include <unitarization_links.h>

 #include "dslash_quda.h"

 #include "ks_improved_force.h"


 #ifdef MULTI_GPU

 #include "comm_quda.h"

 #endif


 // google test frame work

 #include <gtest/gtest.h>


 #define TDIFF(a,b) (b.tv_sec - a.tv_sec + 0.000001*(b.tv_usec - a.tv_usec))


 using namespace quda;


 static double unitarize_eps  = 1e-6;

 static bool reunit_allow_svd = true;

 static bool reunit_svd_only  = false;

 static double svd_rel_error  = 1e-4;

 static double svd_abs_error  = 1e-4;

 static double max_allowed_error = 1e-11;


 static QudaGaugeFieldOrder gauge_order = QUDA_MILC_GAUGE_ORDER;


 cpuGaugeField *cpuFatLink, *cpuULink, *cudaResult;

 cudaGaugeField *cudaFatLink, *cudaULink;


 const double unittol = (prec == QUDA_DOUBLE_PRECISION) ? 1e-10 : 1e-6;


 TEST(unitarization, verify) {

   unitarizeLinksCPU(*cpuULink, *cpuFatLink);

   cudaULink->saveCPUField(*cudaResult);


   int res = compare_floats(cudaResult->Gauge_p(), cpuULink->Gauge_p(), 4 * cudaResult->Volume() * gauge_site_size,

                            unittol, cpu_prec);


 #ifdef MULTI_GPU

   comm_allreduce_int(&res);

   res /= comm_size();

 #endif


   ASSERT_EQ(res,1) << "CPU and CUDA implementations do not agree";

 }


 static int unitarize_link_test(int &test_rc)

 {

   QudaGaugeParam qudaGaugeParam = newQudaGaugeParam();


   qudaGaugeParam.anisotropy = 1.0;


   qudaGaugeParam.X[0] = xdim;

   qudaGaugeParam.X[1] = ydim;

   qudaGaugeParam.X[2] = zdim;

   qudaGaugeParam.X[3] = tdim;


   setDims(qudaGaugeParam.X);


   qudaGaugeParam.type = QUDA_WILSON_LINKS;


   qudaGaugeParam.t_boundary        = QUDA_PERIODIC_T;

   qudaGaugeParam.anisotropy        = 1.0;

   qudaGaugeParam.gauge_fix         = QUDA_GAUGE_FIXED_NO;

   qudaGaugeParam.ga_pad            = 0;

   qudaGaugeParam.cpu_prec = cpu_prec;

   qudaGaugeParam.cuda_prec = prec;

   qudaGaugeParam.cuda_prec_sloppy   = prec;


   if (gauge_order != QUDA_MILC_GAUGE_ORDER)

     errorQuda("Unsupported gauge order %d", gauge_order);


   qudaGaugeParam.gauge_order = gauge_order;

   qudaGaugeParam.type=QUDA_WILSON_LINKS;

   qudaGaugeParam.reconstruct = link_recon;

   qudaGaugeParam.reconstruct_sloppy = qudaGaugeParam.reconstruct;


   qudaGaugeParam.llfat_ga_pad = qudaGaugeParam.site_ga_pad = qudaGaugeParam.ga_pad = qudaGaugeParam.staple_pad = 0;


   GaugeFieldParam gParam(0, qudaGaugeParam);

   gParam.pad = 0;

   gParam.link_type   = QUDA_GENERAL_LINKS;

   gParam.ghostExchange = QUDA_GHOST_EXCHANGE_NO;

   gParam.order = gauge_order;


   TimeProfile profile("dummy");


   void *inlink = (void *)safe_malloc(4 * V * gauge_site_size * cpu_prec);

   void *fatlink = (void *)safe_malloc(4 * V * gauge_site_size * cpu_prec);


   void* sitelink[4];

   for (int i = 0; i < 4; i++) sitelink[i] = pinned_malloc(V * gauge_site_size * cpu_prec);


   createSiteLinkCPU(sitelink, qudaGaugeParam.cpu_prec, 1);


   if (cpu_prec == QUDA_DOUBLE_PRECISION){

     double* link = reinterpret_cast<double*>(inlink);

     for(int dir=0; dir<4; ++dir){

       double* slink = reinterpret_cast<double*>(sitelink[dir]);

       for(int i=0; i<V; ++i){

         for (int j = 0; j < gauge_site_size; j++) {

           link[(i * 4 + dir) * gauge_site_size + j] = slink[i * gauge_site_size + j];

         }

       }

     }

   } else if(cpu_prec == QUDA_SINGLE_PRECISION){

     float* link = reinterpret_cast<float*>(inlink);

     for(int dir=0; dir<4; ++dir){

       float* slink = reinterpret_cast<float*>(sitelink[dir]);

       for(int i=0; i<V; ++i){

         for (int j = 0; j < gauge_site_size; j++) {

           link[(i * 4 + dir) * gauge_site_size + j] = slink[i * gauge_site_size + j];

         }

       }

     }

   }


   gParam.create = QUDA_REFERENCE_FIELD_CREATE;

   gParam.gauge  = fatlink;

   cpuFatLink  = new cpuGaugeField(gParam);


   gParam.create = QUDA_ZERO_FIELD_CREATE;

   cpuULink  = new cpuGaugeField(gParam);


   gParam.create = QUDA_ZERO_FIELD_CREATE;

   cudaResult  = new cpuGaugeField(gParam);


   gParam.pad         = 0;

   gParam.create      = QUDA_NULL_FIELD_CREATE;

   gParam.reconstruct = QUDA_RECONSTRUCT_NO;

   gParam.setPrecision(prec, true);

   cudaFatLink = new cudaGaugeField(gParam);

   cudaULink   = new cudaGaugeField(gParam);


   { // create fat links

     double act_path_coeff[6];

     act_path_coeff[0] = 0.625000;

     act_path_coeff[1] = -0.058479;

     act_path_coeff[2] = -0.087719;

     act_path_coeff[3] = 0.030778;

     act_path_coeff[4] = -0.007200;

     act_path_coeff[5] = -0.123113;


     computeKSLinkQuda(fatlink, NULL, NULL, inlink, act_path_coeff, &qudaGaugeParam);


     cudaFatLink->loadCPUField(*cpuFatLink);

   }


   setUnitarizeLinksConstants(unitarize_eps,

                              max_allowed_error,

                              reunit_allow_svd,

                              reunit_svd_only,

                              svd_rel_error,

                              svd_abs_error);


   int *num_failures_h = static_cast<int *>(mapped_malloc(sizeof(int)));

   int *num_failures_d = static_cast<int *>(get_mapped_device_pointer(num_failures_h));

   *num_failures_h = 0;


   struct timeval t0, t1;


   gettimeofday(&t0,NULL);

   unitarizeLinks(*cudaULink, *cudaFatLink, num_failures_d);

   gettimeofday(&t1,NULL);


   if (verify_results) {

     test_rc = RUN_ALL_TESTS();

     if (test_rc != 0) warningQuda("Tests failed");

   }


   delete cudaResult;

   delete cpuULink;

   delete cpuFatLink;

   delete cudaFatLink;

   delete cudaULink;

   for (int dir = 0; dir < 4; ++dir) host_free(sitelink[dir]);


   host_free(fatlink);


   int num_failures = *num_failures_h;

   host_free(num_failures_h);


   host_free(inlink);

 #ifdef MULTI_GPU

   exchange_llfat_cleanup();

 #endif


   printfQuda("Unitarization time: %g ms\n", TDIFF(t0,t1)*1000);

   return num_failures;

 }


 static void display_test_info()

 {

   printfQuda("running the following test:\n");


   printfQuda("link_precision      link_reconstruct           space_dimension        T_dimension    algorithm           max allowed error  deviation tolerance\n");

   printfQuda("%8s              %s                         %d/%d/%d/                 %d            %s         %g        "

              "     %g\n",

              get_prec_str(prec), get_recon_str(link_recon), xdim, ydim, zdim, tdim,

              get_unitarization_str(reunit_svd_only), max_allowed_error, unittol);


 #ifdef MULTI_GPU

   printfQuda("Grid partition info:     X  Y  Z  T\n");

   printfQuda("                         %d  %d  %d  %d\n",

       dimPartitioned(0),

       dimPartitioned(1),

       dimPartitioned(2),

       dimPartitioned(3));

 #endif

 }


 int main(int argc, char **argv)

 {

   // initalize google test, includes command line options

   ::testing::InitGoogleTest(&argc, argv);

   int test_rc;


   //default to 18 reconstruct, 8^3 x 8

   link_recon = QUDA_RECONSTRUCT_NO;

   xdim=ydim=zdim=tdim=8;


   auto app = make_app();

   try {

     app->parse(argc, argv);

   } catch (const CLI::ParseError &e) {

     return app->exit(e);

   }


   initComms(argc, argv, gridsize_from_cmdline);

   initQuda(device_ordinal);


   // Ensure gtest prints only from rank 0

   ::testing::TestEventListeners &listeners = ::testing::UnitTest::GetInstance()->listeners();

   if (comm_rank() != 0) { delete listeners.Release(listeners.default_result_printer()); }


   display_test_info();

   int num_failures = unitarize_link_test(test_rc);

   int num_procs = 1;

 #ifdef MULTI_GPU

   comm_allreduce_int(&num_failures);

   num_procs = comm_size();

 #endif


   printfQuda("Number of failures = %d\n", num_failures);

   if(num_failures > 0){

     printfQuda("Failure rate = %lf\n", num_failures/(4.0*V*num_procs));

     printfQuda("You may want to increase the error tolerance or vary the unitarization parameters\n");

   }else{

     printfQuda("Unitarization successfull!\n");

   }


   endQuda();

   finalizeComms();


   return test_rc;

 }


display_test_info
void display_test_info()
Definition: blas_interface_test.cpp:35

quda::LatticeField::Volume
size_t Volume() const
Definition: lattice_field.h:515

quda::TimeProfile
Definition: timer.h:174

quda::cpuGaugeField
Definition: gauge_field.h:626

quda::cpuGaugeField::Gauge_p
void * Gauge_p()
Definition: gauge_field.h:688

quda::cudaGaugeField
Definition: gauge_field.h:449

quda::cudaGaugeField::loadCPUField
void loadCPUField(const cpuGaugeField &cpu)
Download into this field from a CPU field.
Definition: cuda_gauge_field.cpp:635

quda::cudaGaugeField::saveCPUField
void saveCPUField(cpuGaugeField &cpu) const
Upload from this field into a CPU field.
Definition: cuda_gauge_field.cpp:646

testing::TestEventListeners
Definition: gtest.h:1166

testing::TestEventListeners::Release
TestEventListener * Release(TestEventListener *listener)

testing::TestEventListeners::default_result_printer
TestEventListener * default_result_printer() const
Definition: gtest.h:1186

testing::UnitTest::listeners
TestEventListeners & listeners()

testing::UnitTest::GetInstance
static UnitTest * GetInstance()

comm_quda.h

comm_rank
int comm_rank(void)
Definition: communicator_stack.cpp:87

comm_size
int comm_size(void)
Definition: communicator_stack.cpp:91

comm_allreduce_int
void comm_allreduce_int(int *data)
Definition: communicator_stack.cpp:184

make_app
std::shared_ptr< QUDAApp > make_app(std::string app_description, std::string app_name)
Definition: command_line_params.cpp:407

link_recon
QudaReconstructType link_recon
Definition: command_line_params.cpp:22

device_ordinal
int device_ordinal
Definition: command_line_params.cpp:9

ydim
int & ydim
Definition: command_line_params.cpp:36

verify_results
bool verify_results
Definition: command_line_params.cpp:68

zdim
int & zdim
Definition: command_line_params.cpp:37

prec
QudaPrecision prec
Definition: command_line_params.cpp:26

tdim
int & tdim
Definition: command_line_params.cpp:38

xdim
int & xdim
Definition: command_line_params.cpp:35

gridsize_from_cmdline
std::array< int, 4 > gridsize_from_cmdline
Definition: command_line_params.cpp:13

command_line_params.h

V
int V
Definition: host_utils.cpp:37

setDims
void setDims(int *)
Definition: host_utils.cpp:315

dslash_quda.h

QudaGaugeFieldOrder
enum QudaGaugeFieldOrder_s QudaGaugeFieldOrder

QUDA_RECONSTRUCT_NO
@ QUDA_RECONSTRUCT_NO
Definition: enum_quda.h:70

QUDA_PERIODIC_T
@ QUDA_PERIODIC_T
Definition: enum_quda.h:57

QUDA_GHOST_EXCHANGE_NO
@ QUDA_GHOST_EXCHANGE_NO
Definition: enum_quda.h:508

QUDA_GAUGE_FIXED_NO
@ QUDA_GAUGE_FIXED_NO
Definition: enum_quda.h:80

QUDA_DOUBLE_PRECISION
@ QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:65

QUDA_SINGLE_PRECISION
@ QUDA_SINGLE_PRECISION
Definition: enum_quda.h:64

QUDA_MILC_GAUGE_ORDER
@ QUDA_MILC_GAUGE_ORDER
Definition: enum_quda.h:47

QUDA_ZERO_FIELD_CREATE
@ QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:361

QUDA_REFERENCE_FIELD_CREATE
@ QUDA_REFERENCE_FIELD_CREATE
Definition: enum_quda.h:363

QUDA_NULL_FIELD_CREATE
@ QUDA_NULL_FIELD_CREATE
Definition: enum_quda.h:360

QUDA_GENERAL_LINKS
@ QUDA_GENERAL_LINKS
Definition: enum_quda.h:25

QUDA_WILSON_LINKS
@ QUDA_WILSON_LINKS
Definition: enum_quda.h:30

exchange_llfat_cleanup
void exchange_llfat_cleanup(void)
Definition: face_gauge.cpp:1003

gauge_site_size
#define gauge_site_size
Definition: face_gauge.cpp:34

gauge_field.h

gtest.h

ASSERT_EQ
#define ASSERT_EQ(val1, val2)
Definition: gtest.h:2047

RUN_ALL_TESTS
int RUN_ALL_TESTS() GTEST_MUST_USE_RESULT_
Definition: gtest.h:2468

gauge_order
QudaGaugeFieldOrder gauge_order
Definition: hisq_paths_force_test.cpp:34

gParam
GaugeFieldParam gParam
Definition: hisq_paths_force_test.cpp:58

compare_floats
int compare_floats(void *a, void *b, int len, double epsilon, QudaPrecision precision)
Definition: host_utils.cpp:889

dimPartitioned
int dimPartitioned(int dim)
Definition: host_utils.cpp:376

initComms
void initComms(int argc, char **argv, std::array< int, 4 > &commDims)
Definition: host_utils.cpp:255

finalizeComms
void finalizeComms()
Definition: host_utils.cpp:292

createSiteLinkCPU
void createSiteLinkCPU(void **link, QudaPrecision precision, int phase)
Definition: host_utils.cpp:1263

cpu_prec
QudaPrecision & cpu_prec
Definition: host_utils.cpp:57

host_utils.h

ks_improved_force.h

llfat_quda.h

safe_malloc
#define safe_malloc(size)
Definition: malloc_quda.h:106

pinned_malloc
#define pinned_malloc(size)
Definition: malloc_quda.h:107

get_mapped_device_pointer
#define get_mapped_device_pointer(ptr)
Definition: malloc_quda.h:116

host_free
#define host_free(ptr)
Definition: malloc_quda.h:115

mapped_malloc
#define mapped_malloc(size)
Definition: malloc_quda.h:108

get_prec_str
const char * get_prec_str(QudaPrecision prec)
Definition: misc.cpp:26

get_unitarization_str
const char * get_unitarization_str(bool svd_only)
Definition: misc.cpp:41

get_recon_str
const char * get_recon_str(QudaReconstructType recon)
Definition: misc.cpp:68

misc.h

quda
Definition: blas_lapack.h:24

quda::setUnitarizeLinksConstants
void setUnitarizeLinksConstants(double unitarize_eps, double max_error, bool allow_svd, bool svd_only, double svd_rel_error, double svd_abs_error)

quda::unitarizeLinksCPU
void unitarizeLinksCPU(GaugeField &outfield, const GaugeField &infield)

quda::unitarizeLinks
void unitarizeLinks(GaugeField &outfield, const GaugeField &infield, int *fails)

testing::InitGoogleTest
GTEST_API_ void InitGoogleTest(int *argc, char **argv)

quda.h
Main header file for the QUDA library.

newQudaGaugeParam
QudaGaugeParam newQudaGaugeParam(void)

initQuda
void initQuda(int device)
Definition: interface_quda.cpp:536

computeKSLinkQuda
void computeKSLinkQuda(void *fatlink, void *longlink, void *ulink, void *inlink, double *path_coeff, QudaGaugeParam *param)
Definition: interface_quda.cpp:4071

endQuda
void endQuda(void)
Definition: interface_quda.cpp:1474

QudaGaugeParam_s
Definition: quda.h:31

QudaGaugeParam_s::llfat_ga_pad
int llfat_ga_pad
Definition: quda.h:70

QudaGaugeParam_s::anisotropy
double anisotropy
Definition: quda.h:37

QudaGaugeParam_s::reconstruct
QudaReconstructType reconstruct
Definition: quda.h:49

QudaGaugeParam_s::ga_pad
int ga_pad
Definition: quda.h:65

QudaGaugeParam_s::type
QudaLinkType type
Definition: quda.h:41

QudaGaugeParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:51

QudaGaugeParam_s::reconstruct_sloppy
QudaReconstructType reconstruct_sloppy
Definition: quda.h:52

QudaGaugeParam_s::gauge_fix
QudaGaugeFixed gauge_fix
Definition: quda.h:63

QudaGaugeParam_s::staple_pad
int staple_pad
Definition: quda.h:69

QudaGaugeParam_s::gauge_order
QudaGaugeFieldOrder gauge_order
Definition: quda.h:42

QudaGaugeParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:48

QudaGaugeParam_s::X
int X[4]
Definition: quda.h:35

QudaGaugeParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:46

QudaGaugeParam_s::site_ga_pad
int site_ga_pad
Definition: quda.h:67

QudaGaugeParam_s::t_boundary
QudaTboundary t_boundary
Definition: quda.h:44

quda::GaugeFieldParam
Definition: gauge_field.h:44

quda::GaugeFieldParam::reconstruct
QudaReconstructType reconstruct
Definition: gauge_field.h:50

quda::GaugeFieldParam::order
QudaGaugeFieldOrder order
Definition: gauge_field.h:51

quda::GaugeFieldParam::setPrecision
void setPrecision(QudaPrecision precision, bool force_native=false)
Helper function for setting the precision and corresponding field order for QUDA internal fields.
Definition: gauge_field.h:173

quda::GaugeFieldParam::gauge
void * gauge
Definition: gauge_field.h:58

quda::GaugeFieldParam::link_type
QudaLinkType link_type
Definition: gauge_field.h:53

quda::GaugeFieldParam::create
QudaFieldCreate create
Definition: gauge_field.h:60

quda::LatticeFieldParam::pad
int pad
Definition: lattice_field.h:70

quda::LatticeFieldParam::ghostExchange
QudaGhostExchange ghostExchange
Definition: lattice_field.h:77

unitarization_links.h

main
int main(int argc, char **argv)
Definition: unitarize_link_test.cpp:222

TEST
TEST(unitarization, verify)
Definition: unitarize_link_test.cpp:42

cudaFatLink
cudaGaugeField * cudaFatLink
Definition: unitarize_link_test.cpp:38

cpuFatLink
cpuGaugeField * cpuFatLink
Definition: unitarize_link_test.cpp:37

TDIFF
#define TDIFF(a, b)
Definition: unitarize_link_test.cpp:24

unittol
const double unittol
Definition: unitarize_link_test.cpp:40

cudaResult
cpuGaugeField * cudaResult
Definition: unitarize_link_test.cpp:37

cpuULink
cpuGaugeField * cpuULink
Definition: unitarize_link_test.cpp:37

cudaULink
cudaGaugeField * cudaULink
Definition: unitarize_link_test.cpp:38

util_quda.h

printfQuda
#define printfQuda(...)
Definition: util_quda.h:114

warningQuda
#define warningQuda(...)
Definition: util_quda.h:132

errorQuda
#define errorQuda(...)
Definition: util_quda.h:120