v0.9.0/doc/unitarize__link__test_8cpp_source.html

 #include <stdio.h>
 #include <stdlib.h>
 #include <string.h>
 #include <sys/time.h>

 #include <cuda.h>
 #include <cuda_runtime.h>

 #include "quda.h"
 #include "gauge_field.h"
 #include "test_util.h"
 #include "llfat_reference.h"
 #include "misc.h"
 #include "util_quda.h"
 #include "llfat_quda.h"
 #include <unitarization_links.h>
 #include "dslash_quda.h"
 #include "ks_improved_force.h"

 #ifdef MULTI_GPU
 #include "comm_quda.h"
 #endif

 // google test frame work
 #include <gtest.h>

 #define TDIFF(a,b) (b.tv_sec - a.tv_sec + 0.000001*(b.tv_usec - a.tv_usec))

 using namespace quda;


 extern void usage(char** argv);

 extern int device;

 static double unitarize_eps  = 1e-6;
 static bool reunit_allow_svd = true;
 static bool reunit_svd_only  = false;
 static double svd_rel_error  = 1e-4;
 static double svd_abs_error  = 1e-4;
 static double max_allowed_error = 1e-11;

 extern int xdim, ydim, zdim, tdim;
 extern int gridsize_from_cmdline[];

 extern bool verify_results;

 extern QudaReconstructType link_recon;
 extern QudaPrecision prec;
 static QudaPrecision cpu_prec = QUDA_DOUBLE_PRECISION;
 static QudaGaugeFieldOrder gauge_order = QUDA_MILC_GAUGE_ORDER;

 cpuGaugeField *cpuFatLink, *cpuULink, *cudaResult;
 cudaGaugeField *cudaFatLink, *cudaULink;

 const double tol = (prec == QUDA_DOUBLE_PRECISION) ? 1e-10 : 1e-6;

 TEST(unitarization, verify) {
   unitarizeLinksCPU(*cpuULink, *cpuFatLink);
   cudaULink->saveCPUField(*cudaResult);

   int res = compare_floats(cudaResult->Gauge_p(), cpuULink->Gauge_p(),
          4*cudaResult->Volume()*gaugeSiteSize, tol, cpu_prec);

 #ifdef MULTI_GPU
   comm_allreduce_int(&res);
   res /= comm_size();
 #endif

   ASSERT_EQ(res,1) << "CPU and CUDA implementations do not agree";
 }

 static int unitarize_link_test(int &test_rc)
 {
   QudaGaugeParam qudaGaugeParam = newQudaGaugeParam();

   initQuda(device);

   qudaGaugeParam.anisotropy = 1.0;

   qudaGaugeParam.X[0] = xdim;
   qudaGaugeParam.X[1] = ydim;
   qudaGaugeParam.X[2] = zdim;
   qudaGaugeParam.X[3] = tdim;

   setDims(qudaGaugeParam.X);

   qudaGaugeParam.type = QUDA_WILSON_LINKS;

   qudaGaugeParam.t_boundary      = QUDA_PERIODIC_T;
   qudaGaugeParam.anisotropy      = 1.0;
   qudaGaugeParam.gauge_fix       = QUDA_GAUGE_FIXED_NO;
   qudaGaugeParam.ga_pad          = 0;
   qudaGaugeParam.gaugeGiB        = 0;
   qudaGaugeParam.cpu_prec = cpu_prec;
   qudaGaugeParam.cuda_prec = prec;
   qudaGaugeParam.cuda_prec_sloppy   = prec;

   if (gauge_order != QUDA_MILC_GAUGE_ORDER)
     errorQuda("Unsupported gauge order %d", gauge_order);

   qudaGaugeParam.gauge_order = gauge_order;
   qudaGaugeParam.type=QUDA_WILSON_LINKS;
   qudaGaugeParam.reconstruct = link_recon;
   qudaGaugeParam.reconstruct_sloppy = qudaGaugeParam.reconstruct;

   qudaGaugeParam.llfat_ga_pad = qudaGaugeParam.site_ga_pad = qudaGaugeParam.ga_pad = qudaGaugeParam.staple_pad = 0;

   GaugeFieldParam gParam(0, qudaGaugeParam);
   gParam.pad = 0;
   gParam.link_type   = QUDA_GENERAL_LINKS;
   gParam.ghostExchange = QUDA_GHOST_EXCHANGE_NO;
   gParam.order = gauge_order;

   TimeProfile profile("dummy");

   void* fatlink = (void*)malloc(4*V*gaugeSiteSize*cpu_prec);
   if(fatlink == NULL){
     errorQuda("ERROR: allocating fatlink failed\n");
   }

   void* sitelink[4];
   for(int i=0;i < 4;i++){
     cudaMallocHost((void**)&sitelink[i], V*gaugeSiteSize*cpu_prec);
     if(sitelink[i] == NULL){
       errorQuda("ERROR; allocate sitelink[%d] failed\n", i);
     }
   }

   createSiteLinkCPU(sitelink, qudaGaugeParam.cpu_prec, 1);
   void* inlink =  (void*)malloc(4*V*gaugeSiteSize*cpu_prec);

   if (cpu_prec == QUDA_DOUBLE_PRECISION){
     double* link = reinterpret_cast<double*>(inlink);
     for(int dir=0; dir<4; ++dir){
       double* slink = reinterpret_cast<double*>(sitelink[dir]);
       for(int i=0; i<V; ++i){
         for(int j=0; j<gaugeSiteSize; j++){
           link[(i*4 + dir)*gaugeSiteSize + j] = slink[i*gaugeSiteSize + j];
         }
       }
     }
   } else if(cpu_prec == QUDA_SINGLE_PRECISION){
     float* link = reinterpret_cast<float*>(inlink);
     for(int dir=0; dir<4; ++dir){
       float* slink = reinterpret_cast<float*>(sitelink[dir]);
       for(int i=0; i<V; ++i){
         for(int j=0; j<gaugeSiteSize; j++){
           link[(i*4 + dir)*gaugeSiteSize + j] = slink[i*gaugeSiteSize + j];
         }
       }
     }
   }

   gParam.create = QUDA_REFERENCE_FIELD_CREATE;
   gParam.gauge  = fatlink;
   cpuFatLink  = new cpuGaugeField(gParam);

   gParam.create = QUDA_ZERO_FIELD_CREATE;
   cpuULink  = new cpuGaugeField(gParam);

   gParam.create = QUDA_ZERO_FIELD_CREATE;
   cudaResult  = new cpuGaugeField(gParam);

   gParam.pad         = 0;
   gParam.create      = QUDA_NULL_FIELD_CREATE;
   gParam.reconstruct = QUDA_RECONSTRUCT_NO;
   gParam.setPrecision(prec);
   cudaFatLink = new cudaGaugeField(gParam);
   cudaULink   = new cudaGaugeField(gParam);

   { // create fat links
     double act_path_coeff[6];
     act_path_coeff[0] = 0.625000;
     act_path_coeff[1] = -0.058479;
     act_path_coeff[2] = -0.087719;
     act_path_coeff[3] = 0.030778;
     act_path_coeff[4] = -0.007200;
     act_path_coeff[5] = -0.123113;

     computeKSLinkQuda(fatlink, NULL, NULL, inlink, act_path_coeff, &qudaGaugeParam);

     cudaFatLink->loadCPUField(*cpuFatLink);
   }

   setUnitarizeLinksConstants(unitarize_eps,
            max_allowed_error,
            reunit_allow_svd,
            reunit_svd_only,
            svd_rel_error,
            svd_abs_error);

   int* num_failures_dev;
   if(cudaMalloc(&num_failures_dev, sizeof(int)) != cudaSuccess){
     errorQuda("cudaMalloc failed for num_failures_dev\n");
   }
   cudaMemset(num_failures_dev, 0, sizeof(int));

   struct timeval t0, t1;

   gettimeofday(&t0,NULL);
   unitarizeLinks(*cudaULink, *cudaFatLink, num_failures_dev);
   cudaDeviceSynchronize();
   gettimeofday(&t1,NULL);

   int num_failures=0;
   cudaMemcpy(&num_failures, num_failures_dev, sizeof(int), cudaMemcpyDeviceToHost);

   if (verify_results) {
     test_rc = RUN_ALL_TESTS();
     if (test_rc != 0) warningQuda("Tests failed");
   }

   delete cudaResult;
   delete cpuULink;
   delete cpuFatLink;
   delete cudaFatLink;
   delete cudaULink;
   for(int dir=0; dir<4; ++dir) cudaFreeHost(sitelink[dir]);

   free(fatlink);

   cudaFree(num_failures_dev);

   free(inlink);
 #ifdef MULTI_GPU
   exchange_llfat_cleanup();
 #endif
   endQuda();

   printfQuda("Unitarization time: %g ms\n", TDIFF(t0,t1)*1000);
   return num_failures;
 }

   static void
 display_test_info()
 {
   printfQuda("running the following test:\n");

   printfQuda("link_precision      link_reconstruct           space_dimension        T_dimension    algorithm           max allowed error  deviation tolerance\n");
   printfQuda("%8s              %s                         %d/%d/%d/                 %d            %s         %g             %g\n",
        get_prec_str(prec),
        get_recon_str(link_recon),
        xdim, ydim, zdim, tdim,
        get_unitarization_str(reunit_svd_only),
        max_allowed_error,
        tol);

 #ifdef MULTI_GPU
   printfQuda("Grid partition info:     X  Y  Z  T\n");
   printfQuda("                         %d  %d  %d  %d\n",
       dimPartitioned(0),
       dimPartitioned(1),
       dimPartitioned(2),
       dimPartitioned(3));
 #endif

   return ;

 }


 int main(int argc, char **argv)
 {
   // initalize google test, includes command line options
   ::testing::InitGoogleTest(&argc, argv);
   int test_rc;

   //default to 18 reconstruct, 8^3 x 8
   link_recon = QUDA_RECONSTRUCT_NO;
   xdim=ydim=zdim=tdim=8;

   int i;
   for (i=1; i<argc; i++){
     if(process_command_line_option(argc, argv, &i) == 0){
       continue;
     }

     fprintf(stderr, "ERROR: Invalid option:%s\n", argv[i]);
     usage(argv);
   }

   initComms(argc, argv, gridsize_from_cmdline);

   display_test_info();
   int num_failures = unitarize_link_test(test_rc);
   int num_procs = 1;
 #ifdef MULTI_GPU
   comm_allreduce_int(&num_failures);
   num_procs = comm_size();
 #endif

   printfQuda("Number of failures = %d\n", num_failures);
   if(num_failures > 0){
     printfQuda("Failure rate = %lf\n", num_failures/(4.0*V*num_procs));
     printfQuda("You may want to increase the error tolerance or vary the unitarization parameters\n");
   }else{
     printfQuda("Unitarization successfull!\n");
   }
   finalizeComms();

   return test_rc;
 }


qudaGaugeParam
static QudaGaugeParam qudaGaugeParam
Definition: gauge_force_test.cpp:16

dimPartitioned
int dimPartitioned(int dim)
Definition: test_util.cpp:1686

QudaGaugeParam_s::reconstruct_sloppy
QudaReconstructType reconstruct_sloppy
Definition: quda.h:46

QudaGaugeParam_s::anisotropy
double anisotropy
Definition: quda.h:31

QUDA_RECONSTRUCT_NO
Definition: enum_quda.h:66

quda::LatticeFieldParam::ghostExchange
QudaGhostExchange ghostExchange
Definition: lattice_field.h:60

endQuda
void endQuda(void)
Definition: interface_quda.cpp:1290

free
void free(void *)

main
int main(int argc, char **argv)
Definition: unitarize_link_test.cpp:263

llfat_reference.h

QudaPrecision
enum QudaPrecision_s QudaPrecision

QudaGaugeParam_s::ga_pad
int ga_pad
Definition: quda.h:53

misc.h

quda::cudaGaugeField::saveCPUField
void saveCPUField(cpuGaugeField &cpu) const
Upload from this field into a CPU field.
Definition: cuda_gauge_field.cu:702

QudaGaugeParam_s::gauge_fix
QudaGaugeFixed gauge_fix
Definition: quda.h:51

QudaGaugeParam_s::type
QudaLinkType type
Definition: quda.h:35

errorQuda
#define errorQuda(...)
Definition: util_quda.h:90

quda::setUnitarizeLinksConstants
void setUnitarizeLinksConstants(double unitarize_eps, double max_error, bool allow_svd, bool svd_only, double svd_rel_error, double svd_abs_error)

quda::GaugeFieldParam::setPrecision
void setPrecision(QudaPrecision precision)
Helper function for setting the precision and corresponding field order for QUDA internal fields...
Definition: gauge_field.h:113

QUDA_GAUGE_FIXED_NO
Definition: enum_quda.h:76

test_util.h

num_failures_dev
int * num_failures_dev
Definition: gauge_alg_test.cpp:33

cpuFatLink
cpuGaugeField * cpuFatLink
Definition: unitarize_link_test.cpp:53

QUDA_WILSON_LINKS
Definition: enum_quda.h:29

cudaULink
cudaGaugeField * cudaULink
Definition: unitarize_link_test.cpp:54

reunit_svd_only
static bool reunit_svd_only
Definition: unitarize_link_test.cpp:38

process_command_line_option
int process_command_line_option(int argc, char **argv, int *idx)
Definition: test_util.cpp:1795

cpu_prec
static QudaPrecision cpu_prec
Definition: unitarize_link_test.cpp:50

QUDA_NULL_FIELD_CREATE
Definition: enum_quda.h:330

finalizeComms
void finalizeComms()
Definition: test_util.cpp:107

link_recon
QudaReconstructType link_recon
Definition: test_util.cpp:1612

TDIFF
#define TDIFF(a, b)
Definition: unitarize_link_test.cpp:27

QudaGaugeParam_s::gauge_order
QudaGaugeFieldOrder gauge_order
Definition: quda.h:36

util_quda.h

computeKSLinkQuda
void computeKSLinkQuda(void *fatlink, void *longlink, void *ulink, void *inlink, double *path_coeff, QudaGaugeParam *param)
Definition: interface_quda.cpp:3562

prec
QudaPrecision prec
Definition: test_util.cpp:1615

svd_rel_error
static double svd_rel_error
Definition: unitarize_link_test.cpp:39

compare_floats
int compare_floats(void *a, void *b, int len, double epsilon, QudaPrecision precision)
Definition: test_util.cpp:437

get_prec_str
const char * get_prec_str(QudaPrecision prec)
Definition: misc.cpp:704

createSiteLinkCPU
void createSiteLinkCPU(void **link, QudaPrecision precision, int phase)
Definition: test_util.cpp:1229

num_failures
int num_failures
Definition: gauge_alg_test.cpp:32

quda
Definition: blas_cublas.h:6

setDims
void setDims(int *)
Definition: test_util.cpp:130

display_test_info
static void display_test_info()
Definition: unitarize_link_test.cpp:236

max_allowed_error
static double max_allowed_error
Definition: unitarize_link_test.cpp:41

QUDA_REFERENCE_FIELD_CREATE
Definition: enum_quda.h:333

comm_quda.h

QudaGaugeParam_s::llfat_ga_pad
int llfat_ga_pad
Definition: quda.h:58

return
else return(__swbuf(_c, _p))

TEST
TEST(unitarization, verify)
Definition: unitarize_link_test.cpp:58

quda::GaugeFieldParam
Definition: gauge_field.h:10

quda::cudaGaugeField::loadCPUField
void loadCPUField(const cpuGaugeField &cpu)
Download into this field from a CPU field.
Definition: cuda_gauge_field.cu:690

get_unitarization_str
const char * get_unitarization_str(bool svd_only)
Definition: misc.cpp:730

comm_size
int comm_size(void)
Definition: comm_mpi.cpp:126

initQuda
void initQuda(int device)
Definition: interface_quda.cpp:546

quda::unitarizeLinks
void unitarizeLinks(cudaGaugeField &outfield, const cudaGaugeField &infield, int *fails)
Definition: unitarize_links_quda.cu:495

malloc
void * malloc(size_t __size) __attribute__((__warn_unused_result__)) __attribute__((alloc_size(1)))

QudaGaugeParam_s::site_ga_pad
int site_ga_pad
Definition: quda.h:55

device
int device
Definition: CMakeCUDACompilerId.cpp1.ii:2238

QudaGaugeParam_s
Definition: quda.h:25

QUDA_MILC_GAUGE_ORDER
Definition: enum_quda.h:44

get_recon_str
const char * get_recon_str(QudaReconstructType recon)
Definition: misc.cpp:770

cpuULink
cpuGaugeField * cpuULink
Definition: unitarize_link_test.cpp:53

quda::cpuGaugeField
Definition: gauge_field.h:464

tol
const double tol
Definition: unitarize_link_test.cpp:56

QudaGaugeParam_s::staple_pad
int staple_pad
Definition: quda.h:57

V
int V
Definition: test_util.cpp:28

gaugeSiteSize
#define gaugeSiteSize
Definition: test_util.h:6

QUDA_PERIODIC_T
Definition: enum_quda.h:54

fused_exterior_ndeg_tm_dslash_cuda_gen.i
int i
start here
Definition: fused_exterior_ndeg_tm_dslash_cuda_gen.py:816

quda::GaugeFieldParam::order
QudaGaugeFieldOrder order
Definition: gauge_field.h:15

warningQuda
#define warningQuda(...)
Definition: util_quda.h:101

quda::cudaGaugeField
Definition: gauge_field.h:298

xdim
int xdim
Definition: test_util.cpp:1620

QudaGaugeParam_s::cuda_prec_sloppy
QudaPrecision cuda_prec_sloppy
Definition: quda.h:45

quda::cpuGaugeField::Gauge_p
void * Gauge_p()
Definition: gauge_field.h:526

QUDA_GHOST_EXCHANGE_NO
Definition: enum_quda.h:434

QudaGaugeFieldOrder
enum QudaGaugeFieldOrder_s QudaGaugeFieldOrder

unitarize_eps
static double unitarize_eps
Definition: unitarize_link_test.cpp:36

quda::LatticeField::Volume
int Volume() const
Definition: lattice_field.h:420

timeval
Definition: CMakeCUDACompilerId.cpp1.ii:4831

QudaGaugeParam_s::reconstruct
QudaReconstructType reconstruct
Definition: quda.h:43

QudaGaugeParam_s::cuda_prec
QudaPrecision cuda_prec
Definition: quda.h:42

QudaGaugeParam_s::X
int X[4]
Definition: quda.h:29

fprintf
int fprintf(FILE *, const char *,...) __attribute__((__format__(__printf__

exchange_llfat_cleanup
void exchange_llfat_cleanup(void)

unitarize_link_test
static int unitarize_link_test(int &test_rc)
Definition: unitarize_link_test.cpp:73

gauge_order
static QudaGaugeFieldOrder gauge_order
Definition: unitarize_link_test.cpp:51

verify_results
bool verify_results
Definition: test_util.cpp:1641

reunit_allow_svd
static bool reunit_allow_svd
Definition: unitarize_link_test.cpp:37

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:61

unitarization_links.h

quda::unitarizeLinksCPU
void unitarizeLinksCPU(cpuGaugeField &outfield, const cpuGaugeField &infield)

ydim
int ydim
Definition: test_util.cpp:1621

gridsize_from_cmdline
int gridsize_from_cmdline[]
Definition: test_util.cpp:50

QudaGaugeParam_s::gaugeGiB
double gaugeGiB
Definition: quda.h:60

gParam
GaugeFieldParam gParam
Definition: hisq_paths_force_test.cpp:64

fatlink
void * fatlink[4]
Definition: staggered_dslash_ctest.cpp:47

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:60

svd_abs_error
static double svd_abs_error
Definition: unitarize_link_test.cpp:40

QUDA_GENERAL_LINKS
Definition: enum_quda.h:24

QudaReconstructType
enum QudaReconstructType_s QudaReconstructType

quda.h
Main header file for the QUDA library.

quda::GaugeFieldParam::link_type
QudaLinkType link_type
Definition: gauge_field.h:17

dslash_quda.h

cudaFatLink
cudaGaugeField * cudaFatLink
Definition: unitarize_link_test.cpp:54

printfQuda
#define printfQuda(...)
Definition: util_quda.h:84

QudaGaugeParam_s::t_boundary
QudaTboundary t_boundary
Definition: quda.h:38

e
return e
Definition: CMakeCUDACompilerId.cpp1.ii:3026

comm_allreduce_int
void comm_allreduce_int(int *data)
Definition: comm_mpi.cpp:305

quda::GaugeFieldParam::gauge
void * gauge
Definition: gauge_field.h:23

usage
void usage(char **argv)
Definition: test_util.cpp:1693

quda::GaugeFieldParam::reconstruct
QudaReconstructType reconstruct
Definition: gauge_field.h:14

quda::TimeProfile
Definition: quda_internal.h:232

quda::GaugeFieldParam::create
QudaFieldCreate create
Definition: gauge_field.h:25

zdim
int zdim
Definition: test_util.cpp:1622

QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:331

tdim
int tdim
Definition: test_util.cpp:1623

llfat_quda.h

initComms
void initComms(int argc, char **argv, const int *commDims)
Definition: test_util.cpp:72

gauge_field.h

cudaResult
cpuGaugeField * cudaResult
Definition: unitarize_link_test.cpp:53

QudaGaugeParam_s::cpu_prec
QudaPrecision cpu_prec
Definition: quda.h:40

ks_improved_force.h

newQudaGaugeParam
QudaGaugeParam newQudaGaugeParam(void)

quda::LatticeFieldParam::pad
int pad
Definition: lattice_field.h:52