quda-ref/v1.1.0/blas__interface__test_8cpp_source.html

 #include <stdlib.h>

 #include <stdio.h>

 #include <time.h>

 #include <math.h>

 #include <string.h>

 #include <complex>

 #include <inttypes.h>


 #include <util_quda.h>

 #include <host_utils.h>

 #include <command_line_params.h>

 #include "blas_reference.h"

 #include "misc.h"


 // google test

 #include <gtest/gtest.h>


 // In a typical application, quda.h is the only QUDA header required.

 #include <quda.h>


 // For googletest, names must be non-empty, unique, and may only contain ASCII

 // alphanumeric characters or underscore.

 const char *data_type_str[] = {

   "realSingle",

   "realDouble",

   "complexSingle",

   "complexDouble",

 };


 namespace quda

 {

   extern void setTransferGPU(bool);

 }


 void display_test_info()

 {

   printfQuda("running the following test:\n");

   printfQuda("BLAS interface test\n");

   printfQuda("Grid partition info:     X  Y  Z  T\n");

   printfQuda("                         %d  %d  %d  %d\n", dimPartitioned(0), dimPartitioned(1), dimPartitioned(2),

              dimPartitioned(3));

 }


 double test(int data_type)

 {

   QudaBLASDataType test_data_type = QUDA_BLAS_DATATYPE_INVALID;

   switch (data_type) {

   case 0: test_data_type = QUDA_BLAS_DATATYPE_S; break;

   case 1: test_data_type = QUDA_BLAS_DATATYPE_D; break;

   case 2: test_data_type = QUDA_BLAS_DATATYPE_C; break;

   case 3: test_data_type = QUDA_BLAS_DATATYPE_Z; break;

   default: errorQuda("Undefined QUDA BLAS data type %d\n", data_type);

   }


   QudaBLASParam blas_param = newQudaBLASParam();

   blas_param.trans_a = blas_trans_a;

   blas_param.trans_b = blas_trans_b;

   blas_param.m = blas_mnk[0];

   blas_param.n = blas_mnk[1];

   blas_param.k = blas_mnk[2];

   blas_param.lda = blas_leading_dims[0];

   blas_param.ldb = blas_leading_dims[1];

   blas_param.ldc = blas_leading_dims[2];

   blas_param.a_offset = blas_offsets[0];

   blas_param.b_offset = blas_offsets[1];

   blas_param.c_offset = blas_offsets[2];

   blas_param.a_stride = blas_strides[0];

   blas_param.b_stride = blas_strides[1];

   blas_param.c_stride = blas_strides[2];

   blas_param.alpha = (__complex__ double)blas_alpha_re_im[0];

   blas_param.beta = (__complex__ double)blas_beta_re_im[0];

   blas_param.data_order = blas_data_order;

   blas_param.data_type = test_data_type;

   blas_param.batch_count = blas_batch;


   // Sanity checks on parameters

   //-------------------------------------------------------------------------

   // If the user passes non positive M,N, or K, we error out

   int min_dim = std::min(blas_param.m, std::min(blas_param.n, blas_param.k));

   if (min_dim <= 0) {

     errorQuda("BLAS dims must be positive: m=%d, n=%d, k=%d", blas_param.m, blas_param.n, blas_param.k);

   }


   // If the user passes a negative stride, we error out as this has no meaning.

   int min_stride = std::min(std::min(blas_param.a_stride, blas_param.b_stride), blas_param.c_stride);

   if (min_stride < 0) {

     errorQuda("BLAS strides must be positive or zero: a_stride=%d, b_stride=%d, c_stride=%d", blas_param.a_stride,

               blas_param.b_stride, blas_param.c_stride);

   }


   // If the user passes a negative offset, we error out as this has no meaning.

   int min_offset = std::min(std::min(blas_param.a_offset, blas_param.b_offset), blas_param.c_offset);

   if (min_offset < 0) {

     errorQuda("BLAS offsets must be positive or zero: a_offset=%d, b_offset=%d, c_offset=%d", blas_param.a_offset,

               blas_param.b_offset, blas_param.c_offset);

   }


   // Leading dims are dependendent on the matrix op type.

   if (blas_param.data_order == QUDA_BLAS_DATAORDER_COL) {

     if (blas_param.trans_a == QUDA_BLAS_OP_N) {

       if (blas_param.lda < std::max(1, blas_param.m))

         errorQuda("lda=%d must be >= max(1,m=%d)", blas_param.lda, blas_param.m);

     } else {

       if (blas_param.lda < std::max(1, blas_param.k))

         errorQuda("lda=%d must be >= max(1,k=%d)", blas_param.lda, blas_param.k);

     }


     if (blas_param.trans_b == QUDA_BLAS_OP_N) {

       if (blas_param.ldb < std::max(1, blas_param.k))

         errorQuda("ldb=%d must be >= max(1,k=%d)", blas_param.ldb, blas_param.k);

     } else {

       if (blas_param.ldb < std::max(1, blas_param.n))

         errorQuda("ldb=%d must be >= max(1,n=%d)", blas_param.ldb, blas_param.n);

     }

     if (blas_param.ldc < std::max(1, blas_param.m))

       errorQuda("ldc=%d must be >= max(1,m=%d)", blas_param.ldc, blas_param.m);

   } else {

     if (blas_param.trans_a == QUDA_BLAS_OP_N) {

       if (blas_param.lda < std::max(1, blas_param.k))

         errorQuda("lda=%d must be >= max(1,k=%d)", blas_param.lda, blas_param.k);

     } else {

       if (blas_param.lda < std::max(1, blas_param.m))

         errorQuda("lda=%d must be >= max(1,m=%d)", blas_param.lda, blas_param.m);

     }

     if (blas_param.trans_b == QUDA_BLAS_OP_N) {

       if (blas_param.ldb < std::max(1, blas_param.n))

         errorQuda("ldb=%d must be >= max(1,n=%d)", blas_param.ldb, blas_param.n);

     } else {

       if (blas_param.ldb < std::max(1, blas_param.k))

         errorQuda("ldb=%d must be >= max(1,k=%d)", blas_param.ldb, blas_param.k);

     }

     if (blas_param.ldc < std::max(1, blas_param.n))

       errorQuda("ldc=%d must be >= max(1,n=%d)", blas_param.ldc, blas_param.n);

   }


   // If the batch value is non-positve, we error out

   if (blas_param.batch_count <= 0) { errorQuda("Batches must be positive: batches=%d", blas_param.batch_count); }

   //-------------------------------------------------------------------------


   // Reference data is always in complex double

   size_t data_size = sizeof(double);

   int re_im = 2;

   data_size *= re_im;


   // If the user passes non-zero offsets, add one extra

   // matrix to the test data.

   int batches_extra = 0;

   if (blas_param.a_offset + blas_param.b_offset + blas_param.c_offset > 0) { batches_extra++; }

   int batches = blas_param.batch_count + batches_extra;

   uint64_t refA_size = 0, refB_size = 0, refC_size = 0;

   if (blas_param.data_order == QUDA_BLAS_DATAORDER_COL) {

     // leading dimension is in terms of consecutive data

     // elements in a column, multiplied by number of rows

     if (blas_param.trans_a == QUDA_BLAS_OP_N) {

       refA_size = blas_param.lda * blas_param.k; // A_mk

     } else {

       refA_size = blas_param.lda * blas_param.m; // A_km

     }


     if (blas_param.trans_b == QUDA_BLAS_OP_N) {

       refB_size = blas_param.ldb * blas_param.n; // B_kn

     } else {

       refB_size = blas_param.ldb * blas_param.k; // B_nk

     }

     refC_size = blas_param.ldc * blas_param.n; // C_mn

   } else {

     // leading dimension is in terms of consecutive data

     // elements in a row, multiplied by number of columns.

     if (blas_param.trans_a == QUDA_BLAS_OP_N) {

       refA_size = blas_param.lda * blas_param.m; // A_mk

     } else {

       refA_size = blas_param.lda * blas_param.k; // A_km

     }

     if (blas_param.trans_b == QUDA_BLAS_OP_N) {

       refB_size = blas_param.ldb * blas_param.k; // B_nk

     } else {

       refB_size = blas_param.ldb * blas_param.n; // B_kn

     }

     refC_size = blas_param.ldc * blas_param.m; // C_mn

   }


   void *refA = pinned_malloc(batches * refA_size * data_size);

   void *refB = pinned_malloc(batches * refB_size * data_size);

   void *refC = pinned_malloc(batches * refC_size * data_size);

   void *refCcopy = pinned_malloc(batches * refC_size * data_size);


   memset(refA, 0, batches * refA_size * data_size);

   memset(refB, 0, batches * refB_size * data_size);

   memset(refC, 0, batches * refC_size * data_size);

   memset(refCcopy, 0, batches * refC_size * data_size);


   // Populate the real part with rands

   for (uint64_t i = 0; i < 2 * refA_size * batches; i += 2) { ((double *)refA)[i] = rand() / (double)RAND_MAX; }

   for (uint64_t i = 0; i < 2 * refB_size * batches; i += 2) { ((double *)refB)[i] = rand() / (double)RAND_MAX; }

   for (uint64_t i = 0; i < 2 * refC_size * batches; i += 2) {

     ((double *)refC)[i] = rand() / (double)RAND_MAX;

     ((double *)refCcopy)[i] = ((double *)refC)[i];

   }


   // Populate the imaginary part with rands if needed

   if (test_data_type == QUDA_BLAS_DATATYPE_C || test_data_type == QUDA_BLAS_DATATYPE_Z) {

     for (uint64_t i = 1; i < 2 * refA_size * batches; i += 2) { ((double *)refA)[i] = rand() / (double)RAND_MAX; }

     for (uint64_t i = 1; i < 2 * refB_size * batches; i += 2) { ((double *)refB)[i] = rand() / (double)RAND_MAX; }

     for (uint64_t i = 1; i < 2 * refC_size * batches; i += 2) {

       ((double *)refC)[i] = rand() / (double)RAND_MAX;

       ((double *)refCcopy)[i] = ((double *)refC)[i];

     }

   }


   // Create new arrays appropriate for the requested problem, and copy over the data.

   void *arrayA = nullptr;

   void *arrayB = nullptr;

   void *arrayC = nullptr;

   void *arrayCcopy = nullptr;


   switch (test_data_type) {

   case QUDA_BLAS_DATATYPE_S:

     arrayA = pinned_malloc(batches * refA_size * sizeof(float));

     arrayB = pinned_malloc(batches * refB_size * sizeof(float));

     arrayC = pinned_malloc(batches * refC_size * sizeof(float));

     arrayCcopy = pinned_malloc(batches * refC_size * sizeof(float));

     // Populate

     for (uint64_t i = 0; i < 2 * refA_size * batches; i += 2) { ((float *)arrayA)[i / 2] = ((double *)refA)[i]; }

     for (uint64_t i = 0; i < 2 * refB_size * batches; i += 2) { ((float *)arrayB)[i / 2] = ((double *)refB)[i]; }

     for (uint64_t i = 0; i < 2 * refC_size * batches; i += 2) {

       ((float *)arrayC)[i / 2] = ((double *)refC)[i];

       ((float *)arrayCcopy)[i / 2] = ((double *)refC)[i];

     }

     break;

   case QUDA_BLAS_DATATYPE_D:

     arrayA = pinned_malloc(batches * refA_size * sizeof(double));

     arrayB = pinned_malloc(batches * refB_size * sizeof(double));

     arrayC = pinned_malloc(batches * refC_size * sizeof(double));

     arrayCcopy = pinned_malloc(batches * refC_size * sizeof(double));

     // Populate

     for (uint64_t i = 0; i < 2 * refA_size * batches; i += 2) { ((double *)arrayA)[i / 2] = ((double *)refA)[i]; }

     for (uint64_t i = 0; i < 2 * refB_size * batches; i += 2) { ((double *)arrayB)[i / 2] = ((double *)refB)[i]; }

     for (uint64_t i = 0; i < 2 * refC_size * batches; i += 2) {

       ((double *)arrayC)[i / 2] = ((double *)refC)[i];

       ((double *)arrayCcopy)[i / 2] = ((double *)refC)[i];

     }

     break;

   case QUDA_BLAS_DATATYPE_C:

     arrayA = pinned_malloc(batches * refA_size * 2 * sizeof(float));

     arrayB = pinned_malloc(batches * refB_size * 2 * sizeof(float));

     arrayC = pinned_malloc(batches * refC_size * 2 * sizeof(float));

     arrayCcopy = pinned_malloc(batches * refC_size * 2 * sizeof(float));

     // Populate

     for (uint64_t i = 0; i < 2 * refA_size * batches; i++) { ((float *)arrayA)[i] = ((double *)refA)[i]; }

     for (uint64_t i = 0; i < 2 * refB_size * batches; i++) { ((float *)arrayB)[i] = ((double *)refB)[i]; }

     for (uint64_t i = 0; i < 2 * refC_size * batches; i++) {

       ((float *)arrayC)[i] = ((double *)refC)[i];

       ((float *)arrayCcopy)[i] = ((double *)refC)[i];

     }

     break;

   case QUDA_BLAS_DATATYPE_Z:

     arrayA = pinned_malloc(batches * refA_size * 2 * sizeof(double));

     arrayB = pinned_malloc(batches * refB_size * 2 * sizeof(double));

     arrayC = pinned_malloc(batches * refC_size * 2 * sizeof(double));

     arrayCcopy = pinned_malloc(batches * refC_size * 2 * sizeof(double));

     // Populate

     for (uint64_t i = 0; i < 2 * refA_size * batches; i++) { ((double *)arrayA)[i] = ((double *)refA)[i]; }

     for (uint64_t i = 0; i < 2 * refB_size * batches; i++) { ((double *)arrayB)[i] = ((double *)refB)[i]; }

     for (uint64_t i = 0; i < 2 * refC_size * batches; i++) {

       ((double *)arrayC)[i] = ((double *)refC)[i];

       ((double *)arrayCcopy)[i] = ((double *)refC)[i];

     }

     break;

   default: errorQuda("Unrecognised data type %d\n", test_data_type);

   }


   // Perform device GEMM Blas operation

   blasGEMMQuda(arrayA, arrayB, arrayC, native_blas_lapack ? QUDA_BOOLEAN_TRUE : QUDA_BOOLEAN_FALSE, &blas_param);


   double deviation = 0.0;

   if (verify_results) {

     deviation = blasGEMMQudaVerify(arrayA, arrayB, arrayC, arrayCcopy, refA_size, refB_size, refC_size, &blas_param);

   }


   host_free(refA);

   host_free(refB);

   host_free(refC);

   host_free(refCcopy);


   host_free(arrayA);

   host_free(arrayB);

   host_free(arrayC);

   host_free(arrayCcopy);


   return deviation;

 }


 // The following tests gets each BLAS type and precision using google testing framework

 using ::testing::Bool;

 using ::testing::Combine;

 using ::testing::Range;

 using ::testing::TestWithParam;

 using ::testing::Values;


 class BLASTest : public ::testing::TestWithParam<int>

 {

 protected:

   int param;


 public:

   virtual ~BLASTest() {}

   virtual void SetUp() { param = GetParam(); }

 };


 // Sets up the Google test

 TEST_P(BLASTest, verify)

 {

   auto data_type = GetParam();

   auto deviation = test(data_type);

   decltype(deviation) tol;

   switch (data_type) {

   case 0:

   case 2: tol = 10 * std::numeric_limits<float>::epsilon(); break;

   case 1:

   case 3: tol = 10 * std::numeric_limits<double>::epsilon(); break;

   }

   EXPECT_LE(deviation, tol) << "CPU and CUDA implementations do not agree";

 }


 // Helper function to construct the test name

 std::string getBLASName(testing::TestParamInfo<int> param)

 {

   int data_type = param.param;

   std::string str(data_type_str[data_type]);

   return str;

 }


 // Instantiate all test cases

 INSTANTIATE_TEST_SUITE_P(QUDA, BLASTest, Range(0, 4), getBLASName);


 int main(int argc, char **argv)

 {

   // Start Google Test Suite

   //-----------------------------------------------------------------------------

   ::testing::InitGoogleTest(&argc, argv);


   // QUDA initialise

   //-----------------------------------------------------------------------------

   // command line options

   auto app = make_app();

   try {

     app->parse(argc, argv);

   } catch (const CLI::ParseError &e) {

     return app->exit(e);

   }


   // initialize QMP/MPI, QUDA comms grid and RNG (host_utils.cpp)

   initComms(argc, argv, gridsize_from_cmdline);


   // Ensure gtest prints only from rank 0

   ::testing::TestEventListeners &listeners = ::testing::UnitTest::GetInstance()->listeners();

   if (comm_rank() != 0) { delete listeners.Release(listeners.default_result_printer()); }


   // call srand() with a rank-dependent seed

   initRand();

   setQudaPrecisions();

   display_test_info();

   setVerbosity(verbosity);


   // initialize the QUDA library

   initQuda(device_ordinal);

   int X[4] = {xdim, ydim, zdim, tdim};

   setDims(X);

   //-----------------------------------------------------------------------------


   int result = 0;

   if (verify_results) {

     // Run full set of test if we're doing a verification run

     ::testing::TestEventListeners &listeners = ::testing::UnitTest::GetInstance()->listeners();

     if (comm_rank() != 0) { delete listeners.Release(listeners.default_result_printer()); }

     result = RUN_ALL_TESTS();

     if (result) warningQuda("Google tests for QUDA BLAS failed.");

   } else {

     // Perform the BLAS op specified by the command line

     switch (blas_data_type) {

     case QUDA_BLAS_DATATYPE_S: test(0); break;

     case QUDA_BLAS_DATATYPE_D: test(1); break;

     case QUDA_BLAS_DATATYPE_C: test(2); break;

     case QUDA_BLAS_DATATYPE_Z: test(3); break;

     default: errorQuda("Undefined QUDA BLAS data type %d\n", blas_data_type);

     }

   }


   //-----------------------------------------------------------------------------


   // finalize the QUDA library

   endQuda();


   // finalize the communications layer

   finalizeComms();


   return result;

 }

data_type_str
const char * data_type_str[]
Definition: blas_interface_test.cpp:23

test
double test(int data_type)
Definition: blas_interface_test.cpp:44

INSTANTIATE_TEST_SUITE_P
INSTANTIATE_TEST_SUITE_P(QUDA, BLASTest, Range(0, 4), getBLASName)

getBLASName
std::string getBLASName(testing::TestParamInfo< int > param)
Definition: blas_interface_test.cpp:326

main
int main(int argc, char **argv)
Definition: blas_interface_test.cpp:336

TEST_P
TEST_P(BLASTest, verify)
Definition: blas_interface_test.cpp:311

display_test_info
void display_test_info()
Definition: blas_interface_test.cpp:35

blasGEMMQudaVerify
double blasGEMMQudaVerify(void *arrayA, void *arrayB, void *arrayC, void *arrayCcopy, uint64_t refA_size, uint64_t refB_size, uint64_t refC_size, QudaBLASParam *blas_param)
Definition: blas_reference.cpp:212

blas_reference.h

BLASTest
Definition: blas_interface_test.cpp:301

BLASTest::~BLASTest
virtual ~BLASTest()
Definition: blas_interface_test.cpp:306

BLASTest::SetUp
virtual void SetUp()
Definition: blas_interface_test.cpp:307

BLASTest::param
int param
Definition: blas_interface_test.cpp:303

testing::TestEventListeners
Definition: gtest.h:1166

testing::TestEventListeners::Release
TestEventListener * Release(TestEventListener *listener)

testing::TestEventListeners::default_result_printer
TestEventListener * default_result_printer() const
Definition: gtest.h:1186

testing::TestWithParam
Definition: gtest.h:1879

testing::UnitTest::listeners
TestEventListeners & listeners()

testing::UnitTest::GetInstance
static UnitTest * GetInstance()

testing::WithParamInterface::GetParam
static const ParamType & GetParam()
Definition: gtest.h:1851

comm_rank
int comm_rank(void)
Definition: communicator_stack.cpp:87

make_app
std::shared_ptr< QUDAApp > make_app(std::string app_description, std::string app_name)
Definition: command_line_params.cpp:407

tol
double tol
Definition: command_line_params.cpp:86

device_ordinal
int device_ordinal
Definition: command_line_params.cpp:9

blas_batch
int blas_batch
Definition: command_line_params.cpp:274

verbosity
QudaVerbosity verbosity
Definition: command_line_params.cpp:33

ydim
int & ydim
Definition: command_line_params.cpp:36

blas_trans_b
QudaBLASOperation blas_trans_b
Definition: command_line_params.cpp:248

epsilon
double epsilon
Definition: command_line_params.cpp:74

verify_results
bool verify_results
Definition: command_line_params.cpp:68

blas_alpha_re_im
std::array< double, 2 > blas_alpha_re_im
Definition: command_line_params.cpp:272

blas_data_order
QudaBLASDataOrder blas_data_order
Definition: command_line_params.cpp:250

zdim
int & zdim
Definition: command_line_params.cpp:37

blas_leading_dims
std::array< int, 3 > blas_leading_dims
Definition: command_line_params.cpp:257

blas_strides
std::array< int, 3 > blas_strides
Definition: command_line_params.cpp:267

native_blas_lapack
bool native_blas_lapack
Definition: command_line_params.cpp:19

blas_beta_re_im
std::array< double, 2 > blas_beta_re_im
Definition: command_line_params.cpp:273

blas_offsets
std::array< int, 3 > blas_offsets
Definition: command_line_params.cpp:262

tdim
int & tdim
Definition: command_line_params.cpp:38

xdim
int & xdim
Definition: command_line_params.cpp:35

blas_mnk
std::array< int, 3 > blas_mnk
Definition: command_line_params.cpp:252

blas_trans_a
QudaBLASOperation blas_trans_a
Definition: command_line_params.cpp:247

gridsize_from_cmdline
std::array< int, 4 > gridsize_from_cmdline
Definition: command_line_params.cpp:13

blas_data_type
QudaBLASDataType blas_data_type
Definition: command_line_params.cpp:249

command_line_params.h

memset
void * memset(void *s, int c, size_t n)

setDims
void setDims(int *)
Definition: host_utils.cpp:315

QUDA_BLAS_DATATYPE_INVALID
@ QUDA_BLAS_DATATYPE_INVALID
Definition: enum_quda.h:481

QUDA_BLAS_DATATYPE_Z
@ QUDA_BLAS_DATATYPE_Z
Definition: enum_quda.h:480

QUDA_BLAS_DATATYPE_D
@ QUDA_BLAS_DATATYPE_D
Definition: enum_quda.h:478

QUDA_BLAS_DATATYPE_C
@ QUDA_BLAS_DATATYPE_C
Definition: enum_quda.h:479

QUDA_BLAS_DATATYPE_S
@ QUDA_BLAS_DATATYPE_S
Definition: enum_quda.h:477

QUDA_BOOLEAN_FALSE
@ QUDA_BOOLEAN_FALSE
Definition: enum_quda.h:460

QUDA_BOOLEAN_TRUE
@ QUDA_BOOLEAN_TRUE
Definition: enum_quda.h:461

QudaBLASDataType
enum QudaBLASDataType_s QudaBLASDataType

QUDA_BLAS_DATAORDER_COL
@ QUDA_BLAS_DATAORDER_COL
Definition: enum_quda.h:486

QUDA_BLAS_OP_N
@ QUDA_BLAS_OP_N
Definition: enum_quda.h:470

gtest.h

RUN_ALL_TESTS
int RUN_ALL_TESTS() GTEST_MUST_USE_RESULT_
Definition: gtest.h:2468

EXPECT_LE
#define EXPECT_LE(val1, val2)
Definition: gtest.h:2021

dimPartitioned
int dimPartitioned(int dim)
Definition: host_utils.cpp:376

initComms
void initComms(int argc, char **argv, std::array< int, 4 > &commDims)
Definition: host_utils.cpp:255

finalizeComms
void finalizeComms()
Definition: host_utils.cpp:292

setQudaPrecisions
void setQudaPrecisions()
Definition: host_utils.cpp:69

initRand
void initRand()
Definition: host_utils.cpp:302

host_utils.h

pinned_malloc
#define pinned_malloc(size)
Definition: malloc_quda.h:107

host_free
#define host_free(ptr)
Definition: malloc_quda.h:115

misc.h

quda
Definition: blas_lapack.h:24

quda::setTransferGPU
void setTransferGPU(bool)

testing::internal::string
::std::string string
Definition: gtest-port.h:891

testing::Range
internal::ParamGenerator< T > Range(T start, T end, IncrementT step)
Definition: gtest-param-test.h:228

testing::Combine
internal::CartesianProductHolder< Generator... > Combine(const Generator &... g)
Definition: gtest-param-test.h:410

testing::Values
internal::ValueArray< T... > Values(T... v)
Definition: gtest-param-test.h:335

testing::Bool
internal::ParamGenerator< bool > Bool()
Definition: gtest-param-test.h:359

testing::InitGoogleTest
GTEST_API_ void InitGoogleTest(int *argc, char **argv)

param
QudaGaugeParam param
Definition: pack_test.cpp:18

quda.h
Main header file for the QUDA library.

newQudaBLASParam
QudaBLASParam newQudaBLASParam(void)

blasGEMMQuda
void blasGEMMQuda(void *arrayA, void *arrayB, void *arrayC, QudaBoolean native, QudaBLASParam *param)
Strided Batched GEMM.
Definition: blas_interface.cpp:12

initQuda
void initQuda(int device)
Definition: interface_quda.cpp:536

endQuda
void endQuda(void)
Definition: interface_quda.cpp:1474

QudaBLASParam_s
Definition: quda.h:748

QudaBLASParam_s::c_offset
int c_offset
Definition: quda.h:761

QudaBLASParam_s::alpha
double_complex alpha
Definition: quda.h:766

QudaBLASParam_s::a_stride
int a_stride
Definition: quda.h:762

QudaBLASParam_s::b_stride
int b_stride
Definition: quda.h:763

QudaBLASParam_s::ldc
int ldc
Definition: quda.h:758

QudaBLASParam_s::data_order
QudaBLASDataOrder data_order
Definition: quda.h:772

QudaBLASParam_s::c_stride
int c_stride
Definition: quda.h:764

QudaBLASParam_s::b_offset
int b_offset
Definition: quda.h:760

QudaBLASParam_s::trans_a
QudaBLASOperation trans_a
Definition: quda.h:751

QudaBLASParam_s::beta
double_complex beta
Definition: quda.h:767

QudaBLASParam_s::ldb
int ldb
Definition: quda.h:757

QudaBLASParam_s::data_type
QudaBLASDataType data_type
Definition: quda.h:771

QudaBLASParam_s::a_offset
int a_offset
Definition: quda.h:759

QudaBLASParam_s::lda
int lda
Definition: quda.h:756

QudaBLASParam_s::batch_count
int batch_count
Definition: quda.h:769

QudaBLASParam_s::n
int n
Definition: quda.h:754

QudaBLASParam_s::m
int m
Definition: quda.h:753

QudaBLASParam_s::trans_b
QudaBLASOperation trans_b
Definition: quda.h:752

QudaBLASParam_s::k
int k
Definition: quda.h:755

testing::TestParamInfo
Definition: gtest-param-util.h:56

util_quda.h

printfQuda
#define printfQuda(...)
Definition: util_quda.h:114

warningQuda
#define warningQuda(...)
Definition: util_quda.h:132

setVerbosity
void setVerbosity(QudaVerbosity verbosity)
Definition: util_quda.cpp:25

errorQuda
#define errorQuda(...)
Definition: util_quda.h:120