quda-ref/v1.1.0/blas__lapack_8h_source.html

 #include <quda_internal.h>


 #pragma once


 #define FMULS_GETRF(m_, n_)                                                                                            \

   (((m_) < (n_)) ? (0.5 * (m_) * ((m_) * ((n_) - (1. / 3.) * (m_)-1.) + (n_)) + (2. / 3.) * (m_)) :                    \

                    (0.5 * (n_) * ((n_) * ((m_) - (1. / 3.) * (n_)-1.) + (m_)) + (2. / 3.) * (n_)))

 #define FADDS_GETRF(m_, n_)                                                                                            \

   (((m_) < (n_)) ? (0.5 * (m_) * ((m_) * ((n_) - (1. / 3.) * (m_)) - (n_)) + (1. / 6.) * (m_)) :                       \

                    (0.5 * (n_) * ((n_) * ((m_) - (1. / 3.) * (n_)) - (m_)) + (1. / 6.) * (n_)))


 #define FLOPS_ZGETRF(m_, n_)                                                                                           \

   (6. * FMULS_GETRF((double)(m_), (double)(n_)) + 2.0 * FADDS_GETRF((double)(m_), (double)(n_)))

 #define FLOPS_CGETRF(m_, n_)                                                                                           \

   (6. * FMULS_GETRF((double)(m_), (double)(n_)) + 2.0 * FADDS_GETRF((double)(m_), (double)(n_)))


 #define FMULS_GETRI(n_) ((n_) * ((5. / 6.) + (n_) * ((2. / 3.) * (n_) + 0.5)))

 #define FADDS_GETRI(n_) ((n_) * ((5. / 6.) + (n_) * ((2. / 3.) * (n_)-1.5)))


 #define FLOPS_ZGETRI(n_) (6. * FMULS_GETRI((double)(n_)) + 2.0 * FADDS_GETRI((double)(n_)))

 #define FLOPS_CGETRI(n_) (6. * FMULS_GETRI((double)(n_)) + 2.0 * FADDS_GETRI((double)(n_)))


 namespace quda

 {


   namespace blas_lapack

   {


     bool use_native();

     void set_native(bool native);


     namespace native

     {


       void init();


       void destroy();


       long long BatchInvertMatrix(void *Ainv, void *A, const int n, const uint64_t batch, QudaPrecision precision,

                                   QudaFieldLocation location);


       long long stridedBatchGEMM(void *A, void *B, void *C, QudaBLASParam blas_param, QudaFieldLocation location);


     } // namespace native


     namespace generic

     {


       void init();


       void destroy();


       long long BatchInvertMatrix(void *Ainv, void *A, const int n, const uint64_t batch, QudaPrecision precision,

                                   QudaFieldLocation location);


       long long stridedBatchGEMM(void *A, void *B, void *C, QudaBLASParam blas_param, QudaFieldLocation location);


     } // namespace generic

   }   // namespace blas_lapack

 } // namespace quda

QudaPrecision
enum QudaPrecision_s QudaPrecision

QudaFieldLocation
enum QudaFieldLocation_s QudaFieldLocation

quda::blas_lapack::generic::init
void init()
Create the BLAS context.
Definition: blas_lapack_eigen.cpp:19

quda::blas_lapack::generic::stridedBatchGEMM
long long stridedBatchGEMM(void *A, void *B, void *C, QudaBLASParam blas_param, QudaFieldLocation location)
Strided Batch GEMM. This function performs N GEMM type operations in a strided batched fashion....
Definition: blas_lapack_eigen.cpp:204

quda::blas_lapack::generic::BatchInvertMatrix
long long BatchInvertMatrix(void *Ainv, void *A, const int n, const uint64_t batch, QudaPrecision precision, QudaFieldLocation location)
Batch inversion the matrix field using an LU decomposition method.
Definition: blas_lapack_eigen.cpp:52

quda::blas_lapack::generic::destroy
void destroy()
Destroy the BLAS context.
Definition: blas_lapack_eigen.cpp:21

quda::blas_lapack::native::BatchInvertMatrix
long long BatchInvertMatrix(void *Ainv, void *A, const int n, const uint64_t batch, QudaPrecision precision, QudaFieldLocation location)
Batch inversion the matrix field using an LU decomposition method.
Definition: blas_lapack_cublas.cpp:76

quda::blas_lapack::native::init
void init()
Create the BLAS context.
Definition: blas_lapack_cublas.cpp:28

quda::blas_lapack::native::stridedBatchGEMM
long long stridedBatchGEMM(void *A, void *B, void *C, QudaBLASParam blas_param, QudaFieldLocation location)
Strided Batch GEMM. This function performs N GEMM type operations in a strided batched fashion....
Definition: blas_lapack_cublas.cpp:193

quda::blas_lapack::native::destroy
void destroy()
Destroy the BLAS context.
Definition: blas_lapack_cublas.cpp:42

quda::blas_lapack::set_native
void set_native(bool native)
Definition: blas_lapack_eigen.cpp:14

quda::blas_lapack::use_native
bool use_native()
Definition: blas_lapack_eigen.cpp:13

quda
Definition: blas_lapack.h:24

quda_internal.h

QudaBLASParam_s
Definition: quda.h:748