quda-ref/v1.1.0/ldg_8h_source.html

 #pragma once

 #include <generics/detail/alias.h>


 namespace detail {


 template<typename T,

          typename U=typename working_type<T>::type,

          int r = aliased_size<T, U>::value>

 struct load_storage {

     typedef array<U, r> result_type;

     static const int idx = aliased_size<T, U>::value - r;

     __device__ __forceinline__

     static result_type impl(const T* ptr) {

         return result_type(__ldg(((const U*)ptr) + idx),

                            load_storage<T, U, r-1>::impl(ptr));

     }

 };


 template<typename T, typename U>

 struct load_storage<T, U, 1> {

     typedef array<U, 1> result_type;

     static const int idx = aliased_size<T, U>::value - 1;

     __device__ __forceinline__

     static result_type impl(const T* ptr) {

         return result_type(__ldg(((const U*)ptr) + idx));

     }

 };


 }


 #if __CUDA_ARCH__ >= 350

 // Device has ldg

 template<typename T>

 __device__ __forceinline__ T __ldg(const T* ptr) {

     typedef typename detail::working_array<T>::type aliased;

     aliased storage = detail::load_storage<T>::impl(ptr);

     return detail::fuse<T>(storage);

 }


 #else

 //Device does not, fall back.

 template<typename T>

 __device__ __forceinline__ T __ldg(const T* ptr) {

     return *ptr;

 }


 #endif

alias.h

__ldg
__device__ __forceinline__ T __ldg(const T *ptr)
Definition: ldg.h:44

detail
Definition: alias.h:4

detail::aliased_size
Definition: alias.h:24

detail::aliased_size::value
static const int value
Definition: alias.h:25

detail::array
Definition: array.h:6

detail::load_storage< T, U, 1 >::result_type
array< U, 1 > result_type
Definition: ldg.h:21

detail::load_storage< T, U, 1 >::impl
__device__ static __forceinline__ result_type impl(const T *ptr)
Definition: ldg.h:24

detail::load_storage
Definition: ldg.h:9

detail::load_storage::impl
__device__ static __forceinline__ result_type impl(const T *ptr)
Definition: ldg.h:13

detail::load_storage::result_type
array< U, r > result_type
Definition: ldg.h:10

detail::load_storage::idx
static const int idx
Definition: ldg.h:11

detail::working_type::type
char type
Definition: alias.h:14