quda-ref/v1.0.0/transfer_8cpp_source.html

 #include <transfer.h>
 #include <blas_quda.h>

 #include <transfer.h>
 #include <multigrid.h>
 #include <malloc_quda.h>

 #include <iostream>
 #include <algorithm>
 #include <vector>


 namespace quda {

   /*
   * for the staggered case, there is no spin blocking,
   * however we do even-odd to preserve chirality (that is straightforward)
   */
   Transfer::Transfer(const std::vector<ColorSpinorField *> &B, int Nvec, int n_block_ortho, int *geo_bs, int spin_bs,
                      QudaPrecision null_precision, TimeProfile &profile) :
     B(B),
     Nvec(Nvec),
     NblockOrtho(n_block_ortho),
     null_precision(null_precision),
     V_h(nullptr),
     V_d(nullptr),
     fine_tmp_h(nullptr),
     fine_tmp_d(nullptr),
     coarse_tmp_h(nullptr),
     coarse_tmp_d(nullptr),
     geo_bs(nullptr),
     fine_to_coarse_h(nullptr),
     coarse_to_fine_h(nullptr),
     fine_to_coarse_d(nullptr),
     coarse_to_fine_d(nullptr),
     spin_bs(spin_bs),
     spin_map(0),
     nspin_fine(B[0]->Nspin()),
     site_subset(QUDA_FULL_SITE_SUBSET),
     parity(QUDA_INVALID_PARITY),
     enable_gpu(false),
     enable_cpu(false),
     use_gpu(true),
     flops_(0),
     profile(profile)
   {
     postTrace();
     int ndim = B[0]->Ndim();

     for (int d = 0; d < ndim; d++) {
       while (geo_bs[d] > 0) {
         if (d==0 && B[0]->X(0) == geo_bs[0])
           warningQuda("X-dimension length %d cannot block length %d", B[0]->X(0), geo_bs[0]);
         else if ( (B[0]->X(d)/geo_bs[d]+1)%2 == 0)
           warningQuda("Indexing does not (yet) support odd coarse dimensions: X(%d) = %d", d, B[0]->X(d)/geo_bs[d]);
         else if ( (B[0]->X(d)/geo_bs[d]) * geo_bs[d] != B[0]->X(d) )
           warningQuda("cannot block dim[%d]=%d with block size = %d", d, B[0]->X(d), geo_bs[d]);
         else
           break; // this is a valid block size so let's use it
         geo_bs[d] /= 2;
       }
       if (geo_bs[d] == 0) errorQuda("Unable to block dimension %d", d);
     }

     this->geo_bs = new int[ndim];
     int total_block_size = 1;
     for (int d = 0; d < ndim; d++) {
       this->geo_bs[d] = geo_bs[d];
       total_block_size *= geo_bs[d];
     }

     if (total_block_size == 1) errorQuda("Total geometric block size is 1");

     std::string block_str = std::to_string(geo_bs[0]);
     for (int d=1; d<ndim; d++) block_str += " x " + std::to_string(geo_bs[1]);
     if (getVerbosity() >= QUDA_VERBOSE) printfQuda("Transfer: using block size %s\n", block_str.c_str());

     createV(B[0]->Location()); // allocate V field
     createTmp(QUDA_CPU_FIELD_LOCATION); // allocate temporaries

     // allocate and compute the fine-to-coarse and coarse-to-fine site maps
     fine_to_coarse_h = static_cast<int*>(pool_pinned_malloc(B[0]->Volume()*sizeof(int)));
     coarse_to_fine_h = static_cast<int*>(pool_pinned_malloc(B[0]->Volume()*sizeof(int)));

     if (enable_gpu) {
       fine_to_coarse_d = static_cast<int*>(pool_device_malloc(B[0]->Volume()*sizeof(int)));
       coarse_to_fine_d = static_cast<int*>(pool_device_malloc(B[0]->Volume()*sizeof(int)));
     }

     createGeoMap(geo_bs);

     // allocate the fine-to-coarse spin map
     spin_map = static_cast<int**>(safe_malloc(nspin_fine*sizeof(int*)));
     for (int s = 0; s < B[0]->Nspin(); s++) spin_map[s] = static_cast<int*>(safe_malloc(2*sizeof(int)));
     createSpinMap(spin_bs);

     reset();
     postTrace();
   }

   void Transfer::createV(QudaFieldLocation location) const
   {
     postTrace();
     // create the storage for the final block orthogonal elements
     ColorSpinorParam param(*B[0]); // takes the geometry from the null-space vectors

     // the ordering of the V vector is defined by these parameters and
     // the Packed functions in ColorSpinorFieldOrder

     param.nSpin = B[0]->Nspin(); // spin has direct mapping
     param.nColor = B[0]->Ncolor()*Nvec; // nColor = number of colors * number of vectors
     param.nVec = Nvec;
     param.create = QUDA_NULL_FIELD_CREATE;
     // the V field is defined on all sites regardless of B field (maybe the B fields are always full?)
     if (param.siteSubset == QUDA_PARITY_SITE_SUBSET) {
       //keep it the same for staggered:
       param.siteSubset = QUDA_FULL_SITE_SUBSET;
       param.x[0] *= 2;
     }
     param.location = location;
     param.fieldOrder = location == QUDA_CUDA_FIELD_LOCATION ? QUDA_FLOAT2_FIELD_ORDER : QUDA_SPACE_SPIN_COLOR_FIELD_ORDER;
     param.setPrecision(location == QUDA_CUDA_FIELD_LOCATION ? null_precision : B[0]->Precision());

     if (location == QUDA_CUDA_FIELD_LOCATION) {
       V_d = ColorSpinorField::Create(param);
       enable_gpu = true;
     } else {
       V_h = ColorSpinorField::Create(param);
       enable_cpu = true;
     }
     postTrace();
   }

   void Transfer::createTmp(QudaFieldLocation location) const
   {
     postTrace();
     ColorSpinorParam param(*B[0]);
     param.create = QUDA_NULL_FIELD_CREATE;
     param.location = location;
     param.fieldOrder = location == QUDA_CUDA_FIELD_LOCATION ? QUDA_FLOAT2_FIELD_ORDER : QUDA_SPACE_SPIN_COLOR_FIELD_ORDER;
     if (param.Precision() < QUDA_SINGLE_PRECISION) param.setPrecision(QUDA_SINGLE_PRECISION);

     if (location == QUDA_CUDA_FIELD_LOCATION) {
       if (fine_tmp_d && coarse_tmp_d) return;
       fine_tmp_d = ColorSpinorField::Create(param);
       coarse_tmp_d = fine_tmp_d->CreateCoarse(geo_bs, spin_bs, Nvec);
     } else {
       fine_tmp_h = ColorSpinorField::Create(param);
       coarse_tmp_h = fine_tmp_h->CreateCoarse(geo_bs, spin_bs, Nvec);
     }
     postTrace();
   }

   void Transfer::initializeLazy(QudaFieldLocation location) const
   {
     if (!enable_cpu && !enable_gpu) errorQuda("Neither CPU or GPU coarse fields initialized");

     // delayed allocating this temporary until we need it
     if (B[0]->Location() == QUDA_CUDA_FIELD_LOCATION) createTmp(QUDA_CUDA_FIELD_LOCATION);

     switch (location) {
     case QUDA_CUDA_FIELD_LOCATION:
       if (enable_gpu) return;
       createV(location);
       *V_d = *V_h;
       createTmp(location);
       fine_to_coarse_d = static_cast<int*>(pool_device_malloc(B[0]->Volume()*sizeof(int)));
       coarse_to_fine_d = static_cast<int*>(pool_device_malloc(B[0]->Volume()*sizeof(int)));
       qudaMemcpy(fine_to_coarse_d, fine_to_coarse_h, B[0]->Volume()*sizeof(int), cudaMemcpyHostToDevice);
       qudaMemcpy(coarse_to_fine_d, coarse_to_fine_h, B[0]->Volume()*sizeof(int), cudaMemcpyHostToDevice);
       break;
     case QUDA_CPU_FIELD_LOCATION:
       if (enable_cpu) return;
       createV(location);
       *V_h = *V_d;
       break;
     default:
       errorQuda("Unknown location %d", location);
     }
   }

   void Transfer::reset()
   {
     postTrace();
     if (getVerbosity() >= QUDA_VERBOSE) printfQuda("Transfer: block orthogonalizing\n");

     if (B[0]->Location() == QUDA_CUDA_FIELD_LOCATION) {
       if (!enable_gpu) errorQuda("enable_gpu = %d so cannot reset", enable_gpu);
       BlockOrthogonalize(*V_d, B, fine_to_coarse_d, coarse_to_fine_d, geo_bs, spin_bs, NblockOrtho);
       if (enable_cpu) {
         *V_h = *V_d;
         if (getVerbosity() >= QUDA_VERBOSE) printfQuda("Transferred prolongator back to CPU\n");
       }
     } else {
       if (!enable_cpu) errorQuda("enable_cpu = %d so cannot reset", enable_cpu);
       BlockOrthogonalize(*V_h, B, fine_to_coarse_h, coarse_to_fine_h, geo_bs, spin_bs, NblockOrtho);
       if (enable_gpu) { // if the GPU fields has been initialized then we need to update
         *V_d = *V_h;
   if (getVerbosity() >= QUDA_VERBOSE) printfQuda("Transferred prolongator to GPU\n");
       }
     }
     postTrace();
   }

   Transfer::~Transfer() {
     if (spin_map)
     {
       for (int s = 0; s < nspin_fine; s++) { if (spin_map[s]) host_free(spin_map[s]); }
       host_free(spin_map);
     }
     if (coarse_to_fine_d) pool_device_free(coarse_to_fine_d);
     if (fine_to_coarse_d) pool_device_free(fine_to_coarse_d);
     if (coarse_to_fine_h) pool_pinned_free(coarse_to_fine_h);
     if (fine_to_coarse_h) pool_pinned_free(fine_to_coarse_h);
     if (V_h) delete V_h;
     if (V_d) delete V_d;

     if (fine_tmp_h) delete fine_tmp_h;
     if (fine_tmp_d) delete fine_tmp_d;

     if (coarse_tmp_h) delete coarse_tmp_h;
     if (coarse_tmp_d) delete coarse_tmp_d;

     if (geo_bs) delete []geo_bs;
   }

   void Transfer::setSiteSubset(QudaSiteSubset site_subset_, QudaParity parity_)
   {
     if (site_subset_ == QUDA_PARITY_SITE_SUBSET && parity_ != QUDA_EVEN_PARITY && parity_ != QUDA_ODD_PARITY)
       errorQuda("Undefined parity %d", parity_);
     parity = parity_;

     if (site_subset == site_subset_) return;
     site_subset = site_subset_;
   }

   struct Int2 {
     int x, y;
     Int2() : x(0), y(0) { }
     Int2(int x, int y) : x(x), y(y) { }

     bool operator<(const Int2 &a) const {
       return (x < a.x) ? true : (x==a.x && y<a.y) ? true : false;
     }
   };

   // compute the fine-to-coarse site map
   void Transfer::createGeoMap(int *geo_bs) {

     int x[QUDA_MAX_DIM];

     ColorSpinorField &fine(*fine_tmp_h);
     ColorSpinorField &coarse(*coarse_tmp_h);

     // compute the coarse grid point for every site (assuming parity ordering currently)
     for (int i=0; i<fine.Volume(); i++) {
       // compute the lattice-site index for this offset index
       fine.LatticeIndex(x, i);

       //printfQuda("fine idx %d = fine (%d,%d,%d,%d), ", i, x[0], x[1], x[2], x[3]);

       // compute the corresponding coarse-grid index given the block size
       for (int d=0; d<fine.Ndim(); d++) x[d] /= geo_bs[d];

       // compute the coarse-offset index and store in fine_to_coarse
       int k;
       coarse.OffsetIndex(k, x); // this index is parity ordered
       fine_to_coarse_h[i] = k;

       //printfQuda("coarse after (%d,%d,%d,%d), coarse idx %d\n", x[0], x[1], x[2], x[3], k);
     }

     // now create an inverse-like variant of this

     std::vector<Int2> geo_sort(B[0]->Volume());
     for (unsigned int i=0; i<geo_sort.size(); i++) geo_sort[i] = Int2(fine_to_coarse_h[i], i);
     std::sort(geo_sort.begin(), geo_sort.end());
     for (unsigned int i=0; i<geo_sort.size(); i++) coarse_to_fine_h[i] = geo_sort[i].y;

     if (enable_gpu) {
       qudaMemcpy(fine_to_coarse_d, fine_to_coarse_h, B[0]->Volume()*sizeof(int), cudaMemcpyHostToDevice);
       qudaMemcpy(coarse_to_fine_d, coarse_to_fine_h, B[0]->Volume()*sizeof(int), cudaMemcpyHostToDevice);
       checkCudaError();
     }

   }

   // compute the fine spin and checkerboard to coarse spin map
   void Transfer::createSpinMap(int spin_bs) {
     if (spin_bs == 0) // staggered
     {
       spin_map[0][0] = 0; // fine even
       spin_map[0][1] = 1; // fine odd
     }
     else
     {
       for (int s=0; s<B[0]->Nspin(); s++) {
         spin_map[s][0] = s / spin_bs; // not staggered, doesn't care about parity.
         spin_map[s][1] = s / spin_bs;
       }
     }
   }

   // apply the prolongator
   void Transfer::P(ColorSpinorField &out, const ColorSpinorField &in) const {
     profile.TPSTART(QUDA_PROFILE_COMPUTE);

     ColorSpinorField *input = const_cast<ColorSpinorField*>(&in);
     ColorSpinorField *output = &out;
     initializeLazy(use_gpu ? QUDA_CUDA_FIELD_LOCATION : QUDA_CPU_FIELD_LOCATION);
     const ColorSpinorField *V = use_gpu ? V_d : V_h;
     const int *fine_to_coarse = use_gpu ? fine_to_coarse_d : fine_to_coarse_h;

     if (use_gpu) {
       if (in.Location() == QUDA_CPU_FIELD_LOCATION) input = coarse_tmp_d;
       if (out.Location() == QUDA_CPU_FIELD_LOCATION ||  out.GammaBasis() != V->GammaBasis())
         output = (out.SiteSubset() == QUDA_FULL_SITE_SUBSET) ? fine_tmp_d : &fine_tmp_d->Even();
       if (!enable_gpu) errorQuda("not created with enable_gpu set, so cannot run on GPU");
     } else {
       if (out.Location() == QUDA_CUDA_FIELD_LOCATION)
         output = (out.SiteSubset() == QUDA_FULL_SITE_SUBSET) ? fine_tmp_h : &fine_tmp_h->Even();
     }

     *input = in; // copy result to input field (aliasing handled automatically)

     if (V->SiteSubset() == QUDA_PARITY_SITE_SUBSET && out.SiteSubset() == QUDA_FULL_SITE_SUBSET)
       errorQuda("Cannot prolongate to a full field since only have single parity null-space components");

     if ((V->Nspin() != 1) && ((output->GammaBasis() != V->GammaBasis()) || (input->GammaBasis() != V->GammaBasis()))){
       errorQuda("Cannot apply prolongator using fields in a different basis from the null space (%d,%d) != %d",
     output->GammaBasis(), in.GammaBasis(), V->GammaBasis());
     }

     Prolongate(*output, *input, *V, Nvec, fine_to_coarse, spin_map, parity);

     out = *output; // copy result to out field (aliasing handled automatically)

     flops_ += 8*in.Ncolor()*out.Ncolor()*out.VolumeCB()*out.SiteSubset();

     profile.TPSTOP(QUDA_PROFILE_COMPUTE);
   }

   // apply the restrictor
   void Transfer::R(ColorSpinorField &out, const ColorSpinorField &in) const {

     profile.TPSTART(QUDA_PROFILE_COMPUTE);

     ColorSpinorField *input = &const_cast<ColorSpinorField&>(in);
     ColorSpinorField *output = &out;
     initializeLazy(use_gpu ? QUDA_CUDA_FIELD_LOCATION : QUDA_CPU_FIELD_LOCATION);
     const ColorSpinorField *V = use_gpu ? V_d : V_h;
     const int *fine_to_coarse = use_gpu ? fine_to_coarse_d : fine_to_coarse_h;
     const int *coarse_to_fine = use_gpu ? coarse_to_fine_d : coarse_to_fine_h;

     if (use_gpu) {
       if (out.Location() == QUDA_CPU_FIELD_LOCATION) output = coarse_tmp_d;
       if (in.Location() == QUDA_CPU_FIELD_LOCATION || in.GammaBasis() != V->GammaBasis())
         input = (in.SiteSubset() == QUDA_FULL_SITE_SUBSET) ? fine_tmp_d : &fine_tmp_d->Even();
       if (!enable_gpu) errorQuda("not created with enable_gpu set, so cannot run on GPU");
     } else {
       if (in.Location() == QUDA_CUDA_FIELD_LOCATION)
         input = (in.SiteSubset() == QUDA_FULL_SITE_SUBSET) ? fine_tmp_h : &fine_tmp_h->Even();
     }

     *input = in;

     if (V->SiteSubset() == QUDA_PARITY_SITE_SUBSET && in.SiteSubset() == QUDA_FULL_SITE_SUBSET)
       errorQuda("Cannot restrict a full field since only have single parity null-space components");

     if ( V->Nspin() != 1 && ( output->GammaBasis() != V->GammaBasis() || input->GammaBasis() != V->GammaBasis() ) )
       errorQuda("Cannot apply restrictor using fields in a different basis from the null space (%d,%d) != %d",
     out.GammaBasis(), input->GammaBasis(), V->GammaBasis());

     Restrict(*output, *input, *V, Nvec, fine_to_coarse, coarse_to_fine, spin_map, parity);

     out = *output; // copy result to out field (aliasing handled automatically)

     // only need to synchronize if we're transferring from GPU to CPU
     if (out.Location() == QUDA_CPU_FIELD_LOCATION && in.Location() == QUDA_CUDA_FIELD_LOCATION)
       qudaDeviceSynchronize();

     flops_ += 8*out.Ncolor()*in.Ncolor()*in.VolumeCB()*in.SiteSubset();

     profile.TPSTOP(QUDA_PROFILE_COMPUTE);
   }

   double Transfer::flops() const {
     double rtn = flops_;
     flops_ = 0;
     return rtn;
   }

 } // namespace quda
QUDA_VERBOSE
Definition: enum_quda.h:265

qudaMemcpy
#define qudaMemcpy(dst, src, count, kind)
Definition: quda_cuda_api.h:33

quda::Transfer::enable_gpu
bool enable_gpu
Definition: transfer.h:104

quda::ColorSpinorField::Nspin
int Nspin() const
Definition: color_spinor_field.h:406

postTrace
#define postTrace()
Definition: tune_quda.h:591

quda::ColorSpinorField::OffsetIndex
void OffsetIndex(int &i, int *y) const
Definition: color_spinor_field.cpp:727

quda::ColorSpinorParam::setPrecision
void setPrecision(QudaPrecision precision, QudaPrecision ghost_precision=QUDA_INVALID_PRECISION, bool force_native=false)
Definition: color_spinor_field.h:231

quda::Transfer::profile
TimeProfile & profile
Definition: transfer.h:152

quda::Transfer::createTmp
void createTmp(QudaFieldLocation location) const
Allocate temporaries used when applying transfer operators.
Definition: transfer.cpp:134

pool_pinned_free
#define pool_pinned_free(ptr)
Definition: malloc_quda.h:128

quda::Transfer::Nvec
const int Nvec
Definition: transfer.h:37

quda::Transfer::Transfer
Transfer(const std::vector< ColorSpinorField *> &B, int Nvec, int NblockOrtho, int *geo_bs, int spin_bs, QudaPrecision null_precision, TimeProfile &profile)
Definition: transfer.cpp:19

QudaPrecision
enum QudaPrecision_s QudaPrecision

QUDA_INVALID_PARITY
Definition: enum_quda.h:289

quda::ColorSpinorField
Definition: color_spinor_field.h:311

quda::ColorSpinorParam::nColor
int nColor
Definition: color_spinor_field.h:85

getVerbosity
QudaVerbosity getVerbosity()
Definition: util_quda.cpp:21

quda::Transfer::initializeLazy
void initializeLazy(QudaFieldLocation location) const
Lazy allocation of the transfer operator in a given location.
Definition: transfer.cpp:154

errorQuda
#define errorQuda(...)
Definition: util_quda.h:121

quda::Transfer::null_precision
const QudaPrecision null_precision
Definition: transfer.h:43

quda::Transfer::R
void R(ColorSpinorField &out, const ColorSpinorField &in) const
Definition: transfer.cpp:344

QUDA_CUDA_FIELD_LOCATION
Definition: enum_quda.h:326

quda::ColorSpinorField::VolumeCB
int VolumeCB() const
Definition: color_spinor_field.h:416

host_free
#define host_free(ptr)
Definition: malloc_quda.h:71

quda::Transfer::enable_cpu
bool enable_cpu
Definition: transfer.h:107

QUDA_ODD_PARITY
Definition: enum_quda.h:288

QUDA_SPACE_SPIN_COLOR_FIELD_ORDER
Definition: enum_quda.h:350

quda::Transfer::spin_bs
int spin_bs
Definition: transfer.h:89

QUDA_FULL_SITE_SUBSET
Definition: enum_quda.h:333

quda::ColorSpinorField::Even
const ColorSpinorField & Even() const
Definition: color_spinor_field.cpp:608

quda::ColorSpinorField::Create
static ColorSpinorField * Create(const ColorSpinorParam &param)
Definition: color_spinor_field.cpp:752

quda::ColorSpinorField::GammaBasis
QudaGammaBasis GammaBasis() const
Definition: color_spinor_field.h:484

QUDA_NULL_FIELD_CREATE
Definition: enum_quda.h:359

malloc_quda.h

quda::Int2::x
int x
Definition: transfer.cpp:238

quda::Transfer::fine_to_coarse_d
int * fine_to_coarse_d
Definition: transfer.h:81

quda::Transfer::P
void P(ColorSpinorField &out, const ColorSpinorField &in) const
Definition: transfer.cpp:305

quda::Transfer::fine_tmp_h
ColorSpinorField * fine_tmp_h
Definition: transfer.h:52

quda::Transfer::flops_
double flops_
Definition: transfer.h:146

quda::Transfer::createV
void createV(QudaFieldLocation location) const
Allocate V field.
Definition: transfer.cpp:101

quda::ColorSpinorField::Ncolor
int Ncolor() const
Definition: color_spinor_field.h:405

quda::ColorSpinorField::Ndim
int Ndim() const
Definition: color_spinor_field.h:409

quda::ColorSpinorField::Volume
int Volume() const
Definition: color_spinor_field.h:415

quda::Transfer::setSiteSubset
void setSiteSubset(QudaSiteSubset site_subset, QudaParity parity)
Sets whether the transfer operator is to act on full fields or single parity fields, and if single-parity which parity.
Definition: transfer.cpp:227

quda::Transfer::parity
QudaParity parity
Definition: transfer.h:101

Nspin
int Nspin
Definition: blas_test.cu:45

quda
Definition: blas_cublas.h:5

quda::LatticeFieldParam::siteSubset
QudaSiteSubset siteSubset
Definition: lattice_field.h:71

quda::Transfer::coarse_tmp_d
ColorSpinorField * coarse_tmp_d
Definition: transfer.h:61

param
QudaGaugeParam param
Definition: pack_test.cpp:17

ndim
static int ndim
Definition: layout_hyper.c:53

quda::LatticeFieldParam::x
int x[QUDA_MAX_DIM]
Definition: lattice_field.h:67

multigrid.h

qudaDeviceSynchronize
#define qudaDeviceSynchronize()
Definition: quda_cuda_api.h:145

quda::ColorSpinorParam::location
QudaFieldLocation location
Definition: color_spinor_field.h:83

quda::Transfer::coarse_to_fine_h
int * coarse_to_fine_h
Definition: transfer.h:75

quda::Int2::Int2
Int2()
Definition: transfer.cpp:239

quda::Transfer::site_subset
QudaSiteSubset site_subset
Definition: transfer.h:98

quda::ColorSpinorParam::fieldOrder
QudaFieldOrder fieldOrder
Definition: color_spinor_field.h:93

quda::ColorSpinorField::CreateCoarse
ColorSpinorField * CreateCoarse(const int *geoBlockSize, int spinBlockSize, int Nvec, QudaPrecision precision=QUDA_INVALID_PRECISION, QudaFieldLocation location=QUDA_INVALID_FIELD_LOCATION, QudaMemoryType mem_Type=QUDA_MEMORY_INVALID)
Create a coarse color-spinor field, using this field to set the meta data.
Definition: color_spinor_field.cpp:780

quda::Transfer::createGeoMap
void createGeoMap(int *geo_bs)
Creates the map between fine and coarse grids.
Definition: transfer.cpp:248

in
cpuColorSpinorField * in
Definition: staggered_invert_test.cpp:98

quda::Transfer::coarse_tmp_h
ColorSpinorField * coarse_tmp_h
Definition: transfer.h:58

quda::ColorSpinorField::SiteSubset
QudaSiteSubset SiteSubset() const
Definition: color_spinor_field.h:481

pool_device_malloc
#define pool_device_malloc(size)
Definition: malloc_quda.h:125

quda::QUDA_PROFILE_COMPUTE
Definition: timer.h:108

warningQuda
#define warningQuda(...)
Definition: util_quda.h:133

QUDA_PARITY_SITE_SUBSET
Definition: enum_quda.h:332

QUDA_FLOAT2_FIELD_ORDER
Definition: enum_quda.h:348

quda::Transfer::NblockOrtho
const int NblockOrtho
Definition: transfer.h:40

X
int X[4]
Definition: covdev_test.cpp:70

quda::Transfer::V_h
ColorSpinorField * V_h
Definition: transfer.h:46

QudaParity
enum QudaParity_s QudaParity

quda::Transfer::use_gpu
bool use_gpu
Definition: transfer.h:111

quda::Int2::y
int y
Definition: transfer.cpp:238

safe_malloc
#define safe_malloc(size)
Definition: malloc_quda.h:66

V
int V
Definition: test_util.cpp:27

quda::Restrict
void Restrict(Arg arg)
Definition: restrictor.cuh:90

quda::Transfer::spin_map
int ** spin_map
Definition: transfer.h:92

QudaSiteSubset
enum QudaSiteSubset_s QudaSiteSubset

quda::LatticeField::Location
QudaFieldLocation Location() const
Definition: lattice_field.cpp:660

blas_quda.h

quda::Transfer::fine_to_coarse_h
int * fine_to_coarse_h
Definition: transfer.h:70

pool_pinned_malloc
#define pool_pinned_malloc(size)
Definition: malloc_quda.h:127

quda::ColorSpinorParam
Definition: color_spinor_field.h:80

QudaFieldLocation
enum QudaFieldLocation_s QudaFieldLocation

out
cpuColorSpinorField * out
Definition: staggered_invert_test.cpp:99

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:61

quda::ColorSpinorParam::nSpin
int nSpin
Definition: color_spinor_field.h:86

quda::s
__shared__ float s[]

quda::LatticeFieldParam::Precision
QudaPrecision Precision() const
Definition: lattice_field.h:58

printfQuda
#define printfQuda(...)
Definition: util_quda.h:115

quda::Transfer::nspin_fine
const int nspin_fine
Definition: transfer.h:95

transfer.h

quda::ColorSpinorField::LatticeIndex
void LatticeIndex(int *y, int i) const
Definition: color_spinor_field.cpp:698

quda::TimeProfile
Definition: timer.h:171

quda::Transfer::V_d
ColorSpinorField * V_d
Definition: transfer.h:49

QUDA_EVEN_PARITY
Definition: enum_quda.h:287

pool_device_free
#define pool_device_free(ptr)
Definition: malloc_quda.h:126

quda::Int2::operator<
bool operator<(const Int2 &a) const
Definition: transfer.cpp:242

QUDA_MAX_DIM
#define QUDA_MAX_DIM
Maximum number of dimensions supported by QUDA. In practice, no routines make use of more than 5...
Definition: quda_constants.h:17

checkCudaError
#define checkCudaError()
Definition: util_quda.h:161

quda::Transfer::fine_tmp_d
ColorSpinorField * fine_tmp_d
Definition: transfer.h:55

quda::Transfer::createSpinMap
void createSpinMap(int spin_bs)
Creates the map between fine spin and parity to coarse spin dimensions.
Definition: transfer.cpp:289

quda::Int2::Int2
Int2(int x, int y)
Definition: transfer.cpp:240

quda::Transfer::B
const std::vector< ColorSpinorField * > & B
Definition: transfer.h:34

quda::Int2
Definition: transfer.cpp:237

quda::ColorSpinorParam::create
QudaFieldCreate create
Definition: color_spinor_field.h:95

n_block_ortho
int n_block_ortho[QUDA_MAX_MG_LEVEL]
Definition: test_util.cpp:1673

quda::Prolongate
void Prolongate(ColorSpinorField &out, const ColorSpinorField &in, const ColorSpinorField &v, int Nvec, const int *fine_to_coarse, const int *const *spin_map, int parity=QUDA_INVALID_PARITY)
Apply the prolongation operator.
Definition: prolongator.cu:296

quda::ColorSpinorParam::nVec
int nVec
Definition: color_spinor_field.h:87

parity
QudaParity parity
Definition: covdev_test.cpp:54

quda::Transfer::flops
double flops() const
Definition: transfer.cpp:387

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:325

quda::Transfer::coarse_to_fine_d
int * coarse_to_fine_d
Definition: transfer.h:86

quda::Transfer::geo_bs
int * geo_bs
Definition: transfer.h:64

quda::Transfer::~Transfer
virtual ~Transfer()
Definition: transfer.cpp:205

quda::BlockOrthogonalize
void BlockOrthogonalize(ColorSpinorField &V, const std::vector< ColorSpinorField *> &B, const int *fine_to_coarse, const int *coarse_to_fine, const int *geo_bs, const int spin_bs, const int n_block_ortho)
Block orthogonnalize the matrix field, where the blocks are defined by lookup tables that map the fin...
Definition: block_orthogonalize.cu:317

quda::Transfer::reset
void reset()
for resetting the Transfer when the null vectors have changed
Definition: transfer.cpp:182