v0.9.0/doc/color__spinor__field_8cpp_source.html

 #include <color_spinor_field.h>
 #include <string.h>
 #include <iostream>
 #include <typeinfo>

 namespace quda {

   /*ColorSpinorField::ColorSpinorField() : init(false) {

     }*/

   ColorSpinorParam::ColorSpinorParam(const ColorSpinorField &field) {
     field.fill(*this);
   }

   ColorSpinorField::ColorSpinorField(const ColorSpinorParam &param)
     : LatticeField(param), init(false), init_ghost_zone(false), v(0), norm(0),
       ghost( ), ghostNorm( ), ghostFace( ),
       bytes(0), norm_bytes(0), even(0), odd(0),
       composite_descr(param.is_composite, param.composite_dim, param.is_component, param.component_id),
       components(0)
   {
     create(param.nDim, param.x, param.nColor, param.nSpin, param.twistFlavor,
      param.precision, param.pad, param.siteSubset, param.siteOrder,
      param.fieldOrder, param.gammaBasis, param.PCtype);
   }

   ColorSpinorField::ColorSpinorField(const ColorSpinorField &field)
     : LatticeField(field), init(false), init_ghost_zone(false), v(0), norm(0),
       ghost( ), ghostNorm( ), ghostFace( ),
       bytes(0), norm_bytes(0), even(0), odd(0),
      composite_descr(field.composite_descr), components(0)
   {
     create(field.nDim, field.x, field.nColor, field.nSpin, field.twistFlavor,
      field.precision, field.pad, field.siteSubset, field.siteOrder,
      field.fieldOrder, field.gammaBasis, field.PCtype);
   }

   ColorSpinorField::~ColorSpinorField() {
     destroy();
   }

   void ColorSpinorField::createGhostZone(int nFace, bool spin_project) const {

     // note need to check for ghost_precision switch when merged into feature/multigrid
     if (typeid(*this) == typeid(cpuColorSpinorField) || init_ghost_zone) return;

     // For Wilson we half the number of effective faces if the fields are spin projected.
     int num_faces = ((nSpin == 4 && spin_project) ? 1 : 2) * nFace;
     int num_norm_faces = 2*nFace;

     // calculate size of ghost zone required
     int ghostVolume = 0;
     int dims = nDim == 5 ? (nDim - 1) : nDim;
     int x5   = nDim == 5 ? x[4] : 1;
     for (int i=0; i<dims; i++) {
       ghostFace[i] = 0;
       if (comm_dim_partitioned(i)) {
   ghostFace[i] = 1;
   for (int j=0; j<dims; j++) {
     if (i==j) continue;
     ghostFace[i] *= x[j];
   }
   ghostFace[i] *= x5;
   if (i==0 && siteSubset != QUDA_FULL_SITE_SUBSET) ghostFace[i] /= 2;
   ghostVolume += ghostFace[i];
       }
       if (i==0) {
   ghostOffset[i][0] = 0;
       } else {
         if (precision == QUDA_HALF_PRECISION) {
           ghostOffset[i][0] = (ghostNormOffset[i-1][1] + num_norm_faces*ghostFace[i-1]/2)*sizeof(float)/sizeof(short);
           // Ensure that start of ghostOffset is aligned on four word boundaries (check if this is needed)
           ghostOffset[i][0] = 4*((ghostOffset[i][0] + 3)/4);
         } else {
     ghostOffset[i][0] = ghostOffset[i-1][0] + num_faces*ghostFace[i-1]*nSpin*nColor*2;
         }
       }

       if (precision == QUDA_HALF_PRECISION) {
         ghostNormOffset[i][0] = (ghostOffset[i][0] + (num_faces*ghostFace[i]*nSpin*nColor*2/2))*sizeof(short)/sizeof(float);
         ghostOffset[i][1] = (ghostNormOffset[i][0] + num_norm_faces*ghostFace[i]/2)*sizeof(float)/sizeof(short);
   // Ensure that start of ghostOffset is aligned on four word boundaries (check if this is needed)
         ghostOffset[i][1] = 4*((ghostOffset[i][1] + 3)/4);
         ghostNormOffset[i][1] = (ghostOffset[i][1] + (num_faces*ghostFace[i]*nSpin*nColor*2/2))*sizeof(short)/sizeof(float);
       } else {
         ghostOffset[i][1] = ghostOffset[i][0] + num_faces*ghostFace[i]*nSpin*nColor*2/2;
       }

       int Nint = nColor * nSpin * 2 / (nSpin == 4 && spin_project ? 2 : 1); // number of internal degrees of freedom
       ghost_face_bytes[i] = nFace*ghostFace[i]*Nint*precision;
       if (precision == QUDA_HALF_PRECISION) ghost_face_bytes[i] += nFace*ghostFace[i]*sizeof(float);

       if(GhostOffset(i,0)%FieldOrder()) errorQuda("ghostOffset(%d,0) %d is not a multiple of FloatN\n", i, GhostOffset(i,0));
       if(GhostOffset(i,1)%FieldOrder()) errorQuda("ghostOffset(%d,1) %d is not a multiple of FloatN\n", i, GhostOffset(i,1));

     } // dim

     int ghostNormVolume = num_norm_faces * ghostVolume;
     ghostVolume *= num_faces;

     size_t ghost_length = ghostVolume*nColor*nSpin*2;
     size_t ghost_norm_length = (precision == QUDA_HALF_PRECISION) ? ghostNormVolume : 0;

     if (getVerbosity() == QUDA_DEBUG_VERBOSE) {
       printfQuda("Allocated ghost volume = %d, ghost norm volume %d\n", ghostVolume, ghostNormVolume);
       printfQuda("ghost length = %lu, ghost norm length = %lu\n", ghost_length, ghost_norm_length);
     }

     ghost_bytes = (size_t)ghost_length*precision;
     if (precision == QUDA_HALF_PRECISION) ghost_bytes += ghost_norm_length*sizeof(float);
     if (isNative()) ghost_bytes = ALIGNMENT_ADJUST(ghost_bytes);

     { // compute temporaries needed by dslash and packing kernels
       auto &X = dslash_constant.X;
       for (int dim=0; dim<nDim; dim++) X[dim] = x[dim];
       for (int dim=nDim; dim<QUDA_MAX_DIM; dim++) X[dim] = 1;
       if (siteSubset == QUDA_PARITY_SITE_SUBSET) X[0] = 2*X[0];

       for (int i=0; i<nDim; i++) dslash_constant.Xh[i] = X[i]/2;

       dslash_constant.Ls = X[4];
       dslash_constant.volume_4d_cb = volumeCB / (nDim == 5 ? x[4] : 1);
       dslash_constant.volume_4d = 2 * dslash_constant.volume_4d_cb;

       int face[4];
       for (int dim=0; dim<4; dim++) {
         for (int j=0; j<4; j++) face[j] = X[j];
         face[dim] = nFace;
         dslash_constant.face_X[dim] = face[0];
         dslash_constant.face_Y[dim] = face[1];
         dslash_constant.face_Z[dim] = face[2];
         dslash_constant.face_T[dim] = face[3];
         dslash_constant.face_XY[dim] = dslash_constant.face_X[dim] * face[1];
         dslash_constant.face_XYZ[dim] = dslash_constant.face_XY[dim] * face[2];
         dslash_constant.face_XYZT[dim] = dslash_constant.face_XYZ[dim] * face[3];
       }

       dslash_constant.Vh = (X[3]*X[2]*X[1]*X[0])/2;
       dslash_constant.ghostFace[0] = (X[1]*X[2]*X[3])/2;
       dslash_constant.ghostFace[1] = (X[0]*X[2]*X[3])/2;
       dslash_constant.ghostFace[2] = (X[0]*X[1]*X[3])/2;
       dslash_constant.ghostFace[3] = (X[0]*X[1]*X[2])/2;

       dslash_constant.X2X1 = X[1]*X[0];
       dslash_constant.X3X2X1 = X[2]*X[1]*X[0];
       dslash_constant.X2X1mX1 = (X[1]-1)*X[0];
       dslash_constant.X3X2X1mX2X1 = (X[2]-1)*X[1]*X[0];
       dslash_constant.X4X3X2X1mX3X2X1 = (X[3]-1)*X[2]*X[1]*X[0];
       dslash_constant.X4X3X2X1hmX3X2X1h = dslash_constant.X4X3X2X1mX3X2X1/2;

       // used by indexFromFaceIndexStaggered
       dslash_constant.dims[0][0]=X[1];
       dslash_constant.dims[0][1]=X[2];
       dslash_constant.dims[0][2]=X[3];

       dslash_constant.dims[1][0]=X[0];
       dslash_constant.dims[1][1]=X[2];
       dslash_constant.dims[1][2]=X[3];

       dslash_constant.dims[2][0]=X[0];
       dslash_constant.dims[2][1]=X[1];
       dslash_constant.dims[2][2]=X[3];

       dslash_constant.dims[3][0]=X[0];
       dslash_constant.dims[3][1]=X[1];
       dslash_constant.dims[3][2]=X[2];
     }
     init_ghost_zone = true;

   } // createGhostZone

   void ColorSpinorField::create(int Ndim, const int *X, int Nc, int Ns, QudaTwistFlavorType Twistflavor,
         QudaPrecision Prec, int Pad, QudaSiteSubset siteSubset,
         QudaSiteOrder siteOrder, QudaFieldOrder fieldOrder,
         QudaGammaBasis gammaBasis, QudaDWFPCType DWFPC) {
     this->siteSubset = siteSubset;
     this->siteOrder = siteOrder;
     this->fieldOrder = fieldOrder;
     this->gammaBasis = gammaBasis;

     if (Ndim > QUDA_MAX_DIM){
       errorQuda("Number of dimensions nDim = %d too great", Ndim);
     }
     nDim = Ndim;
     nColor = Nc;
     nSpin = Ns;
     twistFlavor = Twistflavor;

     PCtype = DWFPC;

     precision = Prec;
     volume = 1;
     for (int d=0; d<nDim; d++) {
       x[d] = X[d];
       volume *= x[d];
     }
     volumeCB = siteSubset == QUDA_PARITY_SITE_SUBSET ? volume : volume/2;

    if((twistFlavor == QUDA_TWIST_NONDEG_DOUBLET || twistFlavor == QUDA_TWIST_DEG_DOUBLET) && x[4] != 2)
      errorQuda("Must be two flavors for non-degenerate twisted mass spinor (while provided with %d number of components)\n", x[4]);//two flavors

     pad = Pad;
     if (siteSubset == QUDA_FULL_SITE_SUBSET) {
       stride = volume/2 + pad; // padding is based on half volume
       length = 2*stride*nColor*nSpin*2;
     } else {
       stride = volume + pad;
       length = stride*nColor*nSpin*2;
     }

     real_length = volume*nColor*nSpin*2; // physical length

     bytes = (size_t)length * precision; // includes pads and ghost zones
     if (isNative()) bytes = (siteSubset == QUDA_FULL_SITE_SUBSET) ? 2*ALIGNMENT_ADJUST(bytes/2) : ALIGNMENT_ADJUST(bytes);

     if (precision == QUDA_HALF_PRECISION) {
       norm_bytes = (siteSubset == QUDA_FULL_SITE_SUBSET ? 2*stride : stride) * sizeof(float);
       if (isNative()) norm_bytes = (siteSubset == QUDA_FULL_SITE_SUBSET) ? 2*ALIGNMENT_ADJUST(norm_bytes/2) : ALIGNMENT_ADJUST(norm_bytes);
     } else {
       norm_bytes = 0;
     }

     init = true;

     if (composite_descr.is_composite) {

       if (composite_descr.is_component) errorQuda("\nComposite type is not implemented.\n");

       composite_descr.volume   = volume;
       composite_descr.volumeCB = volumeCB;
       composite_descr.stride = stride;
       composite_descr.length = length;
       composite_descr.real_length = real_length;
       composite_descr.bytes       = bytes;
       composite_descr.norm_bytes  = norm_bytes;

       volume *= composite_descr.dim;
       stride *= composite_descr.dim;
       length *= composite_descr.dim;
       real_length *= composite_descr.dim;

       bytes *= composite_descr.dim;
       norm_bytes *= composite_descr.dim;
     }  else if (composite_descr.is_component) {
       composite_descr.dim = 0;

       composite_descr.volume      = 0;
       composite_descr.volumeCB    = 0;
       composite_descr.stride      = 0;
       composite_descr.length      = 0;
       composite_descr.real_length = 0;
       composite_descr.bytes       = 0;
       composite_descr.norm_bytes  = 0;
     }

     setTuningString();
   }

   void ColorSpinorField::setTuningString() {
     char vol_tmp[TuneKey::volume_n];
     int check;
     check = snprintf(vol_string, TuneKey::volume_n, "%d", x[0]);
     if (check < 0 || check >= TuneKey::volume_n) errorQuda("Error writing volume string");
     for (int d=1; d<nDim; d++) {
       strcpy(vol_tmp, vol_string);
       check = snprintf(vol_string, TuneKey::volume_n, "%sx%d", vol_tmp, x[d]);
       if (check < 0 || check >= TuneKey::volume_n) errorQuda("Error writing volume string");
     }

     int aux_string_n = TuneKey::aux_n / 2;
     char aux_tmp[aux_string_n];
     check = snprintf(aux_string, aux_string_n, "vol=%d,stride=%d,precision=%d,Ns=%d,Nc=%d",
          volume, stride, precision, nSpin, nColor);
     if (check < 0 || check >= aux_string_n) errorQuda("Error writing aux string");

     if (twistFlavor != QUDA_TWIST_NO && twistFlavor != QUDA_TWIST_INVALID) {
       strcpy(aux_tmp, aux_string);
       check = snprintf(aux_string, aux_string_n, "%s,TwistFlavour=%d", aux_tmp, twistFlavor);
       if (check < 0 || check >= aux_string_n) errorQuda("Error writing aux string");
     }
   }

   void ColorSpinorField::destroy() {
     init = false;
   }

   ColorSpinorField& ColorSpinorField::operator=(const ColorSpinorField &src) {
     if (&src != this) {
       if(src.composite_descr.is_composite){
         this->composite_descr.is_composite = true;
         this->composite_descr.dim          = src.composite_descr.dim;
         this->composite_descr.is_component = false;
         this->composite_descr.id           = 0;
       }
       else if(src.composite_descr.is_component){
         this->composite_descr.is_composite = false;
         this->composite_descr.dim          = 0;
         //this->composite_descr.is_component = false;
         //this->composite_descr.id           = 0;
       }

       create(src.nDim, src.x, src.nColor, src.nSpin, src.twistFlavor,
        src.precision, src.pad, src.siteSubset,
        src.siteOrder, src.fieldOrder, src.gammaBasis, src.PCtype);
     }
     return *this;
   }

   // Resets the attributes of this field if param disagrees (and is defined)
   void ColorSpinorField::reset(const ColorSpinorParam &param)
   {
     if (param.nColor != 0) nColor = param.nColor;
     if (param.nSpin != 0) nSpin = param.nSpin;
     if (param.twistFlavor != QUDA_TWIST_INVALID) twistFlavor = param.twistFlavor;

     if (param.PCtype != QUDA_PC_INVALID) PCtype = param.PCtype;

     if (param.precision != QUDA_INVALID_PRECISION)  precision = param.precision;
     if (param.nDim != 0) nDim = param.nDim;

     composite_descr.is_composite     = param.is_composite;
     composite_descr.is_component     = param.is_component;
     composite_descr.dim              = param.is_composite ? param.composite_dim : 0;
     composite_descr.id               = param.component_id;

     volume = 1;
     for (int d=0; d<nDim; d++) {
       if (param.x[d] != 0) x[d] = param.x[d];
       volume *= x[d];
     }
     volumeCB = param.siteSubset == QUDA_PARITY_SITE_SUBSET ? volume : volume/2;

     if((twistFlavor == QUDA_TWIST_NONDEG_DOUBLET || twistFlavor == QUDA_TWIST_DEG_DOUBLET) && x[4] != 2)
       errorQuda("Must be two flavors for non-degenerate twisted mass spinor (provided with %d)\n", x[4]);

     if (param.pad != 0) pad = param.pad;

     if (param.siteSubset == QUDA_FULL_SITE_SUBSET) {
       stride = volume/2 + pad;
       length = 2*stride*nColor*nSpin*2;
     } else if (param.siteSubset == QUDA_PARITY_SITE_SUBSET) {
       stride = volume + pad;
       length = stride*nColor*nSpin*2;
     } else {
       //errorQuda("SiteSubset not defined %d", param.siteSubset);
       //do nothing, not an error (can't remember why - need to document this sometime! )
     }

     if (param.siteSubset != QUDA_INVALID_SITE_SUBSET) siteSubset = param.siteSubset;
     if (param.siteOrder != QUDA_INVALID_SITE_ORDER) siteOrder = param.siteOrder;
     if (param.fieldOrder != QUDA_INVALID_FIELD_ORDER) fieldOrder = param.fieldOrder;
     if (param.gammaBasis != QUDA_INVALID_GAMMA_BASIS) gammaBasis = param.gammaBasis;

     real_length = volume*nColor*nSpin*2;

     bytes = (size_t)length * precision; // includes pads
     if (isNative()) bytes = (siteSubset == QUDA_FULL_SITE_SUBSET) ? 2*ALIGNMENT_ADJUST(bytes/2) : ALIGNMENT_ADJUST(bytes);

     if (precision == QUDA_HALF_PRECISION) {
       norm_bytes = (siteSubset == QUDA_FULL_SITE_SUBSET ? 2*stride : stride) * sizeof(float);
       if (isNative()) norm_bytes = (siteSubset == QUDA_FULL_SITE_SUBSET) ? 2*ALIGNMENT_ADJUST(norm_bytes/2) : ALIGNMENT_ADJUST(norm_bytes);
     } else {
       norm_bytes = 0;
     }

     if (composite_descr.is_composite) {
       composite_descr.volume            = volume;
       composite_descr.stride            = stride;
       composite_descr.length            = length;
       composite_descr.real_length       = real_length;
       composite_descr.bytes             = bytes;
       composite_descr.norm_bytes        = norm_bytes;

       volume            *= composite_descr.dim;
       stride            *= composite_descr.dim;
       length            *= composite_descr.dim;
       real_length       *= composite_descr.dim;

       bytes      *= composite_descr.dim;
       norm_bytes *= composite_descr.dim;
     } else {
       composite_descr.volume            = 0;
       composite_descr.stride            = 0;
       composite_descr.length            = 0;
       composite_descr.real_length       = 0;
       composite_descr.bytes             = 0;
       composite_descr.norm_bytes        = 0;
     }

     if (!init) errorQuda("Shouldn't be resetting a non-inited field\n");

     if (getVerbosity() >= QUDA_DEBUG_VERBOSE) {
       printfQuda("\nPrinting out reset field\n");
       std::cout << *this << std::endl;
       printfQuda("\n");
     }

     setTuningString();
   }

   // Fills the param with the contents of this field
   void ColorSpinorField::fill(ColorSpinorParam &param) const {
     param.location = Location();
     param.nColor = nColor;
     param.nSpin = nSpin;
     param.twistFlavor = twistFlavor;
     param.precision = precision;
     param.nDim = nDim;

     param.is_composite  = composite_descr.is_composite;
     param.composite_dim = composite_descr.dim;
     param.is_component  = false;//always either a regular spinor or a composite object
     param.component_id  = 0;

     memcpy(param.x, x, QUDA_MAX_DIM*sizeof(int));
     param.pad = pad;
     param.siteSubset = siteSubset;
     param.siteOrder = siteOrder;
     param.fieldOrder = fieldOrder;
     param.gammaBasis = gammaBasis;
     param.PCtype = PCtype;
     param.create = QUDA_INVALID_FIELD_CREATE;
   }

   void ColorSpinorField::exchange(void **ghost, void **sendbuf, int nFace) const {

     // FIXME: use LatticeField MsgHandles
     MsgHandle *mh_send_fwd[4];
     MsgHandle *mh_from_back[4];
     MsgHandle *mh_from_fwd[4];
     MsgHandle *mh_send_back[4];
     size_t bytes[4];

     const int Ninternal = 2*nColor*nSpin;
     size_t total_bytes = 0;
     for (int i=0; i<nDimComms; i++) {
       bytes[i] = siteSubset*nFace*surfaceCB[i]*Ninternal*precision;
       if (comm_dim_partitioned(i)) total_bytes += 2*bytes[i]; // 2 for fwd/bwd
     }

     void *total_send = nullptr;
     void *total_recv = nullptr;
     void *send_fwd[4];
     void *send_back[4];
     void *recv_fwd[4];
     void *recv_back[4];

     // leave this option in there just in case
     bool no_comms_fill = false;

     // If this is set to false, then we are assuming that the send and
     // ghost buffers are in a single contiguous memory space.  Setting
     // to false means we aggregate all cudaMemcpys which reduces
     // latency.
     bool fine_grained_memcpy = false;

     if (Location() == QUDA_CPU_FIELD_LOCATION) {
       for (int i=0; i<nDimComms; i++) {
   if (comm_dim_partitioned(i)) {
     send_back[i] = sendbuf[2*i + 0];
     send_fwd[i]  = sendbuf[2*i + 1];
     recv_fwd[i]  =   ghost[2*i + 1];
     recv_back[i] =   ghost[2*i + 0];
   } else if (no_comms_fill) {
     memcpy(ghost[2*i+1], sendbuf[2*i+0], bytes[i]);
     memcpy(ghost[2*i+0], sendbuf[2*i+1], bytes[i]);
   }
       }
     } else { // FIXME add GPU_COMMS support
       if (total_bytes) {
   total_send = pool_pinned_malloc(total_bytes);
   total_recv = pool_pinned_malloc(total_bytes);
       }
       size_t offset = 0;
       for (int i=0; i<nDimComms; i++) {
   if (comm_dim_partitioned(i)) {
     send_back[i] = static_cast<char*>(total_send) + offset;
     recv_back[i] = static_cast<char*>(total_recv) + offset;
     offset += bytes[i];
     send_fwd[i] = static_cast<char*>(total_send) + offset;
     recv_fwd[i] = static_cast<char*>(total_recv) + offset;
     offset += bytes[i];
     if (fine_grained_memcpy) {
       qudaMemcpy(send_back[i], sendbuf[2*i + 0], bytes[i], cudaMemcpyDeviceToHost);
       qudaMemcpy(send_fwd[i],  sendbuf[2*i + 1], bytes[i], cudaMemcpyDeviceToHost);
     }
   } else if (no_comms_fill) {
     qudaMemcpy(ghost[2*i+1], sendbuf[2*i+0], bytes[i], cudaMemcpyDeviceToDevice);
     qudaMemcpy(ghost[2*i+0], sendbuf[2*i+1], bytes[i], cudaMemcpyDeviceToDevice);
   }
       }
       if (!fine_grained_memcpy && total_bytes) {
   // find first non-zero pointer
   void *send_ptr = nullptr;
   for (int i=0; i<nDimComms; i++) {
     if (comm_dim_partitioned(i)) {
       send_ptr = sendbuf[2*i];
       break;
     }
   }
   qudaMemcpy(total_send, send_ptr, total_bytes, cudaMemcpyDeviceToHost);
       }
     }

     for (int i=0; i<nDimComms; i++) {
       if (!comm_dim_partitioned(i)) continue;
       mh_send_fwd[i] = comm_declare_send_relative(send_fwd[i], i, +1, bytes[i]);
       mh_send_back[i] = comm_declare_send_relative(send_back[i], i, -1, bytes[i]);
       mh_from_fwd[i] = comm_declare_receive_relative(recv_fwd[i], i, +1, bytes[i]);
       mh_from_back[i] = comm_declare_receive_relative(recv_back[i], i, -1, bytes[i]);
     }

     for (int i=0; i<nDimComms; i++) {
       if (comm_dim_partitioned(i)) {
   comm_start(mh_from_back[i]);
   comm_start(mh_from_fwd[i]);
   comm_start(mh_send_fwd[i]);
   comm_start(mh_send_back[i]);
       }
     }

     for (int i=0; i<nDimComms; i++) {
       if (!comm_dim_partitioned(i)) continue;
       comm_wait(mh_send_fwd[i]);
       comm_wait(mh_send_back[i]);
       comm_wait(mh_from_back[i]);
       comm_wait(mh_from_fwd[i]);
     }

     if (Location() == QUDA_CUDA_FIELD_LOCATION) {
       for (int i=0; i<nDimComms; i++) {
   if (!comm_dim_partitioned(i)) continue;
   if (fine_grained_memcpy) {
     qudaMemcpy(ghost[2*i+0], recv_back[i], bytes[i], cudaMemcpyHostToDevice);
     qudaMemcpy(ghost[2*i+1], recv_fwd[i], bytes[i], cudaMemcpyHostToDevice);
   }
       }

       if (!fine_grained_memcpy && total_bytes) {
   // find first non-zero pointer
   void *ghost_ptr = nullptr;
   for (int i=0; i<nDimComms; i++) {
     if (comm_dim_partitioned(i)) {
       ghost_ptr = ghost[2*i];
       break;
     }
   }
   qudaMemcpy(ghost_ptr, total_recv, total_bytes, cudaMemcpyHostToDevice);
       }

       if (total_bytes) {
   pool_pinned_free(total_send);
   pool_pinned_free(total_recv);
       }
     }

     for (int i=0; i<nDimComms; i++) {
       if (!comm_dim_partitioned(i)) continue;
       comm_free(mh_send_fwd[i]);
       comm_free(mh_send_back[i]);
       comm_free(mh_from_back[i]);
       comm_free(mh_from_fwd[i]);
     }
   }

   bool ColorSpinorField::isNative() const {
     if (precision == QUDA_DOUBLE_PRECISION) {
       if (fieldOrder  == QUDA_FLOAT2_FIELD_ORDER) return true;
     } else if (precision == QUDA_SINGLE_PRECISION ||
          precision == QUDA_HALF_PRECISION) {
       if (nSpin == 4) {
   if (fieldOrder == QUDA_FLOAT4_FIELD_ORDER) return true;
       } else if (nSpin == 2) {
   if (fieldOrder == QUDA_FLOAT2_FIELD_ORDER) return true;
       } else if (nSpin == 1) {
   if (fieldOrder == QUDA_FLOAT2_FIELD_ORDER) return true;
       }
     }
     return false;
   }

   // For kernels with precision conversion built in
   void ColorSpinorField::checkField(const ColorSpinorField &a, const ColorSpinorField &b) {
     if (a.Length() != b.Length()) {
       errorQuda("checkSpinor: lengths do not match: %lu %lu", a.Length(), b.Length());
     }

     if (a.Ncolor() != b.Ncolor()) {
       errorQuda("checkSpinor: colors do not match: %d %d", a.Ncolor(), b.Ncolor());
     }

     if (a.Nspin() != b.Nspin()) {
       errorQuda("checkSpinor: spins do not match: %d %d", a.Nspin(), b.Nspin());
     }

     if (a.TwistFlavor() != b.TwistFlavor()) {
       errorQuda("checkSpinor: twist flavors do not match: %d %d", a.TwistFlavor(), b.TwistFlavor());
     }
   }

   const ColorSpinorField& ColorSpinorField::Even() const {
     if (siteSubset != QUDA_FULL_SITE_SUBSET)
       errorQuda("Cannot return even subset of %d subset", siteSubset);
     if (fieldOrder == QUDA_QDPJIT_FIELD_ORDER)
       errorQuda("Cannot return even subset of QDPJIT field");
     return *even;
   }

   const ColorSpinorField& ColorSpinorField::Odd() const {
     if (siteSubset != QUDA_FULL_SITE_SUBSET)
       errorQuda("Cannot return odd subset of %d subset", siteSubset);
     if (fieldOrder == QUDA_QDPJIT_FIELD_ORDER)
       errorQuda("Cannot return even subset of QDPJIT field");
     return *odd;
   }

   ColorSpinorField& ColorSpinorField::Even() {
     if (siteSubset != QUDA_FULL_SITE_SUBSET)
       errorQuda("Cannot return even subset of %d subset", siteSubset);
     if (fieldOrder == QUDA_QDPJIT_FIELD_ORDER)
       errorQuda("Cannot return even subset of QDPJIT field");
     return *even;
   }

   ColorSpinorField& ColorSpinorField::Odd() {
     if (siteSubset != QUDA_FULL_SITE_SUBSET)
       errorQuda("Cannot return odd subset of %d subset", siteSubset);
     if (fieldOrder == QUDA_QDPJIT_FIELD_ORDER)
       errorQuda("Cannot return even subset of QDPJIT field");
     return *odd;
   }

   ColorSpinorField& ColorSpinorField::Component(const int idx) {
     if (this->IsComposite()) {
       if (idx < this->CompositeDim()) {  //  setup eigenvector form the set
         return *(dynamic_cast<ColorSpinorField*>(components[idx]));
       }
       else{
         errorQuda("Incorrect component index...");
       }
     }
     errorQuda("Cannot get requested component");
     exit(-1);
   }

   ColorSpinorField& ColorSpinorField::Component(const int idx) const {
     if (this->IsComposite()) {
       if (idx < this->CompositeDim()) {  //  setup eigenvector form the set
         return *(dynamic_cast<ColorSpinorField*>(components[idx]));
       }
       else{
         errorQuda("Incorrect component index...");
       }
     }
     errorQuda("Cannot get requested component");
     exit(-1);
   }


   void* ColorSpinorField::Ghost(const int i) {
     if(siteSubset != QUDA_PARITY_SITE_SUBSET) errorQuda("Site Subset %d is not supported",siteSubset);
     return ghost[i];
   }

   const void* ColorSpinorField::Ghost(const int i) const {
     if(siteSubset != QUDA_PARITY_SITE_SUBSET) errorQuda("Site Subset %d is not supported",siteSubset);
     return ghost[i];
   }


   void* ColorSpinorField::GhostNorm(const int i){
     if(siteSubset != QUDA_PARITY_SITE_SUBSET) errorQuda("Site Subset %d is not supported",siteSubset);
     return ghostNorm[i];
   }

   const void* ColorSpinorField::GhostNorm(const int i) const{
     if(siteSubset != QUDA_PARITY_SITE_SUBSET) errorQuda("Site Subset %d is not supported",siteSubset);
     return ghostNorm[i];
   }

   void* const* ColorSpinorField::Ghost() const {
     return ghost_buf;
   }

   /*
     Convert from 1-dimensional index to the n-dimensional spatial index.
     With full fields, we assume that the field is even-odd ordered.  The
     lattice coordinates that are computed here are full-field
     coordinates.
   */
   void ColorSpinorField::LatticeIndex(int *y, int i) const {
     int z[QUDA_MAX_DIM];
     memcpy(z, x, QUDA_MAX_DIM*sizeof(int));

     // parity is the slowest running dimension
     int parity = 0;
     if (siteSubset == QUDA_FULL_SITE_SUBSET) z[0] /= 2;

     for (int d=0; d<nDim; d++) {
       y[d] = i % z[d];
       i /= z[d];
     }

     parity = i;

     // convert into the full-field lattice coordinate
     int oddBit = parity;
     if (siteSubset == QUDA_FULL_SITE_SUBSET) {
       for (int d=1; d<nDim; d++) oddBit += y[d];
       oddBit = oddBit & 1;
     }
     y[0] = 2*y[0] + oddBit;  // compute the full x coordinate
   }

   /*
     Convert from n-dimensional spatial index to the 1-dimensional index.
     With full fields, we assume that the field is even-odd ordered.  The
     input lattice coordinates are always full-field coordinates.
   */
   void ColorSpinorField::OffsetIndex(int &i, int *y) const {

     int parity = 0;
     int z[QUDA_MAX_DIM];
     memcpy(z, x, QUDA_MAX_DIM*sizeof(int));
     int savey0 = y[0];

     if (siteSubset == QUDA_FULL_SITE_SUBSET) {
       for (int d=0; d<nDim; d++) parity += y[d];
       parity = parity & 1;
       y[0] /= 2;
       z[0] /= 2;
     }

     i = parity;
     for (int d=nDim-1; d>=0; d--) {
       i = z[d]*i + y[d];
       //printf("z[%d]=%d y[%d]=%d ", d, z[d], d, y[d]);
     }

     //printf("\nparity = %d\n", parity);

     if (siteSubset == QUDA_FULL_SITE_SUBSET) y[0] = savey0;
   }

   ColorSpinorField* ColorSpinorField::Create(const ColorSpinorParam &param) {

     ColorSpinorField *field = NULL;
     if (param.location == QUDA_CPU_FIELD_LOCATION) {
       field = new cpuColorSpinorField(param);
     } else if (param.location== QUDA_CUDA_FIELD_LOCATION) {
       field = new cudaColorSpinorField(param);
     } else {
       errorQuda("Invalid field location %d", param.location);
     }

     return field;
   }

   ColorSpinorField* ColorSpinorField::Create(const ColorSpinorField &src, const ColorSpinorParam &param) {

     ColorSpinorField *field = NULL;
     if (param.location == QUDA_CPU_FIELD_LOCATION) {
       field = new cpuColorSpinorField(src, param);
     } else if (param.location== QUDA_CUDA_FIELD_LOCATION) {
       field = new cudaColorSpinorField(src, param);
     } else {
       errorQuda("Invalid field location %d", param.location);
     }

     return field;
   }

   ColorSpinorField* ColorSpinorField::CreateCoarse(const int *geoBlockSize, int spinBlockSize, int Nvec,
                QudaFieldLocation new_location) {
     ColorSpinorParam coarseParam(*this);
     for (int d=0; d<nDim; d++) coarseParam.x[d] = x[d]/geoBlockSize[d];
     coarseParam.nSpin = nSpin / spinBlockSize; //for staggered coarseParam.nSpin = nSpin

     coarseParam.nColor = Nvec;
     coarseParam.siteSubset = QUDA_FULL_SITE_SUBSET; // coarse grid is always full
     coarseParam.create = QUDA_ZERO_FIELD_CREATE;

     // if new location is not set, use this->location
     new_location = (new_location == QUDA_INVALID_FIELD_LOCATION) ? Location(): new_location;

     // for GPU fields, always use native ordering to ensure coalescing
     if (new_location == QUDA_CUDA_FIELD_LOCATION) coarseParam.fieldOrder = QUDA_FLOAT2_FIELD_ORDER;

     ColorSpinorField *coarse = NULL;
     if (new_location == QUDA_CPU_FIELD_LOCATION) {
       coarse = new cpuColorSpinorField(coarseParam);
     } else if (new_location== QUDA_CUDA_FIELD_LOCATION) {
       coarse = new cudaColorSpinorField(coarseParam);
     } else {
       errorQuda("Invalid field location %d", new_location);
     }

     return coarse;
   }

   ColorSpinorField* ColorSpinorField::CreateFine(const int *geoBlockSize, int spinBlockSize, int Nvec,
              QudaFieldLocation new_location) {
     ColorSpinorParam fineParam(*this);
     for (int d=0; d<nDim; d++) fineParam.x[d] = x[d] * geoBlockSize[d];
     fineParam.nSpin = nSpin * spinBlockSize;
     fineParam.nColor = Nvec;
     fineParam.siteSubset = QUDA_FULL_SITE_SUBSET; // FIXME fine grid is always full
     fineParam.create = QUDA_ZERO_FIELD_CREATE;

     // if new location is not set, use this->location
     new_location = (new_location == QUDA_INVALID_FIELD_LOCATION) ? Location(): new_location;

     // for GPU fields, always use native ordering to ensure coalescing
     if (new_location == QUDA_CUDA_FIELD_LOCATION) {
       fineParam.fieldOrder = (fineParam.nSpin==4 && fineParam.precision!= QUDA_DOUBLE_PRECISION) ?
   QUDA_FLOAT4_FIELD_ORDER : QUDA_FLOAT2_FIELD_ORDER;
     }

     ColorSpinorField *fine = NULL;
     if (new_location == QUDA_CPU_FIELD_LOCATION) {
       fine = new cpuColorSpinorField(fineParam);
     } else if (new_location == QUDA_CUDA_FIELD_LOCATION) {
       fine = new cudaColorSpinorField(fineParam);
     } else {
       errorQuda("Invalid field location %d", new_location);
     }
     return fine;
   }

   std::ostream& operator<<(std::ostream &out, const ColorSpinorField &a) {
     out << "typedid = " << typeid(a).name() << std::endl;
     out << "nColor = " << a.nColor << std::endl;
     out << "nSpin = " << a.nSpin << std::endl;
     out << "twistFlavor = " << a.twistFlavor << std::endl;
     out << "nDim = " << a.nDim << std::endl;
     for (int d=0; d<a.nDim; d++) out << "x[" << d << "] = " << a.x[d] << std::endl;
     out << "volume = " << a.volume << std::endl;
     out << "precision = " << a.precision << std::endl;
     out << "pad = " << a.pad << std::endl;
     out << "stride = " << a.stride << std::endl;
     out << "real_length = " << a.real_length << std::endl;
     out << "length = " << a.length << std::endl;
     out << "bytes = " << a.bytes << std::endl;
     out << "norm_bytes = " << a.norm_bytes << std::endl;
     out << "siteSubset = " << a.siteSubset << std::endl;
     out << "siteOrder = " << a.siteOrder << std::endl;
     out << "fieldOrder = " << a.fieldOrder << std::endl;
     out << "gammaBasis = " << a.gammaBasis << std::endl;
     out << "Is composite = " << a.composite_descr.is_composite << std::endl;
     if(a.composite_descr.is_composite)
     {
       out << "Composite Dim = " << a.composite_descr.dim << std::endl;
       out << "Composite Volume = " << a.composite_descr.volume << std::endl;
       out << "Composite Stride = " << a.composite_descr.stride << std::endl;
       out << "Composite Length = " << a.composite_descr.length << std::endl;
     }
     out << "Is component = " << a.composite_descr.is_component << std::endl;
     if(a.composite_descr.is_composite) out << "Component ID = " << a.composite_descr.id << std::endl;
     out << "PC type = " << a.PCtype << std::endl;
     return out;
   }

 } // namespace quda
quda::ColorSpinorField::bytes
size_t bytes
Definition: color_spinor_field.h:319

qudaMemcpy
#define qudaMemcpy(dst, src, count, kind)
Definition: quda_cuda_api.h:32

quda::DslashConstant::face_Z
int_fastdiv face_Z[4]
Definition: color_spinor_field.h:253

quda::ColorSpinorField::components
CompositeColorSpinorField components
Definition: color_spinor_field.h:334

quda::ColorSpinorField::OffsetIndex
void OffsetIndex(int &i, int *y) const
Definition: color_spinor_field.cpp:723

quda::DslashConstant::X3X2X1
int X3X2X1
Definition: color_spinor_field.h:262

quda::ColorSpinorField::fieldOrder
QudaFieldOrder fieldOrder
Definition: color_spinor_field.h:324

pool_pinned_free
#define pool_pinned_free(ptr)
Definition: malloc_quda.h:116

quda::DslashConstant::face_T
int_fastdiv face_T[4]
Definition: color_spinor_field.h:254

quda::LatticeField::ghostNormOffset
int ghostNormOffset[QUDA_MAX_DIM][2]
Definition: lattice_field.h:221

QudaPrecision
enum QudaPrecision_s QudaPrecision

quda::ColorSpinorField::volume
int volume
Definition: color_spinor_field.h:290

quda::ColorSpinorField::nColor
int nColor
Definition: color_spinor_field.h:284

quda::DslashConstant::X2X1
int X2X1
Definition: color_spinor_field.h:261

snprintf
int snprintf(char *__str, size_t __size, const char *__format,...) __attribute__((__format__(__printf__

quda::ColorSpinorField
Definition: color_spinor_field.h:271

quda::blas::aux_tmp
char aux_tmp[TuneKey::aux_n]
Definition: blas_quda.cu:58

quda::ColorSpinorField::IsComposite
bool IsComposite() const
Definition: color_spinor_field.h:419

quda::ColorSpinorField::Pad
int Pad() const
Definition: color_spinor_field.h:371

quda::ColorSpinorField::ghostNorm
void * ghostNorm[2][QUDA_MAX_DIM]
Definition: color_spinor_field.h:311

quda::norm
__host__ __device__ ValueType norm(const complex< ValueType > &z)
Returns the magnitude of z squared.
Definition: complex_quda.h:896

quda::ColorSpinorField::ghostFace
int ghostFace[QUDA_MAX_DIM]
Definition: color_spinor_field.h:313

QUDA_TWIST_INVALID
Definition: enum_quda.h:371

quda::LatticeField::total_bytes
size_t total_bytes
Definition: lattice_field.h:134

quda::ColorSpinorParam::nColor
int nColor
Definition: color_spinor_field.h:85

getVerbosity
QudaVerbosity getVerbosity()
Definition: util_quda.cpp:20

QUDA_INVALID_PRECISION
Definition: enum_quda.h:62

quda::ColorSpinorField::PCtype
QudaDWFPCType PCtype
Definition: color_spinor_field.h:297

quda::CompositeColorSpinorFieldDescriptor::volume
int volume
Definition: color_spinor_field.h:37

src
const void * src
Definition: CMakeCUDACompilerId.cpp1.ii:2290

errorQuda
#define errorQuda(...)
Definition: util_quda.h:90

color_spinor_field.h

quda::blas::init
void init()
Definition: blas_quda.cu:64

QUDA_CUDA_FIELD_LOCATION
Definition: enum_quda.h:297

QUDA_HALF_PRECISION
Definition: enum_quda.h:59

quda::CompositeColorSpinorFieldDescriptor::stride
int stride
Definition: color_spinor_field.h:39

QudaFieldOrder
enum QudaFieldOrder_s QudaFieldOrder

quda::ColorSpinorField::pad
int pad
Definition: color_spinor_field.h:292

quda::ColorSpinorField::composite_descr
CompositeColorSpinorFieldDescriptor composite_descr
used for deflation eigenvector sets etc.:
Definition: color_spinor_field.h:332

quda::CompositeColorSpinorFieldDescriptor::volumeCB
int volumeCB
Definition: color_spinor_field.h:38

quda::ColorSpinorField::~ColorSpinorField
virtual ~ColorSpinorField()
Definition: color_spinor_field.cpp:39

quda::CompositeColorSpinorFieldDescriptor::dim
int dim
Definition: color_spinor_field.h:34

quda::ColorSpinorField::destroy
void destroy()
Definition: color_spinor_field.cpp:285

dim
static __inline__ dim3 dim3 void size_t cudaStream_t int dim
Definition: CMakeCUDACompilerId.cpp1.ii:15687

QUDA_FULL_SITE_SUBSET
Definition: enum_quda.h:304

quda::LatticeField::nDimComms
int nDimComms
Definition: lattice_field.h:160

quda::ColorSpinorField::Even
const ColorSpinorField & Even() const
Definition: color_spinor_field.cpp:604

QudaSiteOrder
enum QudaSiteOrder_s QudaSiteOrder

quda::ColorSpinorField::Odd
const ColorSpinorField & Odd() const
Definition: color_spinor_field.cpp:612

quda::ColorSpinorField::Create
static ColorSpinorField * Create(const ColorSpinorParam &param)
Definition: color_spinor_field.cpp:748

quda::ColorSpinorField::gammaBasis
QudaGammaBasis gammaBasis
Definition: color_spinor_field.h:325

strcpy
char * strcpy(char *__dst, const char *__src)

z
int int z
Definition: CMakeCUDACompilerId.cpp1.ii:2637

quda::DslashConstant::face_X
int_fastdiv face_X[4]
Definition: color_spinor_field.h:251

quda::ColorSpinorField::CreateFine
ColorSpinorField * CreateFine(const int *geoblockSize, int spinBlockSize, int Nvec, QudaFieldLocation location=QUDA_INVALID_FIELD_LOCATION)
Definition: color_spinor_field.cpp:804

quda::LatticeFieldParam::precision
QudaPrecision precision
Definition: lattice_field.h:54

quda::ColorSpinorField::dslash_constant
DslashConstant dslash_constant
Definition: color_spinor_field.h:317

quda::cudaColorSpinorField
Definition: color_spinor_field.h:504

quda::DslashConstant::volume_4d
int volume_4d
Definition: color_spinor_field.h:248

quda::ColorSpinorField::Component
ColorSpinorField & Component(const int idx) const
Definition: color_spinor_field.cpp:649

QUDA_TWIST_NONDEG_DOUBLET
Definition: enum_quda.h:368

quda::ColorSpinorField::Ndim
int Ndim() const
Definition: color_spinor_field.h:363

quda::DslashConstant::X2X1mX1
int X2X1mX1
Definition: color_spinor_field.h:263

QUDA_INVALID_SITE_SUBSET
Definition: enum_quda.h:305

quda::ColorSpinorField::length
size_t length
Definition: color_spinor_field.h:300

quda::DslashConstant::dims
int_fastdiv dims[4][3]
Definition: color_spinor_field.h:268

quda::ColorSpinorField::real_length
size_t real_length
Definition: color_spinor_field.h:299

quda
Definition: blas_cublas.h:6

quda::LatticeFieldParam::siteSubset
QudaSiteSubset siteSubset
Definition: lattice_field.h:55

quda::DslashConstant::X4X3X2X1hmX3X2X1h
int X4X3X2X1hmX3X2X1h
Definition: color_spinor_field.h:266

exit
void exit(int) __attribute__((noreturn))

quda::ColorSpinorField::ColorSpinorField
ColorSpinorField(const ColorSpinorField &)
Definition: color_spinor_field.cpp:28

quda::ColorSpinorField::volumeCB
int volumeCB
Definition: color_spinor_field.h:291

quda::operator<<
std::ostream & operator<<(std::ostream &output, const CloverFieldParam &param)
Definition: clover_field.cpp:404

quda::DslashConstant::face_Y
int_fastdiv face_Y[4]
Definition: color_spinor_field.h:252

quda::CompositeColorSpinorFieldDescriptor::bytes
size_t bytes
Definition: color_spinor_field.h:43

offset
size_t size_t offset
Definition: CMakeCUDACompilerId.cpp1.ii:2497

param
QudaGaugeParam param
Definition: pack_test.cpp:17

b
#define b
Definition: dw_dslash4_core.h:83

comm_free
void comm_free(MsgHandle *mh)
Definition: comm_mpi.cpp:252

QUDA_TWIST_DEG_DOUBLET
Definition: enum_quda.h:369

quda::DslashConstant::Xh
int_fastdiv Xh[QUDA_MAX_DIM]
Definition: color_spinor_field.h:245

quda::LatticeFieldParam::x
int x[QUDA_MAX_DIM]
Definition: lattice_field.h:50

quda::ColorSpinorField::nDim
int nDim
Definition: color_spinor_field.h:287

QudaDWFPCType
enum QudaDWFPCType_s QudaDWFPCType

quda::ColorSpinorField::odd
ColorSpinorField * odd
Definition: color_spinor_field.h:329

QUDA_PC_INVALID
Definition: enum_quda.h:363

quda::DslashConstant::X
int_fastdiv X[QUDA_MAX_DIM]
Definition: color_spinor_field.h:244

comm_declare_send_relative
#define comm_declare_send_relative(buffer, dim, dir, nbytes)
Definition: comm_quda.h:59

quda::ColorSpinorField::checkField
static void checkField(const ColorSpinorField &, const ColorSpinorField &)
Definition: color_spinor_field.cpp:586

comm_declare_receive_relative
#define comm_declare_receive_relative(buffer, dim, dir, nbytes)
Definition: comm_quda.h:74

quda::ColorSpinorField::create
void create(int nDim, const int *x, int Nc, int Ns, QudaTwistFlavorType Twistflavor, QudaPrecision precision, int pad, QudaSiteSubset subset, QudaSiteOrder siteOrder, QudaFieldOrder fieldOrder, QudaGammaBasis gammaBasis, QudaDWFPCType PCtype)
Definition: color_spinor_field.cpp:173

quda::ColorSpinorField::exchange
void exchange(void **ghost, void **sendbuf, int nFace=1) const
Definition: color_spinor_field.cpp:428

quda::ColorSpinorField::reset
void reset(const ColorSpinorParam &)
Definition: color_spinor_field.cpp:312

quda::ColorSpinorParam::fieldOrder
QudaFieldOrder fieldOrder
Definition: color_spinor_field.h:92

QUDA_INVALID_GAMMA_BASIS
Definition: enum_quda.h:341

quda::DslashConstant::face_XYZT
int_fastdiv face_XYZT[4]
Definition: color_spinor_field.h:257

ALIGNMENT_ADJUST
#define ALIGNMENT_ADJUST(n)
Definition: quda_internal.h:32

quda::LatticeField
Definition: lattice_field.h:122

QUDA_QDPJIT_FIELD_ORDER
Definition: enum_quda.h:323

quda::ColorSpinorField::GhostNorm
void * GhostNorm(const int i)
Definition: color_spinor_field.cpp:674

quda::ColorSpinorField::x
int x[QUDA_MAX_DIM]
Definition: color_spinor_field.h:288

quda::ColorSpinorField::setTuningString
void setTuningString()
Definition: color_spinor_field.cpp:261

QUDA_INVALID_FIELD_LOCATION
Definition: enum_quda.h:298

comm_start
void comm_start(MsgHandle *mh)
Definition: comm_mpi.cpp:260

fused_exterior_ndeg_tm_dslash_cuda_gen.i
int i
start here
Definition: fused_exterior_ndeg_tm_dslash_cuda_gen.py:816

QUDA_INVALID_FIELD_CREATE
Definition: enum_quda.h:334

quda::ColorSpinorField::ghost
void * ghost[2][QUDA_MAX_DIM]
Definition: color_spinor_field.h:310

quda::DslashConstant::Ls
int Ls
Definition: color_spinor_field.h:246

quda::ColorSpinorField::norm_bytes
size_t norm_bytes
Definition: color_spinor_field.h:320

QUDA_PARITY_SITE_SUBSET
Definition: enum_quda.h:303

quda::ColorSpinorField::CompositeDim
int CompositeDim() const
Definition: color_spinor_field.h:422

QUDA_FLOAT2_FIELD_ORDER
Definition: enum_quda.h:319

quda::LatticeField::ghost_bytes
size_t ghost_bytes
Definition: lattice_field.h:206

quda::CompositeColorSpinorFieldDescriptor::real_length
size_t real_length
Definition: color_spinor_field.h:40

quda::DslashConstant::X3X2X1mX2X1
int X3X2X1mX2X1
Definition: color_spinor_field.h:264

quda::CompositeColorSpinorFieldDescriptor::length
size_t length
Definition: color_spinor_field.h:41

size_t
long unsigned int size_t
Definition: CMakeCUDACompilerId.cpp1.ii:409

quda::LatticeField::vol_string
char vol_string[TuneKey::volume_n]
Definition: lattice_field.h:312

quda::LatticeField::ghost_face_bytes
size_t ghost_face_bytes[QUDA_MAX_DIM]
Definition: lattice_field.h:211

quda::ColorSpinorField::twistFlavor
QudaTwistFlavorType twistFlavor
Definition: color_spinor_field.h:295

memcpy
void * memcpy(void *__dst, const void *__src, size_t __n)

quda::ColorSpinorField::stride
int stride
Definition: color_spinor_field.h:293

quda::LatticeField::mh_send_fwd
MsgHandle * mh_send_fwd[2][QUDA_MAX_DIM]
Definition: lattice_field.h:258

quda::ColorSpinorField::GhostOffset
int GhostOffset(const int i) const
Definition: color_spinor_field.h:441

quda::ColorSpinorParam::ColorSpinorParam
ColorSpinorParam()
Definition: color_spinor_field.h:109

quda::CompositeColorSpinorFieldDescriptor::is_component
bool is_component
Definition: color_spinor_field.h:32

quda::ColorSpinorField::isNative
bool isNative() const
Definition: color_spinor_field.cpp:569

quda::DslashConstant::Vh
int Vh
Definition: color_spinor_field.h:243

quda::ColorSpinorField::operator=
virtual ColorSpinorField & operator=(const ColorSpinorField &)
Definition: color_spinor_field.cpp:289

QudaSiteSubset
enum QudaSiteSubset_s QudaSiteSubset

X
int X
Definition: asym_wilson_clover_dslash_dagger_fermi_core.h:394

quda::LatticeField::Location
QudaFieldLocation Location() const
Definition: lattice_field.cpp:522

quda::DslashConstant::X4X3X2X1mX3X2X1
int X4X3X2X1mX3X2X1
Definition: color_spinor_field.h:265

quda::DslashConstant::face_XY
int_fastdiv face_XY[4]
Definition: color_spinor_field.h:255

pool_pinned_malloc
#define pool_pinned_malloc(size)
Definition: malloc_quda.h:115

QUDA_DEBUG_VERBOSE
Definition: enum_quda.h:238

quda::ColorSpinorParam
Definition: color_spinor_field.h:80

quda::ColorSpinorField::CreateCoarse
ColorSpinorField * CreateCoarse(const int *geoblockSize, int spinBlockSize, int Nvec, QudaFieldLocation location=QUDA_INVALID_FIELD_LOCATION)
Definition: color_spinor_field.cpp:776

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:61

QudaFieldLocation
enum QudaFieldLocation_s QudaFieldLocation

quda::ColorSpinorField::aux_string
char aux_string[TuneKey::aux_n]
Definition: color_spinor_field.h:348

quda::ColorSpinorField::siteOrder
QudaSiteOrder siteOrder
Definition: color_spinor_field.h:323

QudaGaugeParam_s::location
QudaFieldLocation location
Definition: quda.h:27

quda::DslashConstant::volume_4d_cb
int volume_4d_cb
Definition: color_spinor_field.h:249

out
cpuColorSpinorField * out
Definition: staggered_invert_test.cpp:45

quda::LatticeField::ghostOffset
int ghostOffset[QUDA_MAX_DIM][2]
Definition: lattice_field.h:216

quda::ColorSpinorField::createGhostZone
void createGhostZone(int nFace, bool spin_project=true) const
Definition: color_spinor_field.cpp:43

idx
int idx
Definition: staggered_fused_exterior_dslash_core.h:355

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:60

QudaGammaBasis
enum QudaGammaBasis_s QudaGammaBasis

quda::ColorSpinorParam::nSpin
int nSpin
Definition: color_spinor_field.h:86

quda::CompositeColorSpinorFieldDescriptor::norm_bytes
size_t norm_bytes
Definition: color_spinor_field.h:44

quda::ColorSpinorField::fill
void fill(ColorSpinorParam &) const
Definition: color_spinor_field.cpp:405

quda::TuneKey::aux_n
static const int aux_n
Definition: tune_key.h:12

quda::DslashConstant::ghostFace
int ghostFace[QUDA_MAX_DIM+1]
Definition: color_spinor_field.h:259

printfQuda
#define printfQuda(...)
Definition: util_quda.h:84

QUDA_TWIST_NO
Definition: enum_quda.h:370

QUDA_INVALID_SITE_ORDER
Definition: enum_quda.h:313

quda::ColorSpinorField::LatticeIndex
void LatticeIndex(int *y, int i) const
Definition: color_spinor_field.cpp:694

quda::LatticeField::Nvec
int Nvec() const
Definition: lattice_field.cpp:546

quda::LatticeField::surfaceCB
int surfaceCB[QUDA_MAX_DIM]
Definition: lattice_field.h:143

quda::ColorSpinorField::X
const int * X() const
Definition: color_spinor_field.h:364

quda::ColorSpinorField::Ghost
void *const  * Ghost() const
Definition: color_spinor_field.cpp:684

QUDA_MAX_DIM
#define QUDA_MAX_DIM
Maximum number of dimensions supported by QUDA. In practice, no routines make use of more than 5...
Definition: quda_constants.h:17

QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:331

float
float
Definition: CMakeCUDACompilerId.cpp1.ii:12791

quda::DslashConstant::face_XYZ
int_fastdiv face_XYZ[4]
Definition: color_spinor_field.h:256

comm_wait
void comm_wait(MsgHandle *mh)
Definition: comm_mpi.cpp:266

QUDA_FLOAT4_FIELD_ORDER
Definition: enum_quda.h:320

quda::ColorSpinorParam::create
QudaFieldCreate create
Definition: color_spinor_field.h:94

quda::ColorSpinorField::init_ghost_zone
bool init_ghost_zone
Definition: color_spinor_field.h:282

quda::TuneKey::volume_n
static const int volume_n
Definition: tune_key.h:10

quda::CompositeColorSpinorFieldDescriptor::id
int id
Definition: color_spinor_field.h:35

quda::ColorSpinorField::nSpin
int nSpin
Definition: color_spinor_field.h:285

quda::ColorSpinorField::ghost_buf
void * ghost_buf[2 *QUDA_MAX_DIM]
Definition: color_spinor_field.h:315

QUDA_INVALID_FIELD_ORDER
Definition: enum_quda.h:326

d
static __inline__ size_t size_t d
Definition: CMakeCUDACompilerId.cpp1.ii:3019

quda::CompositeColorSpinorFieldDescriptor::is_composite
bool is_composite
Definition: color_spinor_field.h:31

quda::ColorSpinorField::siteSubset
QudaSiteSubset siteSubset
Definition: color_spinor_field.h:322

parity
QudaParity parity
Definition: covdev_test.cpp:53

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:296

quda::LatticeField::precision
QudaPrecision precision
Definition: lattice_field.h:149

quda::LatticeField::mh_send_back
MsgHandle * mh_send_back[2][QUDA_MAX_DIM]
Definition: lattice_field.h:261

a
#define a
Definition: dw_dslash4_core.h:82

quda::ColorSpinorField::FieldOrder
QudaFieldOrder FieldOrder() const
Definition: color_spinor_field.h:437

quda::ColorSpinorField::even
ColorSpinorField * even
Definition: color_spinor_field.h:328

MsgHandle_s
Definition: comm_mpi.cpp:22

quda::blas::bytes
unsigned long long bytes
Definition: blas_quda.cu:43

quda::cpuColorSpinorField
Definition: color_spinor_field.h:789

comm_dim_partitioned
int comm_dim_partitioned(int dim)
Definition: comm_common.cpp:597

quda::ColorSpinorField::init
bool init
Definition: color_spinor_field.h:281

y
int y
Definition: CMakeCUDACompilerId.cpp1.ii:2637

QudaTwistFlavorType
enum QudaTwistFlavorType_s QudaTwistFlavorType