quda-ref/v1.0.0/eigensolve__quda_8cpp_source.html

 #include <stdio.h>
 #include <stdlib.h>
 #include <math.h>
 #include <iostream>
 #include <vector>
 #include <algorithm>

 #include <quda_internal.h>
 #include <eigensolve_quda.h>
 #include <qio_field.h>
 #include <color_spinor_field.h>
 #include <blas_quda.h>
 #include <util_quda.h>

 #include <Eigen/Eigenvalues>
 #include <Eigen/Dense>

 bool flags = true;

 namespace quda
 {

   using namespace Eigen;

   // Eigensolver class
   //-----------------------------------------------------------------------------
   EigenSolver::EigenSolver(QudaEigParam *eig_param, TimeProfile &profile) :
     eig_param(eig_param),
     profile(profile),
     tmp1(nullptr),
     tmp2(nullptr)
   {
     profile.TPSTART(QUDA_PROFILE_INIT);

     // Problem parameters
     nEv = eig_param->nEv;
     nKr = eig_param->nKr;
     nConv = eig_param->nConv;
     tol = eig_param->tol;
     reverse = false;

     // Algorithm variables
     converged = false;
     restart_iter = 0;
     max_restarts = eig_param->max_restarts;
     check_interval = eig_param->check_interval;
     iter = 0;
     iter_converged = 0;
     iter_locked = 0;
     iter_keep = 0;
     num_converged = 0;
     num_locked = 0;
     num_keep = 0;

     // Sanity checks
     if (nKr <= nEv) errorQuda("nKr=%d is less than or equal to nEv=%d\n", nKr, nEv);
     if (nEv < nConv) errorQuda("nConv=%d is greater than nEv=%d\n", nConv, nEv);
     if (nEv == 0) errorQuda("nEv=0 passed to Eigensolver\n");
     if (nKr == 0) errorQuda("nKr=0 passed to Eigensolver\n");
     if (nConv == 0) errorQuda("nConv=0 passed to Eigensolver\n");

     residua = (double *)safe_malloc(nKr * sizeof(double));
     for (int i = 0; i < nKr; i++) { residua[i] = 0.0; }

     // Quda MultiBLAS friendly array
     Qmat = (Complex *)safe_malloc(nEv * nKr * sizeof(Complex));

     // Part of the spectrum to be computed.
     switch (eig_param->spectrum) {
     case QUDA_SPECTRUM_SR_EIG: strcpy(spectrum, "SR"); break;
     case QUDA_SPECTRUM_LR_EIG: strcpy(spectrum, "LR"); break;
     case QUDA_SPECTRUM_SM_EIG: strcpy(spectrum, "SM"); break;
     case QUDA_SPECTRUM_LM_EIG: strcpy(spectrum, "LM"); break;
     case QUDA_SPECTRUM_SI_EIG: strcpy(spectrum, "SI"); break;
     case QUDA_SPECTRUM_LI_EIG: strcpy(spectrum, "LI"); break;
     default: errorQuda("Unexpected spectrum type %d", eig_param->spectrum);
     }

     // Deduce whether to reverse the sorting
     if (strncmp("L", spectrum, 1) == 0 && !eig_param->use_poly_acc) {
       reverse = true;
     } else if (strncmp("S", spectrum, 1) == 0 && eig_param->use_poly_acc) {
       reverse = true;
       spectrum[0] = 'L';
     } else if (strncmp("L", spectrum, 1) == 0 && eig_param->use_poly_acc) {
       reverse = true;
       spectrum[0] = 'S';
     }

     // Print Eigensolver params
     if (getVerbosity() >= QUDA_VERBOSE) {
       printfQuda("spectrum %s\n", spectrum);
       printfQuda("tol %.4e\n", tol);
       printfQuda("nConv %d\n", nConv);
       printfQuda("nEv %d\n", nEv);
       printfQuda("nKr %d\n", nKr);
       if (eig_param->use_poly_acc) {
         printfQuda("polyDeg %d\n", eig_param->poly_deg);
         printfQuda("a-min %f\n", eig_param->a_min);
         printfQuda("a-max %f\n", eig_param->a_max);
       }
     }

     profile.TPSTOP(QUDA_PROFILE_INIT);
   }

   // We bake the matrix operator 'mat' and the eigensolver parameters into the
   // eigensolver.
   EigenSolver *EigenSolver::create(QudaEigParam *eig_param, const DiracMatrix &mat, TimeProfile &profile)
   {
     EigenSolver *eig_solver = nullptr;

     switch (eig_param->eig_type) {
     case QUDA_EIG_IR_ARNOLDI: errorQuda("IR Arnoldi not implemented"); break;
     case QUDA_EIG_IR_LANCZOS: errorQuda("IR Lanczos not implemented"); break;
     case QUDA_EIG_TR_LANCZOS:
       if (getVerbosity() >= QUDA_SUMMARIZE) printfQuda("Creating TR Lanczos eigensolver\n");
       eig_solver = new TRLM(eig_param, mat, profile);
       break;
     default: errorQuda("Invalid eig solver type");
     }
     return eig_solver;
   }

   // Utilities and functions common to all Eigensolver instances
   //------------------------------------------------------------------------------

   void EigenSolver::matVec(const DiracMatrix &mat, ColorSpinorField &out, const ColorSpinorField &in)
   {
     if (!tmp1 || !tmp2) {
       ColorSpinorParam param(in);
       if (!tmp1) tmp1 = ColorSpinorField::Create(param);
       if (!tmp2) tmp2 = ColorSpinorField::Create(param);
     }
     mat(out, in, *tmp1, *tmp2);
   }

   void EigenSolver::chebyOp(const DiracMatrix &mat, ColorSpinorField &out, const ColorSpinorField &in)
   {
     // Just do a simple matVec if no poly acc is requested
     if (!eig_param->use_poly_acc) {
       matVec(mat, out, in);
       return;
     }

     if (eig_param->poly_deg == 0) { errorQuda("Polynomial acceleration requested with zero polynomial degree"); }

     // Compute the polynomial accelerated operator.
     double a = eig_param->a_min;
     double b = eig_param->a_max;
     double delta = (b - a) / 2.0;
     double theta = (b + a) / 2.0;
     double sigma1 = -delta / theta;
     double sigma;
     double d1 = sigma1 / delta;
     double d2 = 1.0;
     double d3;

     // out = d2 * in + d1 * out
     // C_1(x) = x
     matVec(mat, out, in);
     blas::caxpby(d2, const_cast<ColorSpinorField &>(in), d1, out);
     if (eig_param->poly_deg == 1) return;

     // C_0 is the current 'in'  vector.
     // C_1 is the current 'out' vector.

     // Clone 'in' to two temporary vectors.
     ColorSpinorField *tmp1 = ColorSpinorField::Create(in);
     ColorSpinorField *tmp2 = ColorSpinorField::Create(in);

     blas::copy(*tmp1, in);
     blas::copy(*tmp2, out);

     // Using Chebyshev polynomial recursion relation,
     // C_{m+1}(x) = 2*x*C_{m} - C_{m-1}

     double sigma_old = sigma1;

     // construct C_{m+1}(x)
     for (int i = 2; i < eig_param->poly_deg; i++) {
       sigma = 1.0 / (2.0 / sigma1 - sigma_old);

       d1 = 2.0 * sigma / delta;
       d2 = -d1 * theta;
       d3 = -sigma * sigma_old;

       // FIXME - we could introduce a fused matVec + blas kernel here, eliminating one temporary
       // mat*C_{m}(x)
       matVec(mat, out, *tmp2);

       Complex d1c(d1, 0.0);
       Complex d2c(d2, 0.0);
       Complex d3c(d3, 0.0);
       blas::caxpbypczw(d3c, *tmp1, d2c, *tmp2, d1c, out, *tmp1);
       std::swap(tmp1, tmp2);

       sigma_old = sigma;
     }
     blas::copy(out, *tmp2);

     delete tmp1;
     delete tmp2;
   }

   // Orthogonalise r against V_[j]
   Complex EigenSolver::blockOrthogonalize(std::vector<ColorSpinorField *> vecs, std::vector<ColorSpinorField *> rvec,
                                           int j)
   {
     Complex *s = (Complex *)safe_malloc((j + 1) * sizeof(Complex));
     Complex sum(0.0, 0.0);
     std::vector<ColorSpinorField *> vecs_ptr;
     for (int i = 0; i < j + 1; i++) { vecs_ptr.push_back(vecs[i]); }
     // Block dot products stored in s.
     blas::cDotProduct(s, vecs_ptr, rvec);

     // Block orthogonalise
     for (int i = 0; i < j + 1; i++) {
       sum += s[i];
       s[i] *= -1.0;
     }
     blas::caxpy(s, vecs_ptr, rvec);

     host_free(s);
     return sum;
   }

   // Deflate vec, place result in vec_defl
   void EigenSolver::deflate(std::vector<ColorSpinorField *> vec_defl, std::vector<ColorSpinorField *> vec,
                             std::vector<ColorSpinorField *> eig_vecs, std::vector<Complex> evals)
   {
     // number of evecs
     int n_defl = eig_param->nConv;

     if (getVerbosity() >= QUDA_VERBOSE) printfQuda("Deflating %d vectors\n", n_defl);

     // Perform Sum_i V_i * (L_i)^{-1} * (V_i)^dag * vec = vec_defl
     // for all i computed eigenvectors and values.

     // Pointers to the required Krylov space vectors,
     // no extra memory is allocated.
     std::vector<ColorSpinorField *> eig_vecs_ptr;
     for (int i = 0; i < n_defl; i++) eig_vecs_ptr.push_back(eig_vecs[i]);

     // 1. Take block inner product: (V_i)^dag * vec = A_i
     Complex *s = (Complex *)safe_malloc(n_defl * sizeof(Complex));
     blas::cDotProduct(s, eig_vecs_ptr, vec);

     // 2. Perform block caxpy: V_i * (L_i)^{-1} * A_i
     for (int i = 0; i < n_defl; i++) { s[i] /= evals[i].real(); }

     // 3. Accumulate sum vec_defl = Sum_i V_i * (L_i)^{-1} * A_i
     blas::zero(*vec_defl[0]);
     blas::caxpy(s, eig_vecs_ptr, vec_defl);
     // FIXME - we can optimize the zeroing out with a "multi-caxy"
     // function that just writes over vec_defl and doesn't sum.  When
     // we exceed the multi-blas limit this would deompose into caxy
     // for the kernel call and caxpy for the subsequent ones

     host_free(s);
   }

   void EigenSolver::computeSVD(const DiracMatrix &mat, std::vector<ColorSpinorField *> &evecs, std::vector<Complex> &evals)
   {

     if (getVerbosity() >= QUDA_SUMMARIZE) printfQuda("Computing SVD of M\n");

     int nConv = eig_param->nConv;
     if (evecs.size() != (unsigned int)(2 * nConv))
       errorQuda("Incorrect deflation space sized %d passed to computeSVD, expected %d", (int)(evecs.size()), 2 * nConv);

     Complex sigma_tmp[nConv];

     for (int i = 0; i < nConv; i++) {

       // This function assumes that you have computed the eigenvectors
       // of MdagM(MMdag), ie, the right(left) SVD of M. The ith eigen vector in the
       // array corresponds to the ith right(left) singular vector. We place the
       // computed left(right) singular vectors in the second half of the array. We
       // assume that right vectors are given and we compute the left.
       //
       // As a cross check, we recompute the singular values from mat vecs rather
       // than make the direct relation (sigma_i)^2 = |lambda_i|
       //--------------------------------------------------------------------------

       // Lambda already contains the square root of the eigenvalue of the norm op.
       Complex lambda = evals[i];

       // M*Rev_i = M*Rsv_i = sigma_i Lsv_i
       mat.Expose()->M(*evecs[nConv + i], *evecs[i]);

       // sigma_i = sqrt(sigma_i (Lsv_i)^dag * sigma_i * Lsv_i )
       Complex sigma_sq = blas::cDotProduct(*evecs[nConv + i], *evecs[nConv + i]);
       sigma_tmp[i] = Complex(sqrt(sigma_sq.real()), sqrt(abs(sigma_sq.imag())));

       // Normalise the Lsv: sigma_i Lsv_i -> Lsv_i
       double norm = sqrt(blas::norm2(*evecs[nConv + i]));
       blas::ax(1.0 / norm, *evecs[nConv + i]);

       if (getVerbosity() >= QUDA_SUMMARIZE)
         printfQuda("Sval[%04d] = %+.16e  %+.16e   sigma - sqrt(|lambda|) = %+.16e\n", i, sigma_tmp[i].real(),
                    sigma_tmp[i].imag(), sigma_tmp[i].real() - sqrt(abs(lambda.real())));
       evals[i] = sigma_tmp[i];
       //--------------------------------------------------------------------------
     }
   }

   // Deflate vec, place result in vec_defl
   void EigenSolver::deflateSVD(std::vector<ColorSpinorField *> vec_defl, std::vector<ColorSpinorField *> vec,
                                std::vector<ColorSpinorField *> eig_vecs, std::vector<Complex> evals)
   {
     // number of evecs
     int n_defl = eig_param->nConv;

     if (getVerbosity() >= QUDA_VERBOSE) printfQuda("Deflating %d left and %d right singular vectors\n", n_defl, n_defl);

     // Perform Sum_i R_i * (\sigma_i)^{-1} * L_i^dag * vec = vec_defl
     // for all i computed eigenvectors and values.

     // 1. Take block inner product: L_i^dag * vec = A_i
     std::vector<ColorSpinorField *> left_vecs_ptr;
     for (int i = n_defl; i < 2 * n_defl; i++) left_vecs_ptr.push_back(eig_vecs[i]);
     Complex *s = (Complex *)safe_malloc(n_defl * sizeof(Complex));
     blas::cDotProduct(s, left_vecs_ptr, vec);

     // 2. Perform block caxpy
     //    A_i -> (\sigma_i)^{-1} * A_i
     //    vec_defl = Sum_i (R_i)^{-1} * A_i
     blas::zero(*vec_defl[0]);
     std::vector<ColorSpinorField *> right_vecs_ptr;
     for (int i = 0; i < n_defl; i++) {
       right_vecs_ptr.push_back(eig_vecs[i]);
       s[i] /= evals[i].real();
     }
     blas::caxpy(s, right_vecs_ptr, vec_defl);

     // FIXME - we can optimize the zeroing out with a "multi-caxy"
     // function that just writes over vec_defl and doesn't sum.  When
     // we exceed the multi-blas limit this would deompose into caxy
     // for the kernel call and caxpy for the subsequent ones

     host_free(s);
   }

   void EigenSolver::computeEvals(const DiracMatrix &mat, std::vector<ColorSpinorField *> &evecs,
                                  std::vector<Complex> &evals, int size)
   {
     for (int i = 0; i < size; i++) {
       // r = A * v_i
       matVec(mat, *r[0], *evecs[i]);

       // lambda_i = v_i^dag A v_i / (v_i^dag * v_i)
       evals[i] = blas::cDotProduct(*evecs[i], *r[0]) / sqrt(blas::norm2(*evecs[i]));

       // Measure ||lambda_i*v_i - A*v_i||
       Complex n_unit(-1.0, 0.0);
       blas::caxpby(evals[i], *evecs[i], n_unit, *r[0]);
       residua[i] = sqrt(blas::norm2(*r[0]));
     }
   }

   void EigenSolver::loadVectors(std::vector<ColorSpinorField *> &eig_vecs, std::string vec_infile)
   {
     // profile.TPSTOP(QUDA_PROFILE_COMPUTE);
     // profile.TPSTART(QUDA_PROFILE_IO);

 #ifdef HAVE_QIO
     const int Nvec = eig_vecs.size();
     if (strcmp(vec_infile.c_str(), "") != 0) {
       if (getVerbosity() >= QUDA_SUMMARIZE)
         printfQuda("Start loading %04d vectors from %s\n", Nvec, vec_infile.c_str());

       std::vector<ColorSpinorField *> tmp;
       if (eig_vecs[0]->Location() == QUDA_CUDA_FIELD_LOCATION) {
         ColorSpinorParam csParam(*eig_vecs[0]);
         csParam.fieldOrder = QUDA_SPACE_SPIN_COLOR_FIELD_ORDER;
         csParam.setPrecision(eig_vecs[0]->Precision() < QUDA_SINGLE_PRECISION ? QUDA_SINGLE_PRECISION :
                                                                                 eig_vecs[0]->Precision());
         csParam.location = QUDA_CPU_FIELD_LOCATION;
         csParam.create = QUDA_NULL_FIELD_CREATE;
         for (int i = 0; i < Nvec; i++) { tmp.push_back(ColorSpinorField::Create(csParam)); }
       } else {
         for (int i = 0; i < Nvec; i++) { tmp.push_back(eig_vecs[i]); }
       }

       void **V = static_cast<void **>(safe_malloc(Nvec * sizeof(void *)));
       for (int i = 0; i < Nvec; i++) {
         V[i] = tmp[i]->V();
         if (V[i] == NULL) {
           if (getVerbosity() >= QUDA_SUMMARIZE) printfQuda("Could not allocate space for eigenVector[%d]\n", i);
         }
       }

       read_spinor_field(vec_infile.c_str(), &V[0], tmp[0]->Precision(), tmp[0]->X(), tmp[0]->Ncolor(), tmp[0]->Nspin(),
                         Nvec, 0, (char **)0);

       host_free(V);
       if (eig_vecs[0]->Location() == QUDA_CUDA_FIELD_LOCATION) {
         for (int i = 0; i < Nvec; i++) {
           *eig_vecs[i] = *tmp[i];
           delete tmp[i];
         }
       }

       if (getVerbosity() >= QUDA_SUMMARIZE) printfQuda("Done loading vectors\n");
     } else {
       errorQuda("No eigenspace input file defined.");
     }
 #else
     errorQuda("\nQIO library was not built.\n");
 #endif
     // profile.TPSTOP(QUDA_PROFILE_IO);
     // profile.TPSTART(QUDA_PROFILE_COMPUTE);
   }

   void EigenSolver::saveVectors(const std::vector<ColorSpinorField *> &eig_vecs, std::string vec_outfile)
   {
     // profile.TPSTOP(QUDA_PROFILE_COMPUTE);
     // profile.TPSTART(QUDA_PROFILE_IO);

 #ifdef HAVE_QIO
     const int Nvec = eig_vecs.size();
     std::vector<ColorSpinorField *> tmp;
     if (eig_vecs[0]->Location() == QUDA_CUDA_FIELD_LOCATION) {
       ColorSpinorParam csParam(*eig_vecs[0]);
       csParam.fieldOrder = QUDA_SPACE_SPIN_COLOR_FIELD_ORDER;
       csParam.setPrecision(eig_vecs[0]->Precision() < QUDA_SINGLE_PRECISION ? QUDA_SINGLE_PRECISION :
                                                                               eig_vecs[0]->Precision());
       csParam.location = QUDA_CPU_FIELD_LOCATION;
       csParam.create = QUDA_NULL_FIELD_CREATE;
       for (int i = 0; i < Nvec; i++) {
         tmp.push_back(ColorSpinorField::Create(csParam));
         *tmp[i] = *eig_vecs[i];
       }
     } else {
       for (int i = 0; i < Nvec; i++) { tmp.push_back(eig_vecs[i]); }
     }

     if (getVerbosity() >= QUDA_SUMMARIZE) printfQuda("Start saving %d vectors to %s\n", Nvec, vec_outfile.c_str());

     void **V = static_cast<void **>(safe_malloc(Nvec * sizeof(void *)));
     for (int i = 0; i < Nvec; i++) {
       V[i] = tmp[i]->V();
       if (V[i] == NULL) {
         if (getVerbosity() >= QUDA_SUMMARIZE) printfQuda("Could not allocate space for eigenVector[%04d]\n", i);
       }
     }

     write_spinor_field(vec_outfile.c_str(), &V[0], tmp[0]->Precision(), tmp[0]->X(), tmp[0]->Ncolor(), tmp[0]->Nspin(),
                        Nvec, 0, (char **)0);

     host_free(V);
     if (getVerbosity() >= QUDA_SUMMARIZE) printfQuda("Done saving vectors\n");
     if (eig_vecs[0]->Location() == QUDA_CUDA_FIELD_LOCATION) {
       for (int i = 0; i < Nvec; i++) delete tmp[i];
     }

 #else
     errorQuda("\nQIO library was not built.\n");
 #endif
     // profile.TPSTOP(QUDA_PROFILE_IO);
     // profile.TPSTART(QUDA_PROFILE_COMPUTE);
   }

   void EigenSolver::loadFromFile(const DiracMatrix &mat, std::vector<ColorSpinorField *> &kSpace,
                                  std::vector<Complex> &evals)
   {
     // Make an array of size nConv
     std::vector<ColorSpinorField *> vecs_ptr;
     for (int i = 0; i < nConv; i++) { vecs_ptr.push_back(kSpace[i]); }
     loadVectors(vecs_ptr, eig_param->vec_infile);

     // Create the device side residual vector by cloning
     // the kSpace passed to the function.
     ColorSpinorParam csParam(*kSpace[0]);
     csParam.create = QUDA_ZERO_FIELD_CREATE;
     r.push_back(ColorSpinorField::Create(csParam));

     // Error estimates (residua) given by ||A*vec - lambda*vec||
     computeEvals(mat, kSpace, evals, nConv);
     for (int i = 0; i < nConv; i++) {
       if (getVerbosity() >= QUDA_SUMMARIZE) {
         printfQuda("EigValue[%04d]: (%+.16e, %+.16e) residual %.16e\n", i, evals[i].real(), evals[i].imag(), residua[i]);
       }
     }

     delete r[0];
   }

   EigenSolver::~EigenSolver()
   {
     if (tmp1) delete tmp1;
     if (tmp2) delete tmp2;
     host_free(residua);
     host_free(Qmat);
   }
   //-----------------------------------------------------------------------------
   //-----------------------------------------------------------------------------

   // Thick Restarted Lanczos Method constructor
   TRLM::TRLM(QudaEigParam *eig_param, const DiracMatrix &mat, TimeProfile &profile) :
     EigenSolver(eig_param, profile),
     mat(mat)
   {
     profile.TPSTART(QUDA_PROFILE_INIT);

     // Tridiagonal/Arrow matrix
     alpha = (double *)safe_malloc(nKr * sizeof(double));
     beta = (double *)safe_malloc(nKr * sizeof(double));
     for (int i = 0; i < nKr; i++) {
       alpha[i] = 0.0;
       beta[i] = 0.0;
     }

     // Thick restart specific checks
     if (nKr < nEv + 6) errorQuda("nKr=%d must be greater than nEv+6=%d\n", nKr, nEv + 6);

     if (!(eig_param->spectrum == QUDA_SPECTRUM_LR_EIG || eig_param->spectrum == QUDA_SPECTRUM_SR_EIG)) {
       errorQuda("Only real spectrum type (LR or SR) can be passed to the TR Lanczos solver");
     }

     profile.TPSTOP(QUDA_PROFILE_INIT);
   }

   void TRLM::operator()(std::vector<ColorSpinorField *> &kSpace, std::vector<Complex> &evals)
   {
     // Check to see if we are loading eigenvectors
     if (strcmp(eig_param->vec_infile, "") != 0) {
       printfQuda("Loading evecs from file name %s\n", eig_param->vec_infile);
       loadFromFile(mat, kSpace, evals);
       return;
     }

     // Test for an initial guess
     double norm = sqrt(blas::norm2(*kSpace[0]));
     if (norm == 0) {
       if (getVerbosity() >= QUDA_SUMMARIZE) printfQuda("Initial residual is zero. Populating with rands.\n");
       if (kSpace[0]->Location() == QUDA_CPU_FIELD_LOCATION) {
         kSpace[0]->Source(QUDA_RANDOM_SOURCE);
       } else {
         RNG *rng = new RNG(*kSpace[0], 1234);
         rng->Init();
         spinorNoise(*kSpace[0], *rng, QUDA_NOISE_UNIFORM);
         rng->Release();
         delete rng;
       }
     }

     // Normalise initial guess
     norm = sqrt(blas::norm2(*kSpace[0]));
     blas::ax(1.0 / norm, *kSpace[0]);

     // Create a device side residual vector by cloning
     // the kSpace passed to the function.
     ColorSpinorParam csParamClone(*kSpace[0]);
     csParam = csParamClone;
     // Increase Krylov space to nKr+1 one vector, create residual
     for (int i = nConv; i < nKr + 1; i++) kSpace.push_back(ColorSpinorField::Create(csParam));
     csParam.create = QUDA_ZERO_FIELD_CREATE;
     r.push_back(ColorSpinorField::Create(csParam));
     // Increase evals space to nEv
     for (int i = nConv; i < nEv; i++) evals.push_back(0.0);
     //---------------------------------------------------------------------------

     // Convergence and locking criteria
     double mat_norm = 0.0;
     double epsilon = DBL_EPSILON;
     QudaPrecision prec = kSpace[0]->Precision();
     switch (prec) {
     case QUDA_DOUBLE_PRECISION:
       epsilon = DBL_EPSILON;
       if (getVerbosity() >= QUDA_SUMMARIZE) printfQuda("Running Eigensolver in double precision\n");
       break;
     case QUDA_SINGLE_PRECISION:
       epsilon = FLT_EPSILON;
       if (getVerbosity() >= QUDA_SUMMARIZE) printfQuda("Running Eigensolver in single precision\n");
       break;
     case QUDA_HALF_PRECISION:
       epsilon = 2e-3;
       if (getVerbosity() >= QUDA_SUMMARIZE) printfQuda("Running Eigensolver in half precision\n");
       break;
     case QUDA_QUARTER_PRECISION:
       epsilon = 5e-2;
       if (getVerbosity() >= QUDA_SUMMARIZE) printfQuda("Running Eigensolver in quarter precision\n");
       break;
     default: errorQuda("Invalid precision %d", prec);
     }

     // Begin TRLM Eigensolver computation
     //---------------------------------------------------------------------------
     if (getVerbosity() >= QUDA_SUMMARIZE) {
       printfQuda("*****************************\n");
       printfQuda("**** START TRLM SOLUTION ****\n");
       printfQuda("*****************************\n");
     }

     profile.TPSTART(QUDA_PROFILE_COMPUTE);

     // Loop over restart iterations.
     while (restart_iter < max_restarts && !converged) {

       for (int step = num_keep; step < nKr; step++) lanczosStep(kSpace, step);
       iter += (nKr - num_keep);
       // if (getVerbosity() >= QUDA_SUMMARIZE) printfQuda("Restart %d complete\n", restart_iter+1);

       int arrow_pos = std::max(num_keep - num_locked + 1, 2);
       // The eigenvalues are returned in the alpha array
       profile.TPSTOP(QUDA_PROFILE_COMPUTE);
       eigensolveFromArrowMat(num_locked, arrow_pos);
       profile.TPSTART(QUDA_PROFILE_COMPUTE);

       // mat_norm is updated.
       for (int i = num_locked; i < nKr; i++)
         if (fabs(alpha[i]) > mat_norm) mat_norm = fabs(alpha[i]);

       // Locking check
       iter_locked = 0;
       for (int i = 1; i < (nKr - num_locked); i++) {
         if (residua[i + num_locked] < epsilon * mat_norm) {
           if (getVerbosity() >= QUDA_DEBUG_VERBOSE)
             printfQuda("**** Locking %d resid=%+.6e condition=%.6e ****\n", i, residua[i + num_locked],
                        epsilon * mat_norm);
           iter_locked = i;
         } else {
           // Unlikely to find new locked pairs
           break;
         }
       }

       // Convergence check
       iter_converged = iter_locked;
       for (int i = iter_locked + 1; i < nKr - num_locked; i++) {
         if (residua[i + num_locked] < tol * mat_norm) {
           if (getVerbosity() >= QUDA_DEBUG_VERBOSE)
             printfQuda("**** Converged %d resid=%+.6e condition=%.6e ****\n", i, residua[i + num_locked], tol * mat_norm);
           iter_converged = i;
         } else {
           // Unlikely to find new converged pairs
           break;
         }
       }

       iter_keep = std::min(iter_converged + (nKr - num_converged) / 2, nKr - num_locked - 12);

       computeKeptRitz(kSpace);

       num_converged = num_locked + iter_converged;
       num_keep = num_locked + iter_keep;
       num_locked += iter_locked;

       if (getVerbosity() >= QUDA_VERBOSE) {
         // printfQuda("iter Conv = %d\n", iter_converged);
         // printfQuda("iter Keep = %d\n", iter_keep);
         // printfQuda("iter Lock = %d\n", iter_locked);
         printfQuda("%04d converged eigenvalues at restart iter %04d\n", num_converged, restart_iter + 1);
         // printfQuda("num_converged = %d\n", num_converged);
         // printfQuda("num_keep = %d\n", num_keep);
         // printfQuda("num_locked = %d\n", num_locked);
       }

       if (getVerbosity() >= QUDA_VERBOSE) {
         for (int i = 0; i < nKr; i++) {
           // printfQuda("Ritz[%d] = %.16e residual[%d] = %.16e\n", i, alpha[i], i, residua[i]);
         }
       }

       // Check for convergence
       if (num_converged >= nConv) {
         reorder(kSpace);
         converged = true;
       }

       restart_iter++;
     }

     profile.TPSTOP(QUDA_PROFILE_COMPUTE);

     if (getVerbosity() >= QUDA_DEBUG_VERBOSE)
       printfQuda("kSpace size at convergence/max restarts = %d\n", (int)kSpace.size());
     // Prune the Krylov space back to size when passed to eigensolver
     for (unsigned int i = nConv; i < kSpace.size(); i++) { delete kSpace[i]; }
     kSpace.resize(nConv);
     evals.resize(nConv);

     // Post computation report
     //---------------------------------------------------------------------------
     if (!converged) {
       if (eig_param->require_convergence) {
         errorQuda("TRLM failed to compute the requested %d vectors with a %d search space and %d Krylov space in %d "
                   "restart steps. Exiting.",
                   nConv, nEv, nKr, max_restarts);
       } else {
         warningQuda("TRLM failed to compute the requested %d vectors with a %d search space and %d Krylov space in %d "
                     "restart steps. Continuing with current lanczos factorisation.",
                     nConv, nEv, nKr, max_restarts);
       }
     } else {
       if (getVerbosity() >= QUDA_SUMMARIZE) {
         printfQuda("TRLM computed the requested %d vectors in %d restart steps and %d OP*x operations.\n", nConv,
                    restart_iter, iter);

         // Dump all Ritz values and residua
         for (int i = 0; i < nConv; i++) {
           printfQuda("RitzValue[%04d]: (%+.16e, %+.16e) residual %.16e\n", i, alpha[i], 0.0, residua[i]);
         }
       }

       // Compute eigenvalues
       computeEvals(mat, kSpace, evals, nConv);
       if (getVerbosity() >= QUDA_SUMMARIZE) {
         for (int i = 0; i < nConv; i++) {
           printfQuda("EigValue[%04d]: (%+.16e, %+.16e) residual %.16e\n", i, evals[i].real(), evals[i].imag(),
                      residua[i]);
         }
       }
     }

     // Local clean-up
     delete r[0];

     // Only save if outfile is defined
     if (strcmp(eig_param->vec_outfile, "") != 0) {
       if (getVerbosity() >= QUDA_SUMMARIZE) printfQuda("saving eigenvectors\n");
       // Make an array of size nConv
       std::vector<ColorSpinorField *> vecs_ptr;
       for (int i = 0; i < nConv; i++) { vecs_ptr.push_back(kSpace[i]); }
       saveVectors(vecs_ptr, eig_param->vec_outfile);
     }

     if (getVerbosity() >= QUDA_SUMMARIZE) {
       printfQuda("*****************************\n");
       printfQuda("***** END TRLM SOLUTION *****\n");
       printfQuda("*****************************\n");
     }
   }

   // Destructor
   TRLM::~TRLM()
   {
     ritz_mat.clear();
     ritz_mat.shrink_to_fit();
     host_free(alpha);
     host_free(beta);
   }

   // Thick Restart Member functions
   //---------------------------------------------------------------------------
   void TRLM::lanczosStep(std::vector<ColorSpinorField *> v, int j)
   {
     // Compute r = A * v_j - b_{j-i} * v_{j-1}
     // r = A * v_j

     chebyOp(mat, *r[0], *v[j]);

     // a_j = v_j^dag * r
     alpha[j] = blas::reDotProduct(*v[j], *r[0]);

     // r = r - a_j * v_j
     blas::axpy(-alpha[j], *v[j], *r[0]);

     int start = (j > num_keep) ? j - 1 : 0;
     for (int i = start; i < j; i++) {

       // r = r - b_{j-1} * v_{j-1}
       blas::axpy(-beta[i], *v[i], *r[0]);
     }

     // Orthogonalise r against the Krylov space
     if (j > 0)
       for (int k = 0; k < 1; k++) blockOrthogonalize(v, r, j);

     // b_j = ||r||
     beta[j] = sqrt(blas::norm2(*r[0]));

     // Prepare next step.
     // v_{j+1} = r / b_j
     blas::zero(*v[j + 1]);
     blas::axpy(1.0 / beta[j], *r[0], *v[j + 1]);
   }

   void TRLM::reorder(std::vector<ColorSpinorField *> &kSpace)
   {
     int i = 0;

     if (reverse) {
       while (i < nKr) {
         if ((i == 0) || (alpha[i - 1] >= alpha[i]))
           i++;
         else {
           double tmp = alpha[i];
           alpha[i] = alpha[i - 1];
           alpha[--i] = tmp;
           std::swap(kSpace[i], kSpace[i - 1]);
         }
       }
     } else {
       while (i < nKr) {
         if ((i == 0) || (alpha[i - 1] <= alpha[i]))
           i++;
         else {
           double tmp = alpha[i];
           alpha[i] = alpha[i - 1];
           alpha[--i] = tmp;
           std::swap(kSpace[i], kSpace[i - 1]);
         }
       }
     }
   }

   void TRLM::eigensolveFromArrowMat(int num_locked, int arrow_pos)
   {
     profile.TPSTART(QUDA_PROFILE_EIGEN);
     int dim = nKr - num_locked;

     // Eigen objects
     MatrixXd A = MatrixXd::Zero(dim, dim);
     ritz_mat.resize(dim * dim);
     for (int i = 0; i < dim * dim; i++) ritz_mat[i] = 0.0;

     // Invert the spectrum due to chebyshev
     if (reverse) {
       for (int i = num_locked; i < nKr - 1; i++) {
         alpha[i] *= -1.0;
         beta[i] *= -1.0;
       }
       alpha[nKr - 1] *= -1.0;
     }

     // Construct arrow mat A_{dim,dim}
     for (int i = 0; i < dim; i++) {

       // alpha populates the diagonal
       A(i, i) = alpha[i + num_locked];
     }

     for (int i = 0; i < arrow_pos - 1; i++) {

       // beta populates the arrow
       A(i, arrow_pos - 1) = beta[i + num_locked];
       A(arrow_pos - 1, i) = beta[i + num_locked];
     }

     for (int i = arrow_pos - 1; i < dim - 1; i++) {

       // beta populates the sub-diagonal
       A(i, i + 1) = beta[i + num_locked];
       A(i + 1, i) = beta[i + num_locked];
     }

     // Eigensolve the arrow matrix
     SelfAdjointEigenSolver<MatrixXd> eigensolver;
     eigensolver.compute(A);

     // repopulate ritz matrix
     for (int i = 0; i < dim; i++)
       for (int j = 0; j < dim; j++) ritz_mat[dim * i + j] = eigensolver.eigenvectors().col(i)[j];

     for (int i = 0; i < dim; i++) {
       residua[i + num_locked] = fabs(beta[nKr - 1] * eigensolver.eigenvectors().col(i)[dim - 1]);
       // Update the alpha array
       alpha[i + num_locked] = eigensolver.eigenvalues()[i];
     }

     // Put spectrum back in order
     if (reverse) {
       for (int i = num_locked; i < nKr; i++) { alpha[i] *= -1.0; }
     }

     profile.TPSTOP(QUDA_PROFILE_EIGEN);
   }

   void TRLM::computeKeptRitz(std::vector<ColorSpinorField *> &kSpace)
   {

     int offset = nKr + 1;
     int dim = nKr - num_locked;

     if ((int)kSpace.size() < offset + iter_keep) {
       for (int i = kSpace.size(); i < offset + iter_keep; i++) {
         if (getVerbosity() >= QUDA_DEBUG_VERBOSE) printfQuda("Adding %d vector to kSpace\n", i);
         kSpace.push_back(ColorSpinorField::Create(csParam));
       }
     }

     // Array for multi-BLAS caxpy
     Complex *ritz_mat_col = (Complex *)safe_malloc((dim - 1) * sizeof(Complex));

     for (int i = 0; i < iter_keep; i++) {
       int k = offset + i;
       *r[0] = *kSpace[num_locked];
       blas::ax(ritz_mat[dim * i], *r[0]);
       *kSpace[k] = *r[0];

       // Pointers to the relevant vectors
       std::vector<ColorSpinorField *> vecs_ptr;
       std::vector<ColorSpinorField *> kSpace_ptr;
       kSpace_ptr.push_back(kSpace[k]);
       for (int j = 1; j < dim; j++) {
         vecs_ptr.push_back(kSpace[num_locked + j]);
         ritz_mat_col[j - 1].real(ritz_mat[i * dim + j]);
         ritz_mat_col[j - 1].imag(0.0);
       }

       // Multi-BLAS axpy
       blas::caxpy(ritz_mat_col, vecs_ptr, kSpace_ptr);
     }

     host_free(ritz_mat_col);

     for (int i = 0; i < iter_keep; i++) *kSpace[i + num_locked] = *kSpace[offset + i];
     *kSpace[num_locked + iter_keep] = *kSpace[nKr];

     for (int i = 0; i < iter_keep; i++) beta[i + num_locked] = beta[nKr - 1] * ritz_mat[dim * (i + 1) - 1];
   }
 } // namespace quda
tmp2
cudaColorSpinorField * tmp2
Definition: dslash_ctest.cpp:40

quda::blas::ax
void ax(double a, ColorSpinorField &x)
Definition: blas_quda.cu:508

quda::EigenSolver::iter_locked
int iter_locked
Definition: eigensolve_quda.h:35

QUDA_VERBOSE
Definition: enum_quda.h:265

quda::RNG::Init
void Init()
Initialize CURAND RNG states.
Definition: random.cu:122

QUDA_SPECTRUM_LI_EIG
Definition: enum_quda.h:146

quda::ColorSpinorParam::setPrecision
void setPrecision(QudaPrecision precision, QudaPrecision ghost_precision=QUDA_INVALID_PRECISION, bool force_native=false)
Definition: color_spinor_field.h:231

tmp1
cudaColorSpinorField * tmp1
Definition: dslash_ctest.cpp:40

QUDA_SPECTRUM_SM_EIG
Definition: enum_quda.h:143

QudaPrecision
enum QudaPrecision_s QudaPrecision

QUDA_SPECTRUM_SI_EIG
Definition: enum_quda.h:145

quda::ColorSpinorField
Definition: color_spinor_field.h:311

quda::norm
__host__ __device__ ValueType norm(const complex< ValueType > &z)
Returns the magnitude of z squared.
Definition: complex_quda.h:1092

getVerbosity
QudaVerbosity getVerbosity()
Definition: util_quda.cpp:21

quda::EigenSolver::nEv
int nEv
Definition: eigensolve_quda.h:20

quda::TRLM::eigensolveFromArrowMat
void eigensolveFromArrowMat(int nLocked, int arror_pos)
Get the eigendecomposition from the arrow matrix.
Definition: eigensolve_quda.cpp:810

errorQuda
#define errorQuda(...)
Definition: util_quda.h:121

quda::blas::norm2
double norm2(const ColorSpinorField &a)
Definition: reduce_quda.cu:721

color_spinor_field.h

QUDA_SPECTRUM_SR_EIG
Definition: enum_quda.h:141

QUDA_CUDA_FIELD_LOCATION
Definition: enum_quda.h:326

host_free
#define host_free(ptr)
Definition: malloc_quda.h:71

QUDA_QUARTER_PRECISION
Definition: enum_quda.h:59

QUDA_SPACE_SPIN_COLOR_FIELD_ORDER
Definition: enum_quda.h:350

QUDA_HALF_PRECISION
Definition: enum_quda.h:60

quda::sqrt
__host__ __device__ ValueType sqrt(ValueType x)
Definition: complex_quda.h:120

quda::blas::cDotProduct
Complex cDotProduct(ColorSpinorField &, ColorSpinorField &)
Definition: reduce_quda.cu:764

epsilon
double epsilon
Definition: test_util.cpp:1649

quda::EigenSolver::deflate
void deflate(std::vector< ColorSpinorField *> vec_defl, std::vector< ColorSpinorField *> vec, std::vector< ColorSpinorField *> evecs, std::vector< Complex > evals)
Deflate vector with Eigenvectors.
Definition: eigensolve_quda.cpp:229

QUDA_SUMMARIZE
Definition: enum_quda.h:264

QUDA_NOISE_UNIFORM
Definition: enum_quda.h:384

quda::EigenSolver::chebyOp
void chebyOp(const DiracMatrix &mat, ColorSpinorField &out, const ColorSpinorField &in)
Promoted the specified matVec operation: M, Mdag, MMdag, MdagM to a Chebyshev polynomial.
Definition: eigensolve_quda.cpp:138

QUDA_SPECTRUM_LM_EIG
Definition: enum_quda.h:144

tmp
cudaColorSpinorField * tmp
Definition: covdev_test.cpp:44

quda::ColorSpinorField::Create
static ColorSpinorField * Create(const ColorSpinorParam &param)
Definition: color_spinor_field.cpp:752

quda::EigenSolver::iter
int iter
Definition: eigensolve_quda.h:33

quda::TRLM::TRLM
TRLM(QudaEigParam *eig_param, const DiracMatrix &mat, TimeProfile &profile)
Constructor for Thick Restarted Eigensolver class.
Definition: eigensolve_quda.cpp:501

quda::EigenSolver::loadVectors
static void loadVectors(std::vector< ColorSpinorField *> &eig_vecs, std::string file)
Load vectors from file.
Definition: eigensolve_quda.cpp:362

quda::blas::caxpbypczw
void caxpbypczw(const Complex &a, ColorSpinorField &x, const Complex &b, ColorSpinorField &y, const Complex &c, ColorSpinorField &z, ColorSpinorField &w)
Definition: blas_quda.cu:528

QUDA_NULL_FIELD_CREATE
Definition: enum_quda.h:359

quda::blas::reDotProduct
double reDotProduct(ColorSpinorField &x, ColorSpinorField &y)
Definition: reduce_quda.cu:728

quda::TRLM::computeKeptRitz
void computeKeptRitz(std::vector< ColorSpinorField *> &kSpace)
Get the eigen-decomposition from the arrow matrix.
Definition: eigensolve_quda.cpp:872

quda::blas::copy
void copy(ColorSpinorField &dst, const ColorSpinorField &src)
Definition: copy_quda.cu:355

quda::EigenSolver::iter_converged
int iter_converged
Definition: eigensolve_quda.h:34

util_quda.h

quda::TRLM::operator()
void operator()(std::vector< ColorSpinorField *> &kSpace, std::vector< Complex > &evals)
Compute eigenpairs.
Definition: eigensolve_quda.cpp:525

quda::EigenSolver::~EigenSolver
virtual ~EigenSolver()
Definition: eigensolve_quda.cpp:490

quda::sum
__host__ __device__ void sum(double &a, double &b)
Definition: blas_helper.cuh:62

quda
Definition: blas_cublas.h:5

quda::TRLM::lanczosStep
void lanczosStep(std::vector< ColorSpinorField *> v, int j)
Lanczos step: extends the Kylov space.
Definition: eigensolve_quda.cpp:748

QudaEigParam_s::use_poly_acc
QudaBoolean use_poly_acc
Definition: quda.h:387

Eigen

param
QudaGaugeParam param
Definition: pack_test.cpp:17

QudaEigParam_s::nConv
int nConv
Definition: quda.h:420

quda::EigenSolver::saveVectors
static void saveVectors(const std::vector< ColorSpinorField *> &eig_vecs, std::string file)
Save vectors to file.
Definition: eigensolve_quda.cpp:416

QudaEigParam_s::eig_type
QudaEigType eig_type
Definition: quda.h:384

quda::EigenSolver::deflateSVD
void deflateSVD(std::vector< ColorSpinorField *> vec_defl, std::vector< ColorSpinorField *> vec, std::vector< ColorSpinorField *> evecs, std::vector< Complex > evals)
Deflate vector with both left and Right singular vectors.
Definition: eigensolve_quda.cpp:309

quda::TRLM::mat
const DiracMatrix & mat
Definition: eigensolve_quda.h:175

QudaEigParam_s::require_convergence
QudaBoolean require_convergence
Definition: quda.h:408

quda::EigenSolver
Definition: eigensolve_quda.h:11

quda::ColorSpinorParam::location
QudaFieldLocation location
Definition: color_spinor_field.h:83

quda::EigenSolver::tmp1
ColorSpinorField * tmp1
Definition: eigensolve_quda.h:47

quda::EigenSolver::create
static EigenSolver * create(QudaEigParam *eig_param, const DiracMatrix &mat, TimeProfile &profile)
Creates the eigensolver using the parameters given and the matrix.
Definition: eigensolve_quda.cpp:109

quda::TRLM::beta
double * beta
Definition: eigensolve_quda.h:194

quda::ColorSpinorParam::fieldOrder
QudaFieldOrder fieldOrder
Definition: color_spinor_field.h:93

quda::RNG::Release
void Release()
Release Device memory for CURAND RNG states.
Definition: random.cu:145

csParam
ColorSpinorParam csParam
Definition: pack_test.cpp:24

quda::EigenSolver::loadFromFile
void loadFromFile(const DiracMatrix &mat, std::vector< ColorSpinorField *> &eig_vecs, std::vector< Complex > &evals)
Load and check eigenpairs from file.
Definition: eigensolve_quda.cpp:465

quda::blas::axpy
void axpy(double a, ColorSpinorField &x, ColorSpinorField &y)
Definition: blas_quda.h:35

in
cpuColorSpinorField * in
Definition: staggered_invert_test.cpp:98

quda::EigenSolver::max_restarts
int max_restarts
Definition: eigensolve_quda.h:31

quda::RNG
Class declaration to initialize and hold CURAND RNG states.
Definition: random_quda.h:23

quda::EigenSolver::iter_keep
int iter_keep
Definition: eigensolve_quda.h:36

quda::EigenSolver::reverse
bool reverse
Definition: eigensolve_quda.h:24

quda::size
constexpr int size
Definition: dslash_domain_wall_4d.cuh:8

quda::QUDA_PROFILE_COMPUTE
Definition: timer.h:108

quda::TRLM::csParam
ColorSpinorParam csParam
Definition: eigensolve_quda.h:197

warningQuda
#define warningQuda(...)
Definition: util_quda.h:133

QudaEigParam_s::poly_deg
int poly_deg
Definition: quda.h:390

quda::QUDA_PROFILE_EIGEN
Definition: timer.h:114

QudaEigParam_s::a_min
double a_min
Definition: quda.h:393

quda::EigenSolver::matVec
void matVec(const DiracMatrix &mat, ColorSpinorField &out, const ColorSpinorField &in)
Applies the specified matVec operation: M, Mdag, MMdag, MdagM.
Definition: eigensolve_quda.cpp:128

quda::TRLM::ritz_mat
std::vector< double > ritz_mat
Definition: eigensolve_quda.h:190

quda::EigenSolver::computeSVD
void computeSVD(const DiracMatrix &mat, std::vector< ColorSpinorField *> &evecs, std::vector< Complex > &evals)
Computes Left/Right SVD from pre computed Right/Left.
Definition: eigensolve_quda.cpp:263

quda::Complex
std::complex< double > Complex
Definition: quda_internal.h:46

quda::EigenSolver::profile
TimeProfile & profile
Definition: eigensolve_quda.h:16

quda::blas::caxpy
void caxpy(const Complex &a, ColorSpinorField &x, ColorSpinorField &y)
Definition: blas_quda.cu:512

QudaEigParam_s
Definition: quda.h:376

safe_malloc
#define safe_malloc(size)
Definition: malloc_quda.h:66

quda::blas::zero
void zero(ColorSpinorField &a)
Definition: blas_quda.cu:472

V
int V
Definition: test_util.cpp:27

quda::EigenSolver::blockOrthogonalize
Complex blockOrthogonalize(std::vector< ColorSpinorField *> v, std::vector< ColorSpinorField *> r, int j)
Orthogonalise input vector r against vector space v using block-BLAS.
Definition: eigensolve_quda.cpp:207

blas_quda.h

quda::QUDA_PROFILE_INIT
Definition: timer.h:106

quda::Dirac::M
virtual void M(ColorSpinorField &out, const ColorSpinorField &in) const =0

quda::EigenSolver::num_keep
int num_keep
Definition: eigensolve_quda.h:39

quda::EigenSolver::tmp2
ColorSpinorField * tmp2
Definition: eigensolve_quda.h:48

QUDA_DEBUG_VERBOSE
Definition: enum_quda.h:266

quda::ColorSpinorParam
Definition: color_spinor_field.h:80

QUDA_DOUBLE_PRECISION
Definition: enum_quda.h:62

QudaEigParam_s::vec_outfile
char vec_outfile[256]
Definition: quda.h:462

quda::EigenSolver::num_converged
int num_converged
Definition: eigensolve_quda.h:37

quda::TRLM::alpha
double * alpha
Definition: eigensolve_quda.h:193

quda::TRLM::~TRLM
virtual ~TRLM()
Destructor for Thick Restarted Eigensolver class.
Definition: eigensolve_quda.cpp:738

out
cpuColorSpinorField * out
Definition: staggered_invert_test.cpp:99

QudaEigParam_s::tol
double tol
Definition: quda.h:422

swap
DEVICEHOST void swap(Real &a, Real &b)
Definition: svd_quda.h:139

QUDA_SINGLE_PRECISION
Definition: enum_quda.h:61

quda::s
__shared__ float s[]

quda::EigenSolver::r
std::vector< ColorSpinorField * > r
Definition: eigensolve_quda.h:44

quda::DiracMatrix
Definition: dirac_quda.h:1100

printfQuda
#define printfQuda(...)
Definition: util_quda.h:115

quda::TRLM::reorder
void reorder(std::vector< ColorSpinorField *> &kSpace)
Reorder the Krylov space by eigenvalue.
Definition: eigensolve_quda.cpp:781

QudaEigParam_s::nEv
int nEv
Definition: quda.h:414

QUDA_EIG_IR_LANCZOS
Definition: enum_quda.h:133

QUDA_EIG_IR_ARNOLDI
Definition: enum_quda.h:134

qio_field.h

quda::EigenSolver::nConv
int nConv
Definition: eigensolve_quda.h:22

write_spinor_field
void write_spinor_field(const char *filename, void *V[], QudaPrecision precision, const int *X, int nColor, int nSpin, int Nvec, int argc, char *argv[])
Definition: qio_field.h:29

QUDA_RANDOM_SOURCE
Definition: enum_quda.h:375

QudaEigParam_s::check_interval
int check_interval
Definition: quda.h:424

quda::TimeProfile
Definition: timer.h:171

quda::blas::caxpby
void caxpby(const Complex &a, ColorSpinorField &x, const Complex &b, ColorSpinorField &y)
Definition: blas_quda.cu:523

QudaEigParam_s::nKr
int nKr
Definition: quda.h:416

QudaEigParam_s::max_restarts
int max_restarts
Definition: quda.h:426

QudaEigParam_s::spectrum
QudaEigSpectrumType spectrum
Definition: quda.h:411

quda::EigenSolver::num_locked
int num_locked
Definition: eigensolve_quda.h:38

quda::EigenSolver::Qmat
Complex * Qmat
Definition: eigensolve_quda.h:50

quda::abs
__host__ __device__ ValueType abs(ValueType x)
Definition: complex_quda.h:125

quda::EigenSolver::spectrum
char spectrum[3]
Definition: eigensolve_quda.h:25

QUDA_ZERO_FIELD_CREATE
Definition: enum_quda.h:360

quda::EigenSolver::computeEvals
void computeEvals(const DiracMatrix &mat, std::vector< ColorSpinorField *> &evecs, std::vector< Complex > &evals, int k)
Compute eigenvalues and their residiua.
Definition: eigensolve_quda.cpp:345

quda::EigenSolver::restart_iter
int restart_iter
Definition: eigensolve_quda.h:30

quda::EigenSolver::tol
double tol
Definition: eigensolve_quda.h:23

QUDA_EIG_TR_LANCZOS
Definition: enum_quda.h:132

quda::ColorSpinorParam::create
QudaFieldCreate create
Definition: color_spinor_field.h:95

quda::EigenSolver::check_interval
int check_interval
Definition: eigensolve_quda.h:32

flags
bool flags
Definition: eigensolve_quda.cpp:18

mat
void mat(void *out, void **link, void *in, int dagger_bit, int mu, QudaPrecision sPrecision, QudaPrecision gPrecision)
Definition: covdev_reference.cpp:112

QudaEigParam_s::a_max
double a_max
Definition: quda.h:394

quda::EigenSolver::converged
bool converged
Definition: eigensolve_quda.h:29

QUDA_CPU_FIELD_LOCATION
Definition: enum_quda.h:325

QUDA_SPECTRUM_LR_EIG
Definition: enum_quda.h:142

prec
QudaPrecision prec
Definition: test_util.cpp:1608

read_spinor_field
void read_spinor_field(const char *filename, void *V[], QudaPrecision precision, const int *X, int nColor, int nSpin, int Nvec, int argc, char *argv[])
Definition: qio_field.h:24

quda::EigenSolver::residua
double * residua
Definition: eigensolve_quda.h:41

QudaEigParam_s::vec_infile
char vec_infile[256]
Definition: quda.h:459

quda::DiracMatrix::Expose
const Dirac * Expose() const
Definition: dirac_quda.h:1135

quda::spinorNoise
void spinorNoise(ColorSpinorField &src, RNG &randstates, QudaNoiseType type)
Generate a random noise spinor. This variant allows the user to manage the RNG state.
Definition: spinor_noise.cu:122

quda::EigenSolver::EigenSolver
EigenSolver(QudaEigParam *eig_param, TimeProfile &profile)
Constructor for base Eigensolver class.
Definition: eigensolve_quda.cpp:27

eigensolve_quda.h

quda_internal.h

quda::EigenSolver::eig_param
QudaEigParam * eig_param
Definition: eigensolve_quda.h:15

quda::EigenSolver::nKr
int nKr
Definition: eigensolve_quda.h:21

quda::TRLM
Thick Restarted Lanczos Method.
Definition: eigensolve_quda.h:171