scipy.optimize.

lsq_linear#

scipy.optimize.lsq_linear(A, b, bounds=(-inf, inf), method='trf', tol=1e-10, lsq_solver=None, lsmr_tol=None, max_iter=None, verbose=0, *, lsmr_maxiter=None)[源]#

求解带变量边界的线性最小二乘问题。

给定一个 m 乘 n 的设计矩阵 A 和一个包含 m 个元素的目标向量 b，lsq_linear 求解以下优化问题

minimize 0.5 * ||A x - b||**2
subject to lb <= x <= ub

此优化问题是凸的，因此找到的最小值（如果迭代已收敛）保证是全局最小值。

参数:

Aarray_like, 稀疏数组或 LinearOperator, 形状 (m, n)

设计矩阵。可以是 scipy.sparse.linalg.LinearOperator。

barray_like, 形状 (m,)

目标向量。

boundsarray_like 或 Bounds 的 2 元组, 可选

参数的下界和上界。默认为无边界。有两种指定边界的方法：

Bounds 类的实例。
array_like 的 2 元组：元组的每个元素必须是长度等于参数数量的数组，或者是标量（在这种情况下，边界被视为所有参数都相同）。使用适当符号的 np.inf 来禁用所有或部分参数的边界。

method‘trf’ 或 ‘bvls’, 可选

执行最小化的方法。

‘trf’：适应于线性最小二乘问题的信赖域反射算法。这是一种类似内点法的方法，所需的迭代次数与变量数量弱相关。
‘bvls’：有界变量最小二乘算法。这是一种主动集方法，需要的迭代次数与变量数量相当。当 A 是稀疏或 LinearOperator 时不能使用。

默认为 ‘trf’。

tolfloat, 可选

容差参数。如果成本函数在最后一次迭代上的相对变化小于 tol，则算法终止。此外，还考虑了一阶最优性度量：

method='trf' 在梯度（为考虑边界存在而缩放）的均匀范数小于 tol 时终止。
method='bvls' 在 Karush-Kuhn-Tucker 条件在 tol 容差范围内满足时终止。

lsq_solver{None, ‘exact’, ‘lsmr’}, 可选

在迭代过程中解决无界最小二乘问题的方法：

‘exact’：使用密集 QR 或 SVD 分解方法。当 A 是稀疏或 LinearOperator 时不能使用。
‘lsmr’：使用 scipy.sparse.linalg.lsmr 迭代过程，该过程仅需要矩阵向量乘积评估。不能与 method='bvls' 一起使用。

如果为 None（默认），则根据 A 的类型选择求解器。

lsmr_tolNone, float 或 ‘auto’, 可选

scipy.sparse.linalg.lsmr 的容差参数 ‘atol’ 和 ‘btol’。如果为 None（默认），则设置为 1e-2 * tol。如果为 ‘auto’，则容差将根据当前迭代的最优性进行调整，这可以加快优化过程，但并非总是可靠。

max_iterNone 或 int, 可选

终止前的最大迭代次数。如果为 None（默认），则对于 method='trf'，它设置为 100；对于 method='bvls'，则设置为变量数量（不包括 ‘bvls’ 初始化的迭代次数）。

verbose{0, 1, 2}, 可选

算法的详细程度：

0：静默运行（默认）。
1：显示终止报告。
2：在迭代过程中显示进度。

lsmr_maxiterNone 或 int, 可选

如果使用 lsmr 最小二乘求解器（通过设置 lsq_solver='lsmr'），则其最大迭代次数。如果为 None（默认），它使用 lsmr 的默认值 min(m, n)，其中 m 和 n 分别是 A 的行数和列数。如果 lsq_solver='exact' 则无效。

返回:

一个 OptimizeResult 对象，包含以下字段：

xndarray, 形状 (n,)

找到的解。

costfloat

解处的成本函数值。

funndarray, 形状 (m,)

解处的残差向量。

optimalityfloat

一阶最优性度量。确切含义取决于 method，请参考 tol 参数的描述。

active_maskint 的 ndarray, 形状 (n,)

每个分量表示相应的约束是否活跃（即变量是否在边界上）

0：约束不活跃。
-1：下界活跃。
1：上界活跃。

对于 trf 方法可能有些武断，因为它生成一系列严格可行的迭代，并且 active_mask 在容差阈值内确定。

unbounded_soltuple

由最小二乘求解器（通过 lsq_solver 选项设置）返回的无界最小二乘解元组。如果未设置 lsq_solver 或设置为 'exact'，则该元组包含形状为 (n,) 的无界解的 ndarray、残差平方和的 ndarray、一个表示 A 的秩的 int，以及 A 的奇异值的 ndarray（更多信息请参阅 NumPy 的 linalg.lstsq）。如果 lsq_solver 设置为 'lsmr'，则该元组包含形状为 (n,) 的无界解的 ndarray、一个退出代码的 int、一个迭代次数的 int，以及五个表示各种范数和 A 的条件数的浮点数（更多信息请参阅 SciPy 的 sparse.linalg.lsmr）。此输出对于确定最小二乘求解器的收敛性很有用，尤其是迭代的 'lsmr' 求解器。无界最小二乘问题是最小化 0.5 * ||A x - b||**2。

nitint

迭代次数。如果无约束解是最优的，则为零。

statusint

算法终止的原因：

-1：算法在最后一次迭代中无法取得进展。
0：超过最大迭代次数。
1：一阶最优性度量小于 tol。
2：成本函数的相对变化小于 tol。
3：无约束解是最优的。

messagestr

终止原因的文字描述。

successbool

如果满足其中一个收敛条件（status > 0），则为 True。

另请参阅

nnls: 带有非负约束的线性最小二乘。
least_squares: 带有变量边界的非线性最小二乘。

备注

该算法首先通过 numpy.linalg.lstsq 或 scipy.sparse.linalg.lsmr（取决于 lsq_solver）计算无约束最小二乘解。如果该解在边界内，则将其作为最优解返回。

‘trf’ 方法运行 [STIR] 中描述的适用于线性最小二乘问题的算法的改编版。迭代与非线性最小二乘算法基本相同，但由于二次函数模型始终准确，我们不需要跟踪或修改信赖域半径。当选定的步长不能减少成本函数时，使用线搜索（回溯）作为安全网。有关算法的更详细描述，请参阅 scipy.optimize.least_squares。

‘bvls’ 方法运行 [BVLS] 中描述的算法的 Python 实现。该算法维护变量的活跃集和自由集，在每次迭代中选择一个新变量从活跃集移动到自由集，然后对自由变量求解无约束最小二乘问题。该算法最终保证给出精确解，但对于一个具有 n 个变量的问题，可能需要多达 n 次迭代。此外，还实现了一个特殊的初始化过程，用于确定最初将哪些变量设为自由或活跃。在实际 BVLS 开始之前需要一些迭代，但这可以显著减少后续迭代的次数。

参考文献

[STIR]

M. A. Branch, T. F. Coleman, and Y. Li, “A Subspace, Interior, and Conjugate Gradient Method for Large-Scale Bound-Constrained Minimization Problems,” SIAM Journal on Scientific Computing, Vol. 21, Number 1, pp 1-23, 1999.

[BVLS]

P. B. Start and R. L. Parker, “Bounded-Variable Least-Squares: an Algorithm and Applications”, Computational Statistics, 10, 129-141, 1995.

示例

在此示例中，解决了一个带有大型稀疏数组和变量边界的问题。

>>> import numpy as np
>>> from scipy.sparse import random_array
>>> from scipy.optimize import lsq_linear
>>> rng = np.random.default_rng()
...
>>> m = 2000
>>> n = 1000
...
>>> A = random_array((m, n), density=1e-4, random_state=rng)
>>> b = rng.standard_normal(m)
...
>>> lb = rng.standard_normal(n)
>>> ub = lb + 1
...
>>> res = lsq_linear(A, b, bounds=(lb, ub), lsmr_tol='auto', verbose=1)
The relative change of the cost function is less than `tol`.
Number of iterations 10, initial cost 1.0070e+03, final cost 9.6602e+02,
first-order optimality 2.21e-09.        # may vary