scipy.linalg.

lstsq#

scipy.linalg.lstsq(a, b, cond=None, overwrite_a=False, overwrite_b=False, check_finite=True, lapack_driver=None)[源]#

计算方程 a @ x = b 的最小二乘解。

计算向量 x，使得 2-范数 |b - A x| 最小化。

文档假定数组参数具有指定的“核心”形状。然而，此函数的数组参数可能在核心形状前附加额外的“批处理”维度。在这种情况下，数组被视为低维切片的批次；详见批处理线性运算。

参数:

a(M, N) array_like: 左侧数组
b(M,) 或 (M, K) array_like: 右侧数组
condfloat, 可选: “小”奇异值的截止值；用于确定 a 的有效秩。小于 cond * largest_singular_value 的奇异值被视为零。
overwrite_a布尔值, 可选: 丢弃 a 中的数据（可能提升性能）。默认值为 False。
overwrite_b布尔值, 可选: 丢弃 b 中的数据（可能提升性能）。默认值为 False。
check_finite布尔值, 可选: 是否检查输入矩阵仅包含有限数。禁用此选项可能会带来性能提升，但如果输入包含无穷大或 NaN，则可能导致问题（崩溃、无法终止）。
lapack_driver字符串, 可选: 用于解决最小二乘问题的 LAPACK 驱动器。选项包括 'gelsd'、'gelsy'、'gelss'。默认值（'gelsd'）是一个不错的选择。然而，'gelsy' 在许多问题上可能略快。'gelss' 历史上曾被使用。它通常很慢但内存占用较少。

在 0.17.0 版本中新增。

返回:

x(N,) 或 (N, K) ndarray: 最小二乘解。
residues(K,) ndarray 或 float: b - a x 中每列的 2-范数平方，如果 M > N 且 rank(A) == n（如果 b 为 1-D 则返回一个标量）。否则返回一个形状为 (0,) 的数组。
rankint: a 的有效秩。
s(min(M, N),) ndarray 或 None: a 的奇异值。a 的条件数是 s[0] / s[-1]。

引发:

LinAlgError: 如果计算不收敛。
ValueError: 当参数不兼容时。

另请参阅

scipy.optimize.nnls: 带非负性约束的线性最小二乘

注意

当 'gelsy' 用作驱动器时，residues 被设置为形状为 (0,) 的数组，并且 s 始终为 None。

示例

>>> import numpy as np
>>> from scipy.linalg import lstsq
>>> import matplotlib.pyplot as plt

假设我们有以下数据

>>> x = np.array([1, 2.5, 3.5, 4, 5, 7, 8.5])
>>> y = np.array([0.3, 1.1, 1.5, 2.0, 3.2, 6.6, 8.6])

我们希望将形如 y = a + b*x**2 的二次多项式拟合到这些数据。我们首先构造“设计矩阵” M，其中包含一个常数列（全为 1）和一个包含 x**2 的列。

>>> M = x[:, np.newaxis]**[0, 2]
>>> M
array([[  1.  ,   1.  ],
       [  1.  ,   6.25],
       [  1.  ,  12.25],
       [  1.  ,  16.  ],
       [  1.  ,  25.  ],
       [  1.  ,  49.  ],
       [  1.  ,  72.25]])

我们希望找到 M.dot(p) = y 的最小二乘解，其中 p 是一个长度为 2 的向量，它包含参数 a 和 b。

>>> p, res, rnk, s = lstsq(M, y)
>>> p
array([ 0.20925829,  0.12013861])

绘制数据和拟合曲线。

>>> plt.plot(x, y, 'o', label='data')
>>> xx = np.linspace(0, 9, 101)
>>> yy = p[0] + p[1]*xx**2
>>> plt.plot(xx, yy, label='least squares fit, $y = a + bx^2$')
>>> plt.xlabel('x')
>>> plt.ylabel('y')
>>> plt.legend(framealpha=1, shadow=True)
>>> plt.grid(alpha=0.25)
>>> plt.show()