lstsq#
- scipy.linalg.lstsq(a, b, cond=None, overwrite_a=False, overwrite_b=False, check_finite=True, lapack_driver=None)[源]#
计算方程
a @ x = b
的最小二乘解。计算向量 x,使得 2-范数
|b - A x|
最小化。文档假定数组参数具有指定的“核心”形状。然而,此函数的数组参数可能在核心形状前附加额外的“批处理”维度。在这种情况下,数组被视为低维切片的批次;详见批处理线性运算。
- 参数:
- a(M, N) array_like
左侧数组
- b(M,) 或 (M, K) array_like
右侧数组
- condfloat, 可选
“小”奇异值的截止值;用于确定 a 的有效秩。小于
cond * largest_singular_value
的奇异值被视为零。- overwrite_a布尔值, 可选
丢弃 a 中的数据(可能提升性能)。默认值为 False。
- overwrite_b布尔值, 可选
丢弃 b 中的数据(可能提升性能)。默认值为 False。
- check_finite布尔值, 可选
是否检查输入矩阵仅包含有限数。禁用此选项可能会带来性能提升,但如果输入包含无穷大或 NaN,则可能导致问题(崩溃、无法终止)。
- lapack_driver字符串, 可选
用于解决最小二乘问题的 LAPACK 驱动器。选项包括
'gelsd'
、'gelsy'
、'gelss'
。默认值('gelsd'
)是一个不错的选择。然而,'gelsy'
在许多问题上可能略快。'gelss'
历史上曾被使用。它通常很慢但内存占用较少。在 0.17.0 版本中新增。
- 返回:
- x(N,) 或 (N, K) ndarray
最小二乘解。
- residues(K,) ndarray 或 float
b - a x
中每列的 2-范数平方,如果M > N
且rank(A) == n
(如果b
为 1-D 则返回一个标量)。否则返回一个形状为 (0,) 的数组。- rankint
a 的有效秩。
- s(min(M, N),) ndarray 或 None
a 的奇异值。
a
的条件数是s[0] / s[-1]
。
- 引发:
- LinAlgError
如果计算不收敛。
- ValueError
当参数不兼容时。
另请参阅
scipy.optimize.nnls
带非负性约束的线性最小二乘
注意
当
'gelsy'
用作驱动器时,residues 被设置为形状为 (0,) 的数组,并且 s 始终为None
。示例
>>> import numpy as np >>> from scipy.linalg import lstsq >>> import matplotlib.pyplot as plt
假设我们有以下数据
>>> x = np.array([1, 2.5, 3.5, 4, 5, 7, 8.5]) >>> y = np.array([0.3, 1.1, 1.5, 2.0, 3.2, 6.6, 8.6])
我们希望将形如
y = a + b*x**2
的二次多项式拟合到这些数据。我们首先构造“设计矩阵” M,其中包含一个常数列(全为 1)和一个包含x**2
的列。>>> M = x[:, np.newaxis]**[0, 2] >>> M array([[ 1. , 1. ], [ 1. , 6.25], [ 1. , 12.25], [ 1. , 16. ], [ 1. , 25. ], [ 1. , 49. ], [ 1. , 72.25]])
我们希望找到
M.dot(p) = y
的最小二乘解,其中p
是一个长度为 2 的向量,它包含参数a
和b
。>>> p, res, rnk, s = lstsq(M, y) >>> p array([ 0.20925829, 0.12013861])
绘制数据和拟合曲线。
>>> plt.plot(x, y, 'o', label='data') >>> xx = np.linspace(0, 9, 101) >>> yy = p[0] + p[1]*xx**2 >>> plt.plot(xx, yy, label='least squares fit, $y = a + bx^2$') >>> plt.xlabel('x') >>> plt.ylabel('y') >>> plt.legend(framealpha=1, shadow=True) >>> plt.grid(alpha=0.25) >>> plt.show()