make_smoothing_spline#
- scipy.interpolate.make_smoothing_spline(x, y, w=None, lam=None, *, axis=0)[source]#
创建满足广义交叉验证(GCV)准则的平滑B样条。
使用
lam
计算平滑三次样条函数(的系数),以控制曲线平滑程度与数据接近程度之间的权衡。如果lam
为 None,则使用 GCV 准则 [1] 找到它。平滑样条是正则化加权线性回归问题的解:
\[\sum\limits_{i=1}^n w_i\lvert y_i - f(x_i) \rvert^2 + \lambda\int\limits_{x_1}^{x_n} (f^{(2)}(u))^2 d u\]其中 \(f\) 是样条函数,\(w\) 是权重向量,\(\lambda\) 是正则化参数。
如果
lam
为 None,我们使用 GCV 准则找到最优正则化参数;否则,我们使用给定参数解决正则化加权线性回归问题。该参数以以下方式控制权衡:参数越大,函数越平滑。- 参数:
- xarray_like, shape (n,)
横坐标。n 必须至少为 5。
- yarray_like, shape (n, …)
纵坐标。n 必须至少为 5。
- warray_like, shape (n,), optional
权重向量。默认为
np.ones_like(x)
。- lamfloat, (\(\lambda \geq 0\)), optional
正则化参数。如果
lam
为 None,则通过 GCV 准则找到。默认为 None。- axisint, optional
数据轴。默认为零。假设
y.shape[axis] == n
,并且y
的所有其他轴都是批处理轴。
- 返回:
- func
BSpline
对象 一个对象,表示一个基于 B 样条的样条曲线,其解是平滑样条问题通过 GCV 准则 [1](如果
lam
为 None)或使用给定参数lam
得到的。
- func
说明
该算法是对 Woltring 在 FORTRAN [2] 中引入的算法进行的洁净室(clean room)重新实现。由于许可问题,原版不能在 SciPy 源代码中使用。重新实现的细节在此处讨论(仅俄语)[4]。
如果权重向量
w
为 None,我们假设所有点在权重方面都是相等的,并且权重向量是全一向量。请注意,在加权残差平方和中,权重没有平方:\(\sum\limits_{i=1}^n w_i\lvert y_i - f(x_i) \rvert^2\),而在
splrep
中,求和是基于平方权重构建的。在初始问题病态的情况下(例如,\(X^T W X\) 乘积,其中 \(X\) 是设计矩阵,不是正定矩阵),会引发 ValueError。
参考文献
[1]G. Wahba,“估计平滑参数”,载于 Spline models for observational data,费城,宾夕法尼亚州:工业与应用数学学会,1990年,第 45-65 页。DOI:10.1137/1.9781611970128
[2]H. J. Woltring,一个用于广义交叉验证样条平滑和微分的 Fortran 包,Advances in Engineering Software, vol. 8, no. 2, pp. 104-113, 1986。DOI:10.1016/0141-1195(86)90098-7
[3]T. Hastie, J. Friedman, and R. Tisbshirani,“平滑样条”,载于 The elements of Statistical Learning: Data Mining, Inference, and prediction,纽约:施普林格,2017年,第 241-249 页。DOI:10.1007/978-0-387-84858-7
[4]E. Zemlyanoy,“广义交叉验证平滑样条”,学士论文,2022年。https://www.hse.ru/ba/am/students/diplomas/620910604 (俄语)
示例
生成一些带噪声的数据
>>> import numpy as np >>> np.random.seed(1234) >>> n = 200 >>> def func(x): ... return x**3 + x**2 * np.sin(4 * x) >>> x = np.sort(np.random.random_sample(n) * 4 - 2) >>> y = func(x) + np.random.normal(scale=1.5, size=n)
生成平滑样条函数
>>> from scipy.interpolate import make_smoothing_spline >>> spl = make_smoothing_spline(x, y)
绘制两者
>>> import matplotlib.pyplot as plt >>> grid = np.linspace(x[0], x[-1], 400) >>> plt.plot(x, y, '.') >>> plt.plot(grid, spl(grid), label='Spline') >>> plt.plot(grid, func(grid), label='Original function') >>> plt.legend(loc='best') >>> plt.show()