scipy.stats.mstats.

sen_seasonal_slopes#

scipy.stats.mstats.sen_seasonal_slopes(x)[源代码]#

计算季节性 Thiel-Sen 和 Kendall 斜率估计值。

Sen 斜率的季节性泛化计算出了 2D 数组的“季节”(列)内所有值对之间的斜率。它返回一个包含每个季节的这些“季节内部”斜率的中位数的数组(每个季节的 Thiel-Sen 斜率估计值),并且返回所有季节内季节内部斜率的中位数(季节性 Kendall 斜率估计值)。

参数:
x2D 数组类似物

x 的每一列都包含一个季节中因变量的测量值。每个季节的自变量(通常为时间)假定为 np.arange(x.shape[0])

返回:
resultSenSeasonalSlopesResult 实例

返回值是一个包含以下属性的对象

intra_slopendarray

对于每个季节,Thiel-Sen 斜率估计值:季节内部斜率的中位数。

inter_slopefloat

季节性 Kendall 斜率估计值:所有季节的季节内部斜率的中位数。

另请参阅

theilslopes

非季节性数据的类似函数

scipy.stats.theilslopes

非掩码数组的非季节性斜率

备注

\(i\) 季节内的斜率 \(d_{ijk}\) 为:

\[d_{ijk} = \frac{x_{ij} - x_{ik}} {j - k}\]

对于 \(x\) 的成对离散整数索引 \(j, k\)

返回的 intra_slope 数组的元素 \(i\) 是所有 \( j < k \)\(d_{ijk}\) 的中位数;这是第 \(i\) 个季节的 Theil-Sen 斜率估计器。返回的 inter_slope 值,也称为季节性 Kendall 斜率估计器,是所有 \( i, j, k\)\(d_{ijk}\) 的中位数。

参考文献

[1]

Hirsch,Robert M.,James R. Slack 和 Richard A. Smith。“每月水质数据趋势分析技术”。水资源研究 18.1 (1982):107-121。

示例

假设我们有四个季节中的每一个的因变量的 100 个观测值

>>> import numpy as np
>>> rng = np.random.default_rng()
>>> x = rng.random(size=(100, 4))

我们计算以下季节性斜率:

>>> from scipy import stats
>>> intra_slope, inter_slope = stats.mstats.sen_seasonal_slopes(x)

如果我们定义一个函数来计算同一季节内观测值之间所有斜率

>>> def dijk(yi):
...     n = len(yi)
...     x = np.arange(n)
...     dy = yi - yi[:, np.newaxis]
...     dx = x - x[:, np.newaxis]
...     # we only want unique pairs of distinct indices
...     mask = np.triu(np.ones((n, n), dtype=bool), k=1)
...     return dy[mask]/dx[mask]

intra_slope 的元素 idijk[x[:, i]] 的中位数

>>> i = 2
>>> np.allclose(np.median(dijk(x[:, i])), intra_slope[i])
True

inter_slopedijk 返回的所有季节值的中位数

>>> all_slopes = np.concatenate([dijk(x[:, i]) for i in range(x.shape[1])])
>>> np.allclose(np.median(all_slopes), inter_slope)
True

由于数据是随机生成的,我们预期中位数斜率在所有季节内和跨所有季节都会接近于零,事实上它们也是如此

>>> intra_slope.data
array([ 0.00124504, -0.00277761, -0.00221245, -0.00036338])
>>> inter_slope
-0.0010511779872922058