scipy.stats.

wilcoxon#

scipy.stats.wilcoxon(x, y=None, zero_method='wilcox', correction=False, alternative='two-sided', method='auto', *, axis=0, nan_policy='propagate', keepdims=False)[source]#

计算 Wilcoxon 符号秩检验。

Wilcoxon 符号秩检验用于检验两个相关的配对样本是否来自同一分布的零假设。特别是，它检验差值 x - y 的分布是否关于零对称。它是配对 T 检验的非参数版本。

参数:

xarray_like

第一组测量值（在这种情况下，y 是第二组测量值），或者两组测量值之间的差值（在这种情况下，不应指定 y）。必须是一维的。

yarray_like，可选

第二组测量值（如果 x 是第一组测量值），或者未指定（如果 x 是两组测量值之间的差值）。必须是一维的。

警告

当提供 y 时，wilcoxon 根据 d = x - y 的绝对值的秩计算检验统计量。减法中的舍入误差可能导致即使在精确算术中它们是绑定的，d 的元素也被分配不同的秩。与其分别传递 x 和 y，不如考虑计算差值 x - y，根据需要进行舍入以确保只有真正唯一的元素在数值上是不同的，并将结果作为 x 传递，将 y 保留在默认值（None）。

zero_method{“wilcox”, “pratt”, “zsplit”}, 可选

对于具有相等值的观测对（“零差值”或“零”），有不同的约定。

“wilcox”：丢弃所有零差值（默认）；参见 [4]。
“pratt”：在排序过程中包括零差值，但删除零的秩（更保守）；参见 [3]。在这种情况下，正态近似按照 [5] 进行调整。
“zsplit”：在排序过程中包括零差值，并在正数和负数之间分割零秩。

correctionbool，可选

如果为 True，则在计算 z 统计量（如果使用正态近似）时，通过将 Wilcoxon 秩统计量朝均值调整 0.5 来应用连续性校正。默认为 False。

alternative{“two-sided”, “greater”, “less”}, 可选

定义备择假设。默认为“two-sided”。在下文中，令 d 表示配对样本之间的差值：如果同时提供了 x 和 y，则 d = x - y，否则 d = x。

“two-sided”：d 的底层分布关于零不对称。
“less”：d 的底层分布在随机上小于关于零对称的分布。
“greater”：d 的底层分布在随机上大于关于零对称的分布。

method{“auto”, “exact”, “asymptotic”} 或 PermutationMethod 实例，可选

计算 p 值的 Method，参见 Notes。默认为“auto”。

axisint 或 None，默认值：0

如果为 int，则为输入轴，用于计算统计量。输入的每个轴切片（例如，行）的统计量将出现在输出的相应元素中。如果 None，则输入将在计算统计量之前被展平。

nan_policy{‘propagate’, ‘omit’, ‘raise’}

定义如何处理输入 NaN。

propagate：如果在计算统计量的轴切片（例如，行）中存在 NaN，则输出的相应条目将为 NaN。
omit：执行计算时将省略 NaN。如果轴切片中剩余的数据不足以计算统计量，则输出的相应条目将为 NaN。
raise：如果存在 NaN，则会引发 ValueError。

keepdimsbool，默认值：False

如果将其设置为 True，则被缩减的轴将保留在结果中，作为大小为 1 的维度。使用此选项，结果将正确地广播到输入数组中。

返回值:

具有以下属性的对象。

statisticarray_like

如果 alternative 为“two-sided”，则为大于或小于零的差值的秩的总和，以较小者为准。否则为大于零的差值的秩的总和。

pvaluearray_like

测试的 p 值，具体取决于 alternative 和 method。

zstatisticarray_like

当 method = 'asymptotic' 时，这是归一化的 z 统计量

z = (T - mn - d) / se

其中 T 是如上定义的 statistic，mn 是零假设下的分布的均值，d 是连续性校正，se 是标准误差。当 method != 'asymptotic' 时，此属性不可用。

另请参见

kruskal、mannwhitneyu

注释

在下文中，令 d 表示配对样本之间的差值：如果同时提供了 x 和 y，则 d = x - y，否则 d = x。假设 d 的所有元素都是独立且相同分布的观测值，并且所有元素都不同且非零。

当 len(d) 足够大时，归一化检验统计量（上面的 zstatistic）的零分布近似于正态分布，并且可以使用 method = 'asymptotic' 来计算 p 值。
当 len(d) 较小时，正态近似可能不准确，并且首选 method='exact'（以额外的执行时间为代价）。
默认值 method='auto' 在两者之间进行选择：当 len(d) <= 50 时使用 method='exact'，否则使用 method='asymptotic'。

“绑定”（即，并非 d 的所有元素都是唯一的）或“零”（即，d 的元素为零）的存在会改变检验统计量的零分布，并且 method='exact' 不再计算精确的 p 值。如果 method='asymptotic'，则调整 z 统计量以更准确地与标准正态分布进行比较，但即便如此，对于有限样本大小，标准正态分布只是 z 统计量的真实零分布的近似值。对于这种情况，method 参数也接受 PermutationMethod 的实例。在这种情况下，使用 permutation_test 以及提供的配置选项和其他适当的设置来计算 p 值。

绑定和零的存在会相应地影响 method='auto' 的分辨率：当 len(d) <= 13 时执行穷举排列，否则使用渐近方法。请注意，即使对于 len(d) > 14，渐近方法也可能不是很准确；选择阈值是为了在执行时间和准确性之间取得折衷，前提是结果必须是确定性的。考虑手动提供 PermutationMethod 方法的实例，选择 n_resamples 参数以平衡时间限制和准确性要求。

另请注意，在所有 d 元素都为零的边缘情况下，如果 zero_method='wilcox' 或 zero_method='pratt'，则无法计算依赖于正态近似的 p 值 (NaN)。

从 SciPy 1.9 开始，在执行计算之前，np.matrix 输入（不建议用于新代码）会转换为 np.ndarray。在这种情况下，输出将是标量或具有适当形状的 np.ndarray，而不是 2D np.matrix。同样，虽然忽略了屏蔽数组的屏蔽元素，但输出将是标量或 np.ndarray，而不是 mask=False 的屏蔽数组。

参考文献

[1]

https://en.wikipedia.org/wiki/Wilcoxon_signed-rank_test

[2]

Conover, W.J., Practical Nonparametric Statistics, 1971.

[3]

Pratt, J.W., Remarks on Zeros and Ties in the Wilcoxon Signed Rank Procedures, Journal of the American Statistical Association, Vol. 54, 1959, pp. 655-667. DOI:10.1080/01621459.1959.10501526

[4] (1,2)

Wilcoxon, F., Individual Comparisons by Ranking Methods, Biometrics Bulletin, Vol. 1, 1945, pp. 80-83. DOI:10.2307/3001968

[5]

Cureton, E.E., The Normal Approximation to the Signed-Rank Sampling Distribution When Zero Differences are Present, Journal of the American Statistical Association, Vol. 62, 1967, pp. 1068-1069. DOI:10.1080/01621459.1967.10500917

示例

在 [4] 中，交叉授粉和自花授粉玉米植株之间的高度差如下所示

>>> d = [6, 8, 14, 16, 23, 24, 28, 29, 41, -48, 49, 56, 60, -67, 75]

交叉授粉的植物似乎更高。为了检验不存在高度差异的零假设，我们可以应用双侧检验

>>> from scipy.stats import wilcoxon
>>> res = wilcoxon(d)
>>> res.statistic, res.pvalue
(24.0, 0.041259765625)

因此，我们将在 5% 的置信水平上拒绝零假设，并得出结论，两组之间存在高度差异。为了确认可以假设差异的中位数为正数，我们使用

>>> res = wilcoxon(d, alternative='greater')
>>> res.statistic, res.pvalue
(96.0, 0.0206298828125)

这表明可以在 5% 的置信水平上拒绝中位数为负数的零假设，而支持中位数大于零的备择假设。上面的 p 值是精确的。使用正态近似会得出非常相似的值

>>> res = wilcoxon(d, method='asymptotic')
>>> res.statistic, res.pvalue
(24.0, 0.04088813291185591)

请注意，在单侧情况下，统计量变为 96（正差异的秩的总和），而在双侧情况下，统计量为 24（大于和小于零的秩的总和的最小值）。

在上面的示例中，成对植物之间的高度差异直接提供给 wilcoxon。或者，wilcoxon 接受两个等长的样本，计算成对元素之间的差异，然后执行测试。考虑样本 x 和 y

>>> import numpy as np
>>> x = np.array([0.5, 0.825, 0.375, 0.5])
>>> y = np.array([0.525, 0.775, 0.325, 0.55])
>>> res = wilcoxon(x, y, alternative='greater')
>>> res
WilcoxonResult(statistic=5.0, pvalue=0.5625)

请注意，如果我们手动计算差异，则测试会产生不同的结果

>>> d = [-0.025, 0.05, 0.05, -0.05]
>>> ref = wilcoxon(d, alternative='greater')
>>> ref
WilcoxonResult(statistic=6.0, pvalue=0.5)

这种显着差异是由于 x-y 的结果中的舍入误差造成的

>>> d - (x-y)
array([2.08166817e-17, 6.93889390e-17, 1.38777878e-17, 4.16333634e-17])

即使我们期望 (x-y)[1:] 的所有元素都具有相同的大小 0.05，但实际上它们具有略微不同的大小，因此在测试中分配了不同的秩。在执行测试之前，请考虑计算 d 并根据需要进行调整，以确保理论上相同的值在数值上不相同。例如

>>> d2 = np.around(x - y, decimals=3)
>>> wilcoxon(d2, alternative='greater')
WilcoxonResult(statistic=6.0, pvalue=0.5)