scipy.stats.

ranksums#

scipy.stats.ranksums(x, y, alternative='two-sided', *, axis=0, nan_policy='propagate', keepdims=False)[source]#

计算两个样本的 Wilcoxon 秩和统计量。

Wilcoxon 秩和检验用于检验两组测量值是否来自同一分布的零假设。备择假设是，一个样本中的值比另一个样本中的值更有可能更大。

该测试应用于比较来自连续分布的两个样本。它不处理 x 和 y 中测量值之间的联系。对于联系处理和可选的连续性校正，请参见scipy.stats.mannwhitneyu。

参数:

x,yarray_like

来自两个样本的数据。

alternative{‘two-sided’, ‘less’, ‘greater’}, optional

定义备择假设。默认为 ‘two-sided’。以下选项可用

‘two-sided’：其中一个分布（基础 x 或 y）在随机上大于另一个分布。
‘less’：基础 x 的分布在随机上小于基础 y 的分布。
‘greater’：基础 x 的分布在随机上大于基础 y 的分布。

在版本 1.7.0 中添加。

axisint or None, default: 0

如果为 int，则为要计算统计量的输入轴。输入的每个轴切片（例如，行）的统计量将显示在输出的相应元素中。如果 None，则在计算统计量之前将拉平输入。

nan_policy{‘propagate’, ‘omit’, ‘raise’}

定义如何处理输入 NaN。

propagate：如果在计算统计量的轴切片（例如，行）中存在 NaN，则输出的相应条目将为 NaN。
omit：执行计算时将忽略 NaN。如果在计算统计量的轴切片中剩余的数据不足，则输出的相应条目将为 NaN。
raise：如果存在 NaN，将引发 ValueError。

keepdimsbool, default: False

如果将其设置为 True，则减少的轴将作为大小为 1 的维度留在结果中。使用此选项，结果将针对输入数组正确广播。

返回:

statisticfloat: 在大样本近似下，检验统计量是正态分布的秩和统计量。
pvaluefloat: 检验的 p 值。

注释

从 SciPy 1.9 开始，在执行计算之前，np.matrix 输入（不建议用于新代码）将转换为 np.ndarray。在这种情况下，输出将是标量或形状适当的 np.ndarray，而不是 2D np.matrix。同样，虽然忽略了屏蔽数组的屏蔽元素，但输出将是标量或 np.ndarray，而不是 mask=False 的屏蔽数组。

参考

[1]

https://en.wikipedia.org/wiki/Wilcoxon_rank-sum_test

示例

我们可以通过计算 Wilcoxon 秩和统计量来检验两个独立的不等大小样本是否来自同一分布的假设。

>>> import numpy as np
>>> from scipy.stats import ranksums
>>> rng = np.random.default_rng()
>>> sample1 = rng.uniform(-1, 1, 200)
>>> sample2 = rng.uniform(-0.5, 1.5, 300) # a shifted distribution
>>> ranksums(sample1, sample2)
RanksumsResult(statistic=-7.887059,
               pvalue=3.09390448e-15) # may vary
>>> ranksums(sample1, sample2, alternative='less')
RanksumsResult(statistic=-7.750585297581713,
               pvalue=4.573497606342543e-15) # may vary
>>> ranksums(sample1, sample2, alternative='greater')
RanksumsResult(statistic=-7.750585297581713,
               pvalue=0.9999999999999954) # may vary

小于 0.05 的 p 值表示该测试在 5% 的显着性水平上拒绝该假设。