scipy.stats.

ranksums#

scipy.stats.ranksums(x, y, alternative='two-sided', *, axis=0, nan_policy='propagate', keepdims=False)[source]#

计算两个样本的 Wilcoxon 秩和统计量。

Wilcoxon 秩和检验检验两个测量数据集是否来自同一分布的零假设。备择假设是,一个样本中的值比另一个样本中的值更有可能更大。

此检验应用于比较来自连续分布的两个样本。它不处理 x 和 y 中测量值之间的平局。有关平局处理和可选的连续性校正,请参阅 scipy.stats.mannwhitneyu

参数:
x,yarray_like

来自两个样本的数据。

alternative{‘two-sided’, ‘less’, ‘greater’}, 可选

定义备择假设。默认为“双侧”。以下选项可用:

  • ‘two-sided’:其中一个分布(底层 xy)在统计上大于另一个分布。

  • ‘less’:底层 x 的分布在统计上小于底层 y 的分布。

  • ‘greater’:底层 x 的分布在统计上大于底层 y 的分布。

版本 1.7.0 中新增。

axisint 或 None, 默认: 0

如果为 int,则为输入沿其计算统计量的轴。输入的每个轴切片(例如,行)的统计量将出现在输出的相应元素中。如果为 None,则在计算统计量之前将输入展平。

nan_policy{‘propagate’, ‘omit’, ‘raise’}

定义如何处理输入 NaN。

  • propagate:如果计算统计量的轴切片(例如,行)中存在 NaN,则输出的相应条目将为 NaN。

  • omit:在执行计算时将忽略 NaN。如果计算统计量的轴切片中剩余数据不足,则输出的相应条目将为 NaN。

  • raise:如果存在 NaN,将引发 ValueError

keepdimsbool, 默认: False

如果设置为 True,则减少的轴将保留在结果中,作为大小为一的维度。使用此选项,结果将与输入数组正确广播。

返回:
statisticfloat

在大样本近似下,秩和统计量呈正态分布的检验统计量。

pvaluefloat

测试的 p 值。

附注

从 SciPy 1.9 开始,np.matrix 输入(不推荐用于新代码)在执行计算之前转换为 np.ndarray。在这种情况下,输出将是标量或适当形状的 np.ndarray,而不是 2D np.matrix。类似地,虽然被掩码数组的被掩码元素被忽略,但输出将是标量或 np.ndarray,而不是带有 mask=False 的被掩码数组。

数组 API 标准支持

ranksums 除了 NumPy 之外,还对 Python Array API Standard 兼容的后端提供实验性支持。请考虑通过设置环境变量 SCIPY_ARRAY_API=1 并提供 CuPy、PyTorch、JAX 或 Dask 数组作为数组参数来测试这些功能。支持以下后端和设备(或其他功能)组合。

CPU

GPU

NumPy

不适用

CuPy

不适用

PyTorch

JAX

Dask

不适用

有关更多信息,请参阅 对数组 API 标准的支持

参考文献

示例

我们可以通过计算 Wilcoxon 秩和统计量来检验两个独立的、大小不等的样本是否来自同一分布的假设。

>>> import numpy as np
>>> from scipy.stats import ranksums
>>> rng = np.random.default_rng()
>>> sample1 = rng.uniform(-1, 1, 200)
>>> sample2 = rng.uniform(-0.5, 1.5, 300) # a shifted distribution
>>> ranksums(sample1, sample2)
RanksumsResult(statistic=-7.887059,
               pvalue=3.09390448e-15) # may vary
>>> ranksums(sample1, sample2, alternative='less')
RanksumsResult(statistic=-7.750585297581713,
               pvalue=4.573497606342543e-15) # may vary
>>> ranksums(sample1, sample2, alternative='greater')
RanksumsResult(statistic=-7.750585297581713,
               pvalue=0.9999999999999954) # may vary

小于 0.05 的 p 值表明此检验在 5% 的显著性水平上拒绝假设。