ranksums#
- scipy.stats.ranksums(x, y, alternative='two-sided', *, axis=0, nan_policy='propagate', keepdims=False)[源代码]#
计算两个样本的 Wilcoxon 秩和统计量。
Wilcoxon 秩和检验检验两个测量值集合是否来自同一分布的零假设。备择假设是一个样本中的值比另一个样本中的值更有可能更大。
此检验应用于比较来自连续分布的两个样本。它不处理 x 和 y 中测量值之间的并列。有关并列处理和可选的连续性校正,请参阅
scipy.stats.mannwhitneyu
。- 参数:
- x,yarray_like
来自两个样本的数据。
- alternative{‘two-sided’, ‘less’, ‘greater’}, optional
定义备择假设。默认为 ‘two-sided’。以下选项可用
‘two-sided’: 其中一个分布(基础 x 或 y)在随机上大于另一个分布。
‘less’: 基础 x 的分布在随机上小于基础 y 的分布。
‘greater’: 基础 x 的分布在随机上大于基础 y 的分布。
在 1.7.0 版本中添加。
- axisint 或 None,默认值:0
如果为 int,则为计算统计量的输入轴。输入的每个轴切片(例如,行)的统计量将显示在输出的相应元素中。如果
None
,则输入将在计算统计量之前被展平。- nan_policy{‘propagate’, ‘omit’, ‘raise’}
定义如何处理输入 NaN。
propagate
: 如果在计算统计量的轴切片(例如,行)中存在 NaN,则输出的相应条目将为 NaN。omit
: 在执行计算时将省略 NaN。如果计算统计量的轴切片中剩余的数据不足,则输出的相应条目将为 NaN。raise
: 如果存在 NaN,则将引发ValueError
。
- keepdimsbool,默认值:False
如果设置为 True,则减少的轴将作为大小为 1 的维度保留在结果中。使用此选项,结果将正确地广播到输入数组。
- 返回:
- statisticfloat
在大样本近似下,秩和统计量呈正态分布的检验统计量。
- pvaluefloat
检验的 p 值。
注释
从 SciPy 1.9 开始,
np.matrix
输入(不建议用于新代码)在执行计算之前转换为np.ndarray
。在这种情况下,输出将是标量或适当形状的np.ndarray
,而不是 2Dnp.matrix
。同样,尽管忽略了掩码数组的掩码元素,但输出将是标量或np.ndarray
,而不是mask=False
的掩码数组。参考文献
示例
我们可以通过计算 Wilcoxon 秩和统计量来检验两个独立的、大小不等的样本是否来自同一分布的假设。
>>> import numpy as np >>> from scipy.stats import ranksums >>> rng = np.random.default_rng() >>> sample1 = rng.uniform(-1, 1, 200) >>> sample2 = rng.uniform(-0.5, 1.5, 300) # a shifted distribution >>> ranksums(sample1, sample2) RanksumsResult(statistic=-7.887059, pvalue=3.09390448e-15) # may vary >>> ranksums(sample1, sample2, alternative='less') RanksumsResult(statistic=-7.750585297581713, pvalue=4.573497606342543e-15) # may vary >>> ranksums(sample1, sample2, alternative='greater') RanksumsResult(statistic=-7.750585297581713, pvalue=0.9999999999999954) # may vary
小于
0.05
的 p 值表明此检验以 5% 的显著性水平拒绝该假设。