brunnermunzel#
- scipy.stats.brunnermunzel(x, y, alternative='two-sided', distribution='t', nan_policy='propagate', *, axis=0, keepdims=False)[source]#
计算样本 x 和 y 的 Brunner-Munzel 检验。
Brunner-Munzel 检验是一种非参数检验,用于检验以下零假设:当从每个组中逐个获取值时,两组中获得大值的概率相等。与 Wilcoxon-Mann-Whitney 的 U 检验不同,这不需要两组的等方差假设。请注意,这并不假设分布相同。此检验适用于两个独立的样本,它们的样本大小可能不同。
- 参数:
- x, yarray_like
样本数组,应为一维。
- alternative{‘two-sided’, ‘less’, ‘greater’}, optional
定义备择假设。以下选项可用(默认为 ‘two-sided’)
‘two-sided’
‘less’: 单侧
‘greater’: 单侧
- distribution{‘t’, ‘normal’}, optional
定义如何获取 p 值。以下选项可用(默认为 ‘t’)
‘t’: 通过 t 分布获取 p 值
‘normal’: 通过标准正态分布获取 p 值。
- nan_policy{‘propagate’, ‘omit’, ‘raise’}
定义如何处理输入 NaN。
propagate
: 如果在计算统计量的轴切片(例如,行)中存在 NaN,则输出的相应条目将为 NaN。omit
: 执行计算时将忽略 NaN。 如果计算统计量的轴切片中剩余的数据不足,则输出的相应条目将为 NaN。raise
: 如果存在 NaN,则会引发ValueError
。
- axisint 或 None,默认值:0
如果为 int,则为沿其计算统计量的输入轴。 输入的每个轴切片(例如,行)的统计量将显示在输出的相应元素中。 如果为
None
,则在计算统计量之前将输入展平。- keepdimsbool,默认值:False
如果设置为 True,则缩小的轴将作为大小为 1 的维度保留在结果中。 使用此选项,结果将正确广播到输入数组。
- 返回值:
- statisticfloat
Brunner-Munzer W 统计量。
- pvaluefloat
p 值,假设为 t 分布。 单侧或双侧,取决于 alternative 和 distribution 的选择。
另请参见
mannwhitneyu
对两个样本进行 Mann-Whitney 秩检验。
注释
Brunner 和 Munzel 建议当数据大小为 50 或更小时,使用 t 分布估计 p 值。如果大小小于 10,最好使用置换 Brunner Munzel 检验(参见 [2])。
从 SciPy 1.9 开始,
np.matrix
输入(不建议用于新代码)在执行计算之前会转换为np.ndarray
。 在这种情况下,输出将是标量或具有适当形状的np.ndarray
,而不是 2Dnp.matrix
。 同样,虽然会忽略屏蔽数组的屏蔽元素,但输出将是标量或np.ndarray
,而不是mask=False
的屏蔽数组。参考文献
[1]Brunner, E. and Munzel, U. “The nonparametric Benhrens-Fisher problem: Asymptotic theory and a small-sample approximation”. Biometrical Journal. Vol. 42(2000): 17-25.
[2]Neubert, K. and Brunner, E. “A studentized permutation test for the non-parametric Behrens-Fisher problem”. Computational Statistics and Data Analysis. Vol. 51(2007): 5192-5204.
示例
>>> from scipy import stats >>> x1 = [1,2,1,1,1,1,1,1,1,1,2,4,1,1] >>> x2 = [3,3,4,3,1,2,3,1,1,5,4] >>> w, p_value = stats.brunnermunzel(x1, x2) >>> w 3.1374674823029505 >>> p_value 0.0057862086661515377