scipy.stats.

bws_test#

scipy.stats.bws_test(x, y, *, alternative='two-sided', method=None)[源代码]#

对两个独立样本执行 Baumgartner-Weiss-Schindler 测试。

Baumgartner-Weiss-Schindler (BWS) 测试是对零假设的非参数检验,该零假设认为样本 x 的底层分布与样本 y 的底层分布相同。与 Kolmogorov-Smirnov、Wilcoxon 和 Cramer-Von Mises 测试不同,BWS 测试通过累积分布函数 (CDF) 差异的方差来加权积分,强调分布的尾部,这增加了测试在许多应用中的功效。

参数:
x, y类数组

样本的一维数组。

alternative{‘two-sided’, ‘less’, ‘greater’}, 可选

定义备择假设。默认为 ‘two-sided’。设 F(u)G(u) 分别为 xy 底层分布的累积分布函数。然后有以下备择假设可用

  • ‘two-sided’:分布不相等,即对于至少一个 uF(u) ≠ G(u)

  • ‘less’:x 的底层分布在随机上小于 y 的底层分布,即对于所有 uF(u) >= G(u)

  • ‘greater’:x 的底层分布在随机上大于 y 的底层分布,即对于所有 uF(u) <= G(u)

在更严格的假设集下,备择假设可以用分布的位置来表达;请参见 [2] 第 5.1 节。

methodPermutationMethod, 可选

配置用于计算 p 值的 方法。默认值为默认的 PermutationMethod 对象。

返回:
resPermutationTestResult
具有以下属性的对象
statisticfloat

数据的观测测试统计量。

pvaluefloat

给定备择假设的 p 值。

null_distributionndarray

在零假设下生成的测试统计量的值。

注释

alternative=='two-sided' 时,统计量由 [1] 第 2 节中给出的公式定义。此统计量不适用于单侧备择假设;在这种情况下,该统计量是 [1] 第 2 节中公式给出的统计量的负值。因此,当第一个样本的分布在随机上大于第二个样本的分布时,统计量将趋向于正值。

参考文献

[1] (1,2,3,4,5)

Neuhäuser, M. (2005). 基于 Baumgartner-Weiss-Schindler 统计量的精确检验:综述。统计论文,46(1), 1-29。

[2]

Fay, M. P., & Proschan, M. A. (2010). Wilcoxon-Mann-Whitney 检验还是 t 检验?关于假设检验的假设和决策规则的多种解释。统计调查,4, 1。

示例

我们遵循 [1] 中的表 3 的示例:十四名儿童被随机分为两组。他们在执行特定测试时的排名如下。

>>> import numpy as np
>>> x = [1, 2, 3, 4, 6, 7, 8]
>>> y = [5, 9, 10, 11, 12, 13, 14]

我们使用 BWS 测试来评估两组之间是否存在统计学上的显著差异。零假设是两组之间的表现分布没有差异。我们决定需要 1% 的显著性水平才能拒绝零假设,并支持备择假设,即分布是不同的。由于样本数量非常少,我们可以将观测到的测试统计量与零假设下测试统计量的精确分布进行比较。

>>> from scipy.stats import bws_test
>>> res = bws_test(x, y)
>>> print(res.statistic)
5.132167152575315

这与 [1] 中报告的 \(B = 5.132\) 一致。bws_test 生成的 p 值也与 [1] 中报告的 \(p = 0.0029\) 一致。

>>> print(res.pvalue)
0.002913752913752914

由于 p 值低于我们 1% 的阈值,我们将其视为反对零假设的证据,并支持两组之间表现存在差异的备择假设。