scipy.stats.

alexandergovern#

scipy.stats.alexandergovern(*samples, nan_policy='propagate', axis=0, keepdims=False)[源代码]#

执行 Alexander Govern 检验。

Alexander-Govern 近似检验用于在方差异质性的情况下检验 k 个独立均值的相等性。该检验应用于来自两个或多个组的样本,这些组的大小可能不同。

参数:
sample1, sample2, …array_like

每个组的样本测量值。必须至少有两个样本,并且每个样本必须包含至少两个观测值。

nan_policy{‘propagate’, ‘omit’, ‘raise’}

定义如何处理输入的 NaN。

  • propagate:如果沿计算统计量的轴切片(例如,行)中存在 NaN,则输出的相应条目将为 NaN。

  • omit:在执行计算时将忽略 NaN。如果沿计算统计量的轴切片中剩余的数据不足,则输出的相应条目将为 NaN。

  • raise:如果存在 NaN,将引发 ValueError

axisint 或 None,默认值:0

如果为 int,则为沿其计算统计量的输入的轴。输入的每个轴切片(例如,行)的统计量将显示在输出的相应元素中。如果为 None,则在计算统计量之前将展平输入。

keepdimsbool,默认值:False

如果将其设置为 True,则会将缩减的轴保留在结果中,作为大小为 1 的维度。使用此选项,结果将正确地广播到输入数组。

返回:
resAlexanderGovernResult

具有属性的对象

statisticfloat

检验的计算出的 A 统计量。

pvaluefloat

来自卡方分布的相关 p 值。

警告:
ConstantInputWarning

如果输入是常量数组,则会引发此警告。在这种情况下,未定义统计量,因此返回 np.nan

另请参阅

f_oneway

单因素方差分析

注释

此检验的使用依赖于几个假设。

  1. 样本是独立的。

  2. 每个样本都来自正态分布的总体。

  3. f_oneway 不同,此检验不假设同方差性,而是放宽了方差相等的假设。

输入样本必须是有限的、一维的,并且大小大于 1。

从 SciPy 1.9 开始,在执行计算之前,np.matrix 输入(不建议用于新代码)将转换为 np.ndarray。在这种情况下,输出将是标量或适当形状的 np.ndarray,而不是二维 np.matrix。类似地,虽然会忽略掩码数组的掩码元素,但输出将是标量或 np.ndarray,而不是 mask=False 的掩码数组。

参考文献

[1]

Alexander, Ralph A., and Diane M. Govern. “A New and Simpler Approximation for ANOVA under Variance Heterogeneity.” Journal of Educational Statistics, vol. 19, no. 2, 1994, pp. 91-101. JSTOR, www.jstor.org/stable/1165140. Accessed 12 Sept. 2020.

示例

>>> from scipy.stats import alexandergovern

以下是一些关于美国四个城市九家最大银行的新车贷款的年度百分比利率的数据,这些数据取自美国国家标准与技术研究院的 ANOVA 数据集。

我们使用 alexandergovern 来检验所有城市的平均年利率相同的零假设,与城市并非都具有相同的平均年利率的备择假设。我们决定需要 5% 的显著性水平才能拒绝零假设,从而支持备择假设。

>>> atlanta = [13.75, 13.75, 13.5, 13.5, 13.0, 13.0, 13.0, 12.75, 12.5]
>>> chicago = [14.25, 13.0, 12.75, 12.5, 12.5, 12.4, 12.3, 11.9, 11.9]
>>> houston = [14.0, 14.0, 13.51, 13.5, 13.5, 13.25, 13.0, 12.5, 12.5]
>>> memphis = [15.0, 14.0, 13.75, 13.59, 13.25, 12.97, 12.5, 12.25,
...           11.89]
>>> alexandergovern(atlanta, chicago, houston, memphis)
AlexanderGovernResult(statistic=4.65087071883494,
                      pvalue=0.19922132490385214)

p 值为 0.1992,表明在零假设下,观察到如此极端的检验统计量值的可能性接近 20%。这超过了 5%,因此我们不拒绝零假设,从而支持备择假设。