scipy.stats.

levene#

scipy.stats.levene(*samples, center='median', proportiontocut=0.05, axis=0, nan_policy='propagate', keepdims=False)[source]#

执行 Levene 检验，用于检验方差是否相等。

Levene 检验检验所有输入样本是否来自具有相等方差的总体的零假设。Levene 检验是 Bartlett 检验 bartlett 的替代方案，尤其是在存在显著偏离正态分布的情况下。

参数:

sample1, sample2, …array_like

样本数据，长度可能不同。只接受一维样本。

center{‘mean’, ‘median’, ‘trimmed’}, optional

在检验中使用数据的哪个函数。默认值为“median”。

proportiontocutfloat, optional

当 center 为“trimmed”时，这给出了从每一端截取的数据点比例。（请参阅 scipy.stats.trim_mean。）默认值为 0.05。

axisint 或 None，默认值：0

如果为 int，则为计算统计量的输入轴。输入的每个轴切片（例如，行）的统计量将出现在输出的相应元素中。如果为 None，则将在计算统计量之前将输入展开。

nan_policy{‘propagate’, ‘omit’, ‘raise’}

定义如何处理输入 NaN。

propagate：如果沿计算统计量的轴切片（例如，行）中存在 NaN，则输出的相应条目将为 NaN。
omit：执行计算时将省略 NaN。如果沿计算统计量的轴切片中剩余的数据不足，则输出的相应条目将为 NaN。
raise：如果存在 NaN，将引发 ValueError。

keepdimsbool，默认值：False

如果设置为 True，则减少的轴将保留在结果中，作为大小为 1 的维度。使用此选项，结果将针对输入数组正确广播。

返回值:

statisticfloat: 检验统计量。
pvaluefloat: 检验的 p 值。

另请参阅

fligner: 用于检验 k 个方差是否相等的非参数检验
bartlett: 用于检验正态样本中 k 个方差是否相等的参数检验
Levene 检验，用于检验方差是否相等: 扩展示例

注释

Levene 检验有三种变体。可能性及其推荐用法是

“median”：推荐用于偏斜（非正态）分布>
“mean”：推荐用于对称、中等尾部分布。
“trimmed”：推荐用于重尾分布。

使用均值的检验版本是在 Levene 的原始文章 ([2]) 中提出的，而中位数和截尾均值已由 Brown 和 Forsythe ([3]) 研究，有时也称为 Brown-Forsythe 检验。

从 SciPy 1.9 开始，np.matrix 输入（不推荐用于新代码）在执行计算之前转换为 np.ndarray。在这种情况下，输出将是标量或具有适当形状的 np.ndarray，而不是 2D np.matrix。同样，虽然忽略了掩码数组的掩码元素，但输出将是标量或 np.ndarray，而不是 mask=False 的掩码数组。

参考

[1]

https://www.itl.nist.gov/div898/handbook/eda/section3/eda35a.htm

[2]

Levene, H. (1960). In Contributions to Probability and Statistics: Essays in Honor of Harold Hotelling, I. Olkin et al. eds., Stanford University Press, pp. 278-292.

[3]

Brown, M. B. and Forsythe, A. B. (1974), Journal of the American Statistical Association, 69, 364-367

示例

测试列表 a、b 和 c 是否来自具有相等方差的总体。

>>> import numpy as np
>>> from scipy import stats
>>> a = [8.88, 9.12, 9.04, 8.98, 9.00, 9.08, 9.01, 8.85, 9.06, 8.99]
>>> b = [8.88, 8.95, 9.29, 9.44, 9.15, 9.58, 8.36, 9.18, 8.67, 9.05]
>>> c = [8.95, 9.12, 8.95, 8.85, 9.03, 8.84, 9.07, 8.98, 8.86, 8.98]
>>> stat, p = stats.levene(a, b, c)
>>> p
0.002431505967249681

小的 p 值表明总体不具有相等的方差。

这并不奇怪，因为 b 的样本方差远大于 a 和 c 的样本方差

>>> [np.var(x, ddof=1) for x in [a, b, c]]
[0.007054444444444413, 0.13073888888888888, 0.008890000000000002]

有关更详细的示例，请参阅 Levene 检验，用于检验方差是否相等。