Levene检验:方差相等性检验#

Levene检验 scipy.stats.levene 检验所有输入样本是否来自方差相等的总体的零假设。在数据显著偏离正态性时,Levene检验是Bartlett检验 scipy.stats.bartlett 的替代方案。

[1] 中,研究了维生素C对豚鼠牙齿生长的影响。在一项对照研究中,60只受试豚鼠被分为小剂量组、中剂量组和大剂量组,分别每日接受0.5、1.0和2.0毫克维生素C。42天后,测量了牙齿生长情况。

下方的 small_dosemedium_doselarge_dose 数组记录了三个组的牙齿生长测量值(单位:微米)。

import numpy as np
small_dose = np.array([
    4.2, 11.5, 7.3, 5.8, 6.4, 10, 11.2, 11.2, 5.2, 7,
    15.2, 21.5, 17.6, 9.7, 14.5, 10, 8.2, 9.4, 16.5, 9.7
])
medium_dose = np.array([
    16.5, 16.5, 15.2, 17.3, 22.5, 17.3, 13.6, 14.5, 18.8, 15.5,
    19.7, 23.3, 23.6, 26.4, 20, 25.2, 25.8, 21.2, 14.5, 27.3
])
large_dose = np.array([
    23.6, 18.5, 33.9, 25.5, 26.4, 32.5, 26.7, 21.5, 23.3, 29.5,
    25.5, 26.4, 22.4, 24.5, 24.8, 30.9, 26.4, 27.3, 29.4, 23
])

scipy.stats.levene 统计量对样本间方差的差异敏感。

from scipy import stats
res = stats.levene(small_dose, medium_dose, large_dose)
res.statistic
np.float64(0.6457341109631506)

当方差差异很大时,统计量的值往往较高。

我们可以通过将统计量的观测值与零分布进行比较来检验各组方差是否不相等:零分布是在总体方差相等的零假设下得出的统计量值分布。

对于此检验,零分布遵循下方所示的F分布。

import matplotlib.pyplot as plt
k, n = 3, 60   # number of samples, total number of observations
dist = stats.f(dfn=k-1, dfd=n-k)
val = np.linspace(0, 5, 100)
pdf = dist.pdf(val)
fig, ax = plt.subplots(figsize=(8, 5))

def plot(ax):  # we'll reuse this
    ax.plot(val, pdf, color='C0')
    ax.set_title("Levene Test Null Distribution")
    ax.set_xlabel("statistic")
    ax.set_ylabel("probability density")
    ax.set_xlim(0, 5)
    ax.set_ylim(0, 1)

plot(ax)
plt.show()
../../_images/354e79001920cc723f7d0273dd8576e15fcff56ed41dcb37353f34a96e0ae756.png

比较通过p值量化:零分布中大于或等于统计量观测值的比例。

fig, ax = plt.subplots(figsize=(8, 5))
plot(ax)
pvalue = dist.sf(res.statistic)
annotation = (f'p-value={pvalue:.3f}\n(shaded area)')
props = dict(facecolor='black', width=1, headwidth=5, headlength=8)
_ = ax.annotate(annotation, (1.5, 0.22), (2.25, 0.3), arrowprops=props)
i = val >= res.statistic
ax.fill_between(val[i], y1=0, y2=pdf[i], color='C0')
plt.show()
../../_images/145c8de42c7dd69ca9769ffaff929a61a11cc0e77ce0b90917df7f02bf3b13be.png
res.pvalue
np.float64(0.5280694573759905)

如果p值“很小”——即从方差相同的分布中抽样数据,产生如此极端的统计量值的概率很低——这可以作为反对零假设的证据,转而支持备择假设:各组的方差不相等。请注意

  • 反之则不然;也就是说,此检验不能用于为零假设提供证据。

  • P值被视为“小”的阈值应在数据分析前确定 [2],并考虑假阳性(错误地拒绝零假设)和假阴性(未能拒绝错误的零假设)的风险。

  • 小的p值并非是存在效应的证据;相反,它们只能提供“显著”效应的证据,这意味着它们在零假设下不太可能发生。

请注意,F分布提供了零分布的渐近近似。对于小样本,执行置换检验可能更合适:在所有三个样本均来自同一总体的零假设下,每个测量值在三个样本中的任何一个中被观察到的可能性是相等的。因此,我们可以通过计算将观测值随机划分为三个样本的多次随机生成分区下的统计量来形成一个随机化的零分布。

def statistic(*samples):
    return stats.levene(*samples).statistic
ref = stats.permutation_test(
    (small_dose, medium_dose, large_dose), statistic,
    permutation_type='independent', alternative='greater'
)
fig, ax = plt.subplots(figsize=(8, 5))
plot(ax)
bins = np.linspace(0, 5, 25)
ax.hist(
    ref.null_distribution, bins=bins, density=True, facecolor="C1"
)
ax.legend(['asymptotic approximation\n(many observations)',
           'randomized null distribution'])
plot(ax)
plt.show()
../../_images/790fd5aa693a08819c5c26d7582a99f5e7a46de110e51ccf1dba5f627dad75b8.png
ref.pvalue  # randomized test p-value
np.float64(0.4568)

请注意,这里计算出的p值与上方 scipy.stats.levene 返回的渐近近似之间存在显著差异。从置换检验中可以严格得出的统计推断是有限的;然而,在许多情况下,它们可能是首选方法 [3]

参考文献#