方差相等性的 Fligner-Killeen 检验#
在 [1] 中,研究了维生素 C 对豚鼠牙齿生长的影响。在一项对照研究中,60 名受试者被分为小剂量、中剂量和大剂量组,分别每日服用 0.5、1.0 和 2.0 毫克的维生素 C。42 天后,测量了牙齿的生长情况。
下面的 small_dose
、medium_dose
和 large_dose
数组记录了三组牙齿生长的测量值,单位为微米。
import numpy as np
small_dose = np.array([
4.2, 11.5, 7.3, 5.8, 6.4, 10, 11.2, 11.2, 5.2, 7,
15.2, 21.5, 17.6, 9.7, 14.5, 10, 8.2, 9.4, 16.5, 9.7
])
medium_dose = np.array([
16.5, 16.5, 15.2, 17.3, 22.5, 17.3, 13.6, 14.5, 18.8, 15.5,
19.7, 23.3, 23.6, 26.4, 20, 25.2, 25.8, 21.2, 14.5, 27.3
])
large_dose = np.array([
23.6, 18.5, 33.9, 25.5, 26.4, 32.5, 26.7, 21.5, 23.3, 29.5,
25.5, 26.4, 22.4, 24.5, 24.8, 30.9, 26.4, 27.3, 29.4, 23
])
Fligner-Killeen 统计量(scipy.stats.fligner
)对样本之间方差的差异敏感。
from scipy import stats
res = stats.fligner(small_dose, medium_dose, large_dose)
res.statistic
1.3878943408857916
当方差差异较大时,统计量的值往往较高。
我们可以通过将观察到的统计量值与零分布进行比较来检验组间方差的不等性:零分布是在三组的总体方差相等的零假设下得出的统计量值分布。
对于此检验,零分布遵循 卡方分布,如下所示。
import matplotlib.pyplot as plt
k = 3 # number of samples
dist = dist = stats.chi2(df=k-1)
val = np.linspace(0, 8, 100)
pdf = dist.pdf(val)
fig, ax = plt.subplots(figsize=(8, 5))
def plot(ax): # we'll reuse this
ax.plot(val, pdf, color='C0')
ax.set_title("Fligner Test Null Distribution")
ax.set_xlabel("statistic")
ax.set_ylabel("probability density")
ax.set_xlim(0, 8)
ax.set_ylim(0, 0.5)
plot(ax)
plt.show()
比较通过 p 值量化:p 值是零分布中大于或等于统计量观察值的比例。
fig, ax = plt.subplots(figsize=(8, 5))
plot(ax)
pvalue = dist.sf(res.statistic)
annotation = (f'p-value={pvalue:.4f}\n(shaded area)')
props = dict(facecolor='black', width=1, headwidth=5, headlength=8)
_ = ax.annotate(annotation, (1.5, 0.22), (2.25, 0.3), arrowprops=props)
i = val >= res.statistic
ax.fill_between(val[i], y1=0, y2=pdf[i], color='C0')
plt.show()
res.pvalue
0.49960016501182125
如果 p 值“小”,即,如果从方差相同的分布中抽样数据产生如此极端的统计量值的概率很低,则可以将其作为反对零假设的证据,而支持另一种假设:各组的方差不相等。请注意:
反之则不成立;也就是说,此检验不用来提供支持零假设的证据。
被认为是“小”的值的阈值应该在分析数据之前根据假阳性(错误地拒绝零假设)和假阴性(未能拒绝错误的零假设)的风险来选择 [2]。
小的 p 值并不是大效应的证据;相反,它们只能为“显著”效应提供证据,这意味着它们不太可能在零假设下发生。
请注意,卡方分布提供了零分布的渐近近似。对于小样本,执行排列检验可能更合适:在所有三个样本都来自同一总体的零假设下,每个测量值都同样有可能在三个样本中的任何一个样本中观察到。因此,我们可以通过计算在许多随机生成的三样本观测分区下的统计量来形成随机的零分布。
def statistic(*samples):
return stats.fligner(*samples).statistic
ref = stats.permutation_test(
(small_dose, medium_dose, large_dose), statistic,
permutation_type='independent', alternative='greater'
)
fig, ax = plt.subplots(figsize=(8, 5))
plot(ax)
bins = np.linspace(0, 8, 25)
ax.hist(
ref.null_distribution, bins=bins, density=True, facecolor="C1"
)
ax.legend(['asymptotic approximation\n(many observations)',
'randomized null distribution'])
plot(ax)
plt.show()
ref.pvalue # randomized test p-value
0.4412
请注意,此处计算的 p 值与上面 scipy.stats.fligner
返回的渐近近似之间存在显著差异。可以从排列检验中严格得出的统计推论是有限的;尽管如此,在许多情况下,它们可能是首选方法 [3]。