卡方检验#

卡方 检验 检验给定的分类数据集是否具有给定的频率的零假设。

[1] 中,研究了俄勒冈州一片原始森林中鸟类的觅食行为。在森林中,44% 的树冠体积是花旗松,24% 是黄松,29% 是巨冷杉,3% 是西部落叶松。作者观察了几种鸟类的行为,其中一种是红胸䳭。他们对这种鸟的觅食进行了 189 次观察,记录到 43 次(“23%”)在花旗松中,52 次(“28%”)在黄松中,54 次(“29%”)在巨冷杉中,40 次(“21%”)在西部落叶松中。

使用卡方检验,我们可以检验觅食事件的比例等于树冠体积比例的零假设。该论文的作者认为小于 1% 的 p 值是显著的。

使用上述树冠体积比例和观察到的事件,我们可以推断出期望的频率。

import numpy as np
f_exp = np.array([44, 24, 29, 3]) / 100 * 189

观察到的觅食频率是

f_obs = np.array([43, 52, 54, 40])

我们现在可以将观察到的频率与期望的频率进行比较。

from scipy.stats import chisquare
chisquare(f_obs=f_obs, f_exp=f_exp)
Power_divergenceResult(statistic=228.23515947653874, pvalue=3.3295585338846486e-49)

p 值远低于选择的显著性水平。因此,作者认为差异是显著的,并得出结论,觅食事件的相对比例与树冠体积的相对比例不同。

参考文献#