卡方检验#

卡方检验用于检验给定分类数据是否具有给定频率的零假设。

[1]中,对俄勒冈州一片原始森林中的鸟类觅食行为进行了调查。在该森林中,道格拉斯冷杉占冠层体积的44%,黄松占24%,大冷杉占29%,西方落叶松占3%。作者观察了几种鸟类的行为,其中一种是红胸鳾。他们对该物种的觅食行为进行了189次观测,其中43次(“23%”)观测发生在道格拉斯冷杉中,52次(“28%”)发生在黄松中,54次(“29%”)发生在大冷杉中,40次(“21%”)发生在西方落叶松中。

使用卡方检验,我们可以检验觅食事件的比例是否与冠层体积的比例相等的零假设。该论文的作者认为p值小于1%即为显著。

利用上述冠层体积比例和观测事件,我们可以推断出预期频率。

import numpy as np
f_exp = np.array([44, 24, 29, 3]) / 100 * 189

观测到的觅食频率为

f_obs = np.array([43, 52, 54, 40])

现在我们可以将观测频率与预期频率进行比较。

from scipy.stats import chisquare
chisquare(f_obs=f_obs, f_exp=f_exp)
Power_divergenceResult(statistic=np.float64(228.23515947653874), pvalue=np.float64(3.3295585338846486e-49))

p值远低于所选的显著性水平。因此,作者认为差异是显著的,并得出结论:觅食事件的相对比例与树木冠层体积的相对比例不相同。

参考文献#