scipy.stats.

poisson_means_test#

scipy.stats.poisson_means_test(k1, n1, k2, n2, *, diff=0, alternative='two-sided')[source]#

执行泊松均值检验,也称为“E 检验”。

这是针对零假设的检验,即两个泊松分布的均值差异为diff。样本以事件数量k1k2 在测量区间(例如时间、空间、观察次数)中观察到,测量区间的大小为n1n2

参数:
k1int

从分布 1 中观察到的事件数量。

n1: float

从分布 1 中样本的大小。

k2int

从分布 2 中观察到的事件数量。

n2float

从分布 2 中样本的大小。

difffloat,default=0

样本基础分布均值之间的假设差异。

alternative{‘two-sided’, ‘less’, ‘greater’},可选

定义备择假设。可以使用以下选项(默认情况下为“双边”)

  • ‘双边’:分布均值之间的差异不等于diff

  • ‘小于’:分布均值之间的差异小于diff

  • ‘大于’:分布均值之间的差异大于diff

返回:
statisticfloat

检验统计数据(请参阅[1]公式 3.3)。

pvaluefloat

在无效假设下,达到检验统计数据如此极值情况的可能性。

注意

\[X_1 \sim \mbox{Poisson}(\mathtt{n1}\lambda_1)\]

是与

\[X_2 \sim \mbox{Poisson}(\mathtt{n2}\lambda_2)\]

无关的随机变量,并且将k1k2分别作为\(X_1\)\(X_2\)的观测值。则poisson_means_test会使用分别来自的大小为n1n2的样本中观察到事件数量k1k2,来检验无效假设

\[H_0: \lambda_1 - \lambda_2 = \mathtt{diff}\]

E 检验有一个好处,即它对小样本量具有较好的功效,这可以降低抽样成本[1]。经过评估和确定后,发现它的功效高于可比的 C 检验,后者有时也称为泊松精确检验。

参考

[1] (1,2)

Krishnamoorthy, K., & Thomson, J. (2004). 比较两个泊松均值的更强有力的检验。Journal of Statistical Planning and Inference, 119(1), 23-35。

[2]

Przyborowski, J., & Wilenski, H. (1940).来自泊松数列的检验样本结果的同质性:并将其应用于测试三叶草种子的菟丝子。Biometrika, 31(3/4), 313-323。

示例

假设一位园丁希望测试他们从一家种子公司购买的一袋三叶草种子中的菟丝子(杂草)种子数量。此前已经确定,三叶草中的菟丝子种子的数量遵循泊松分布。

将 100 克样品从麻袋中取出,然后运往园丁处,在运送前进行分析。分析结果显示不含菟丝子;也就是说,k1 为 0。但是,园丁收货后从麻袋中取出了另一份 100 克样品。这一次,样品中发现了三颗菟丝子;也就是说,k2 为 3。园丁想知道差异是否显著且并非偶然。无效假设是两个样品之间的差异仅仅是由于偶然,或 \(\lambda_1 - \lambda_2 = \mathtt{diff}\),其中 \(\mathtt{diff} = 0\)。备择假设是差异并非由于偶然,或 \(\lambda_1 - \lambda_2 \ne 0\)。园丁选择了 5% 的显著性水平,以支持备择假设而拒绝无效假设 [2]

>>> import scipy.stats as stats
>>> res = stats.poisson_means_test(0, 100, 3, 100)
>>> res.statistic, res.pvalue
(-1.7320508075688772, 0.08837900929018157)

p 值为 .088,表明在无效假设下观察到检验统计量值有近 9% 的概率。这超过了 5%,所以园丁不拒绝无效假设,因为在这一水平上,差异不能被视为显著。