scipy.stats.

poisson_means_test#

scipy.stats.poisson_means_test(k1, n1, k2, n2, *, diff=0, alternative='two-sided')[source]#

执行泊松均值检验,又名“E-test”。

这是一个检验两个泊松分布均值之差是否为 diff 的零假设的检验。样本以在大小为 n1n2 的测量间隔(例如,时间、空间、观测次数)内观察到的事件数 k1k2 的形式提供。

参数:
k1int

从分布 1 观察到的事件数。

n1: float

来自分布 1 的样本大小。

k2int

从分布 2 观察到的事件数。

n2float

来自分布 2 的样本大小。

difffloat, default=0

样本潜在分布的均值之间的假设差异。

alternative{‘two-sided’, ‘less’, ‘greater’}, optional

定义备择假设。 以下选项可用(默认为“two-sided”)

  • “two-sided”:分布均值之间的差异不等于 diff

  • “less”:分布均值之间的差异小于 diff

  • “greater”:分布均值之间的差异大于 diff

返回:
statisticfloat

检验统计量(参见 [1] 方程 3.3)。

pvaluefloat

在零假设下,获得如此极端的检验统计量值的概率。

注释

\[X_1 \sim \mbox{Poisson}(\mathtt{n1}\lambda_1)\]

是独立于

\[X_2 \sim \mbox{Poisson}(\mathtt{n2}\lambda_2)\]

的随机变量,并设 k1k2 分别为 \(X_1\)\(X_2\) 的观测值。 然后 poisson_means_test 使用来自大小分别为 n1n2 的样本的观测事件数 k1k2,来检验零假设:

\[H_0: \lambda_1 - \lambda_2 = \mathtt{diff}\]

E-test 的一个优点是它对小样本量具有良好的功效,这可以降低采样成本 [1]。 已经对其进行了评估,并确定其比同类 C-test(有时称为泊松精确检验)更强大。

参考文献

[1] (1,2)

Krishnamoorthy, K., & Thomson, J. (2004). A more powerful test for comparing two Poisson means. Journal of Statistical Planning and Inference, 119(1), 23-35.

[2]

Przyborowski, J., & Wilenski, H. (1940). Homogeneity of results in testing samples from Poisson series: With an application to testing clover seed for dodder. Biometrika, 31(3/4), 313-323.

示例

假设一位园丁想要测试他们从种子公司购买的一袋三叶草种子中菟丝子(杂草)种子的数量。 先前已经确定,三叶草中菟丝子的数量服从泊松分布。

在运送给园丁之前,从袋子中抽取一个 100 克的样本。 分析该样本,发现不包含菟丝子种子; 也就是说,k1 为 0。但是,到达后,园丁从袋子中抽取另一个 100 克的样本。 这次,在样本中发现了三个菟丝子种子; 也就是说,k2 为 3。 园丁想知道这种差异是否显着,而不是由于偶然。 零假设是两个样本之间的差异仅仅是由于偶然,或者 \(\lambda_1 - \lambda_2 = \mathtt{diff}\),其中 \(\mathtt{diff} = 0\)。 备择假设是这种差异不是由于偶然,或者 \(\lambda_1 - \lambda_2 \ne 0\)。 园丁选择 5% 的显着性水平,以拒绝零假设,赞成备择假设 [2]

>>> import scipy.stats as stats
>>> res = stats.poisson_means_test(0, 100, 3, 100)
>>> res.statistic, res.pvalue
(-1.7320508075688772, 0.08837900929018157)

p 值为 .088,表明在零假设下观察到检验统计量值的概率接近 9%。 这超过了 5%,因此园丁不拒绝零假设,因为这种差异不能被视为在该水平上显着。