scipy.stats.skellam#

scipy.stats.skellam = <scipy.stats._discrete_distns.skellam_gen object>[源代码]#

一个 Skellam 离散随机变量。

作为 rv_discrete 类的实例,skellam 对象会从该类继承一系列通用方法(有关完整列表,请参见下文),并对其进行补充,以实现此特定分布的详细信息。

备注

两个相关或不相关的泊松随机变量差的概率分布。

假设 \(k_1\)\(k_2\) 是期望值分别为 \(\lambda_1\)\(\lambda_2\) 的两个泊松分布的随机变量。那么,\(k_1 - k_2\) 服从 Skellam 分布,其参数为 \(\mu_1 = \lambda_1 - \rho \sqrt{\lambda_1 \lambda_2}\)\(\mu_2 = \lambda_2 - \rho \sqrt{\lambda_1 \lambda_2}\),其中 \(\rho\)\(k_1\)\(k_2\) 之间的相关系数。如果两个泊松分布的随机变量是独立的,则 \(\rho = 0\)

参数 \(\mu_1\)\(\mu_2\) 必须严格为正。

有关详细信息,请参阅:https://zh.wikipedia.org/wiki/%E6%96%AF%E5%85%B0%E6%96%AF%E5%88%86%E5%B8%83

skellam\(\mu_1\)\(\mu_2\) 为形状参数。

上述概率质量函数以“标准化”形式定义。要移动分布,请使用 loc 参数。特别是,skellam.pmf(k, mu1, mu2, loc)skellam.pmf(k - loc, mu1, mu2) 的结果完全相同。

示例

>>> import numpy as np
>>> from scipy.stats import skellam
>>> import matplotlib.pyplot as plt
>>> fig, ax = plt.subplots(1, 1)

计算前四个矩

>>> mu1, mu2 = 15, 8
>>> mean, var, skew, kurt = skellam.stats(mu1, mu2, moments='mvsk')

显示概率质量函数 (pmf)

>>> x = np.arange(skellam.ppf(0.01, mu1, mu2),
...               skellam.ppf(0.99, mu1, mu2))
>>> ax.plot(x, skellam.pmf(x, mu1, mu2), 'bo', ms=8, label='skellam pmf')
>>> ax.vlines(x, 0, skellam.pmf(x, mu1, mu2), colors='b', lw=5, alpha=0.5)

或者,可以调用分布对象(作为函数)来确定形状和位置。这将返回一个“冻结的”RV对象,其中给定的参数处于确定状态。

冻结分布并显示冻结的 pmf

>>> rv = skellam(mu1, mu2)
>>> ax.vlines(x, 0, rv.pmf(x), colors='k', linestyles='-', lw=1,
...         label='frozen pmf')
>>> ax.legend(loc='best', frameon=False)
>>> plt.show()
../../_images/scipy-stats-skellam-1_00_00.png

校验 cdfppf 的准确性

>>> prob = skellam.cdf(x, mu1, mu2)
>>> np.allclose(x, skellam.ppf(prob, mu1, mu2))
True

生成随机数

>>> r = skellam.rvs(mu1, mu2, size=1000)

方法

rvs(mu1, mu2, loc=0, size=1, random_state=None)

随机变量。

pmf(k, mu1, mu2, loc=0)

概率质量函数。

logpmf(k, mu1, mu2, loc=0)

概率质量函数的对数。

cdf(k, mu1, mu2, loc=0)

累积分布函数。

logcdf(k, mu1, mu2, loc=0)

累积分布函数的对数。

sf(k, mu1, mu2, loc=0)

生存函数(也定义为 1 - cdf,但 sf 有时更准确)。

logsf(k, mu1, mu2, loc=0)

生存函数的对数。

ppf(q, mu1, mu2, loc=0)

百分位数函数(cdf 的反函数 — 百分位数)。

isf(q, mu1, mu2, loc=0)

sf 的反函数(反生存函数)。

stats(mu1, mu2, loc=0, moments=’mv’)

均值(“m”)、方差(“v”)、偏度(“s”)和/或峰度(“k”)。

entropy(mu1, mu2, loc=0)

RV 的(差分)熵。

expect(func, args=(mu1, mu2), loc=0, lb=None, ub=None, conditional=False)

关于分布的一元函数的期望值。

median(mu1, mu2, loc=0)

分布的中位数。

mean(mu1, mu2, loc=0)

分布的均值。

var(mu1, mu2, loc=0)

分布的方差。

std(mu1, mu2, loc=0)

分布的标准差。

interval(confidence, mu1, mu2, loc=0)

置信区间(中值周围的相等面积)。