rv_discrete#
- class scipy.stats.rv_discrete(a=0, b=inf, name=None, badvalue=None, moment_tol=1e-08, values=None, inc=1, longname=None, shapes=None, seed=None)[源代码]#
一个通用的离散随机变量类,用于子类化。
rv_discrete
是一个基类,用于构建特定离散随机变量的分布类和实例。它也可以用于构建由一组支持点和相应的概率定义的任意分布。- 参数:
- afloat,可选
分布支持的下界,默认值:0
- bfloat,可选
分布支持的上界,默认值:正无穷
- moment_tolfloat,可选
用于矩的通用计算的容差。
- values由两个类数组组成的元组,可选
(xk, pk)
,其中xk
是整数,pk
是介于 0 和 1 之间的非零概率,且sum(pk) = 1
。xk
和pk
必须具有相同的形状,且xk
必须是唯一的。- inc整数,可选
分布支持的增量。默认值为 1。(其他值尚未测试)
- badvaluefloat,可选
结果数组中指示违反某些参数限制的值,默认值为 np.nan。
- namestr,可选
实例的名称。此字符串用于构建分布的默认示例。
- longnamestr,可选
当子类没有自己的文档字符串时,此字符串用作返回的文档字符串的第一行的一部分。注意:longname 的存在是为了向后兼容,请勿用于新的子类。
- shapesstr,可选
分布的形状。例如,“m, n”表示一个分布,该分布将两个整数作为其所有方法的两个形状参数。如果未提供,则形状参数将从实例的私有方法
_pmf
和_cdf
的签名中推断。- seed{None, int,
numpy.random.Generator
,numpy.random.RandomState
}, 可选 如果 seed 为 None(或 np.random),则使用
numpy.random.RandomState
单例。如果 seed 为 int,则使用一个新的RandomState
实例,并使用 seed 进行播种。如果 seed 已经是Generator
或RandomState
实例,则使用该实例。
注意
此类与
rv_continuous
类似。形状参数是否有效由_argcheck
方法决定(默认情况下检查其参数是否严格为正)。主要区别如下。分布的支持是一组整数。
此类定义了 *概率质量函数*,
pmf
(以及相应的私有_pmf
),而不是概率密度函数pdf
(以及相应的私有_pdf
)。没有
scale
参数。方法的默认实现(例如
_cdf
)不是为支持在下方无界的分布(即a=-np.inf
)设计的,因此必须重写它们。
要创建一个新的离散分布,我们可以执行以下操作
>>> from scipy.stats import rv_discrete >>> class poisson_gen(rv_discrete): ... "Poisson distribution" ... def _pmf(self, k, mu): ... return exp(-mu) * mu**k / factorial(k)
并创建一个实例
>>> poisson = poisson_gen(name="poisson")
请注意,上面我们以标准形式定义了泊松分布。可以通过为实例的方法提供
loc
参数来移动分布。例如,poisson.pmf(x, mu, loc)
将工作委托给poisson._pmf(x-loc, mu)
。来自概率列表的离散分布
或者,您可以通过使用
rv_discrete
构造函数的values
关键字参数来构造在有限值集xk
上定义的任意离散 rv,其中Prob{X=xk} = pk
。深度复制/序列化
如果深度复制(序列化/反序列化等)分布或冻结的分布,则任何底层随机数生成器都将与它一起深度复制。一个含义是,如果分布在复制之前依赖于单例 RandomState,则在复制之后它将依赖于该随机状态的副本,并且
np.random.seed
将不再控制状态。示例
自定义离散分布
>>> import numpy as np >>> from scipy import stats >>> xk = np.arange(7) >>> pk = (0.1, 0.2, 0.3, 0.1, 0.1, 0.0, 0.2) >>> custm = stats.rv_discrete(name='custm', values=(xk, pk)) >>> >>> import matplotlib.pyplot as plt >>> fig, ax = plt.subplots(1, 1) >>> ax.plot(xk, custm.pmf(xk), 'ro', ms=12, mec='r') >>> ax.vlines(xk, 0, custm.pmf(xk), colors='r', lw=4) >>> plt.show()
随机数生成
>>> R = custm.rvs(size=100)
- 属性:
random_state
获取或设置用于生成随机变量的生成器对象。
方法
rvs
(*args, **kwargs)给定类型的随机变量。
pmf
(k, *args, **kwds)给定 RV 在 k 处的概率质量函数。
logpmf
(k, *args, **kwds)给定 RV 在 k 处的概率质量函数的对数。
cdf
(k, *args, **kwds)给定 RV 的累积分布函数。
logcdf
(k, *args, **kwds)给定 RV 在 k 处的累积分布函数的对数。
sf
(k, *args, **kwds)给定随机变量在 k 处的生存函数 (1 -
cdf
)。logsf
(k, *args, **kwds)给定随机变量的生存函数的对数。
ppf
(q, *args, **kwds)给定随机变量在 q 处的百分点函数(
cdf
的逆函数)。isf
(q, *args, **kwds)给定随机变量在 q 处的逆生存函数(
sf
的逆函数)。moment
(order, *args, **kwds)指定阶数的分布的非中心矩。
stats
(*args, **kwds)给定随机变量的一些统计量。
entropy
(*args, **kwds)随机变量的微分熵。
expect
([func, args, loc, lb, ub, ...])通过数值求和计算离散分布的函数关于分布的期望值。
median
(*args, **kwds)分布的中位数。
mean
(*args, **kwds)分布的均值。
std
(*args, **kwds)分布的标准差。
var
(*args, **kwds)分布的方差。
interval
(confidence, *args, **kwds)围绕中位数具有相等面积的置信区间。
__call__
(*args, **kwds)冻结给定参数的分布。
support
(*args, **kwargs)分布的支持度。