scipy.stats.multivariate_normal#

scipy.stats.multivariate_normal = <scipy.stats._multivariate.multivariate_normal_gen object>[源代码]#

一个多元正态随机变量。

mean 关键字指定均值。cov 关键字指定协方差矩阵。

参数:
meanarray_like,默认值:[0]

分布的均值。

covarray_like 或 Covariance,默认值:[1]

分布的对称正(半)定协方差矩阵。

allow_singularbool,默认值:False

是否允许奇异协方差矩阵。如果 cov 是一个 Covariance 对象,则忽略此参数。

seed{None, int, np.random.RandomState, np.random.Generator}, 可选

用于抽取随机变量。如果 seedNone,则使用 RandomState 单例。如果 seed 是一个 int,则使用一个新的 RandomState 实例,并使用 seed 初始化。如果 seed 已经是一个 RandomStateGenerator 实例,则使用该对象。默认值为 None

注释

将参数 mean 设置为 None 等效于使 mean 为零向量。参数 cov 可以是标量,在这种情况下,协方差矩阵是单位矩阵乘以该值;也可以是协方差矩阵的对角线项的向量,二维 array_like,或 Covariance 对象。

协方差矩阵 cov 可能是 Covariance 的子类的实例,例如 scipy.stats.CovViaPrecision。如果是这样,则忽略 allow_singular

否则,当 allow_singular 为 True 时,cov 必须是对称正半定矩阵;当 allow_singular 为 False 时,它必须是(严格)正定的。不检查对称性;仅使用下三角部分。 cov 的行列式和逆矩阵分别计算为伪行列式和伪逆矩阵,因此 cov 不需要满秩。

multivariate_normal 的概率密度函数为

\[f(x) = \frac{1}{\sqrt{(2 \pi)^k \det \Sigma}} \exp\left( -\frac{1}{2} (x - \mu)^T \Sigma^{-1} (x - \mu) \right),\]

其中 \(\mu\) 是均值,\(\Sigma\) 是协方差矩阵,\(k\)\(\Sigma\) 的秩。在奇异 \(\Sigma\) 的情况下,SciPy 根据 [1] 扩展此定义。

在 0.14.0 版本中添加。

参考文献

[1]

多元正态分布 - 退化情况,维基百科,https://en.wikipedia.org/wiki/Multivariate_normal_distribution#Degenerate_case

示例

>>> import numpy as np
>>> import matplotlib.pyplot as plt
>>> from scipy.stats import multivariate_normal
>>> x = np.linspace(0, 5, 10, endpoint=False)
>>> y = multivariate_normal.pdf(x, mean=2.5, cov=0.5); y
array([ 0.00108914,  0.01033349,  0.05946514,  0.20755375,  0.43939129,
        0.56418958,  0.43939129,  0.20755375,  0.05946514,  0.01033349])
>>> fig1 = plt.figure()
>>> ax = fig1.add_subplot(111)
>>> ax.plot(x, y)
>>> plt.show()
../../_images/scipy-stats-multivariate_normal-1_00_00.png

或者,可以调用对象(作为函数)来固定均值和协方差参数,返回一个“冻结的”多元正态随机变量

>>> rv = multivariate_normal(mean=None, cov=1, allow_singular=False)
>>> # Frozen object with the same methods but holding the given
>>> # mean and covariance fixed.

输入的分位数可以是任何形状的数组,只要最后一个轴标记分量即可。例如,这允许我们显示 2D 中非各向同性随机变量的冻结 pdf,如下所示

>>> x, y = np.mgrid[-1:1:.01, -1:1:.01]
>>> pos = np.dstack((x, y))
>>> rv = multivariate_normal([0.5, -0.2], [[2.0, 0.3], [0.3, 0.5]])
>>> fig2 = plt.figure()
>>> ax2 = fig2.add_subplot(111)
>>> ax2.contourf(x, y, rv.pdf(pos))
../../_images/scipy-stats-multivariate_normal-1_01_00.png

方法

pdf(x, mean=None, cov=1, allow_singular=False)

概率密度函数。

logpdf(x, mean=None, cov=1, allow_singular=False)

概率密度函数的对数。

cdf(x, mean=None, cov=1, allow_singular=False, maxpts=1000000*dim, abseps=1e-5, releps=1e-5, lower_limit=None)

累积分布函数。

logcdf(x, mean=None, cov=1, allow_singular=False, maxpts=1000000*dim, abseps=1e-5, releps=1e-5)

累积分布函数的对数。

rvs(mean=None, cov=1, size=1, random_state=None)

从多元正态分布中抽取随机样本。

entropy(mean=None, cov=1)

计算多元正态的微分熵。

fit(x, fix_mean=None, fix_cov=None)

将多元正态分布拟合到数据。