scipy.stats.multivariate_normal#
- scipy.stats.multivariate_normal = <scipy.stats._multivariate.multivariate_normal_gen object>[源代码]#
一个多元正态随机变量。
mean 关键字指定均值。cov 关键字指定协方差矩阵。
- 参数:
- meanarray_like,默认值:
[0]
分布的均值。
- covarray_like 或
Covariance
,默认值:[1]
分布的对称正(半)定协方差矩阵。
- allow_singularbool,默认值:
False
是否允许奇异协方差矩阵。如果 cov 是一个
Covariance
对象,则忽略此参数。- seed{None, int, np.random.RandomState, np.random.Generator}, 可选
用于抽取随机变量。如果 seed 为 None,则使用 RandomState 单例。如果 seed 是一个 int,则使用一个新的
RandomState
实例,并使用 seed 初始化。如果 seed 已经是一个RandomState
或Generator
实例,则使用该对象。默认值为 None。
- meanarray_like,默认值:
注释
将参数 mean 设置为 None 等效于使 mean 为零向量。参数 cov 可以是标量,在这种情况下,协方差矩阵是单位矩阵乘以该值;也可以是协方差矩阵的对角线项的向量,二维 array_like,或
Covariance
对象。协方差矩阵 cov 可能是
Covariance
的子类的实例,例如 scipy.stats.CovViaPrecision。如果是这样,则忽略 allow_singular。否则,当 allow_singular 为 True 时,cov 必须是对称正半定矩阵;当 allow_singular 为 False 时,它必须是(严格)正定的。不检查对称性;仅使用下三角部分。 cov 的行列式和逆矩阵分别计算为伪行列式和伪逆矩阵,因此 cov 不需要满秩。
multivariate_normal
的概率密度函数为\[f(x) = \frac{1}{\sqrt{(2 \pi)^k \det \Sigma}} \exp\left( -\frac{1}{2} (x - \mu)^T \Sigma^{-1} (x - \mu) \right),\]其中 \(\mu\) 是均值,\(\Sigma\) 是协方差矩阵,\(k\) 是 \(\Sigma\) 的秩。在奇异 \(\Sigma\) 的情况下,SciPy 根据 [1] 扩展此定义。
在 0.14.0 版本中添加。
参考文献
[1]多元正态分布 - 退化情况,维基百科,https://en.wikipedia.org/wiki/Multivariate_normal_distribution#Degenerate_case
示例
>>> import numpy as np >>> import matplotlib.pyplot as plt >>> from scipy.stats import multivariate_normal
>>> x = np.linspace(0, 5, 10, endpoint=False) >>> y = multivariate_normal.pdf(x, mean=2.5, cov=0.5); y array([ 0.00108914, 0.01033349, 0.05946514, 0.20755375, 0.43939129, 0.56418958, 0.43939129, 0.20755375, 0.05946514, 0.01033349]) >>> fig1 = plt.figure() >>> ax = fig1.add_subplot(111) >>> ax.plot(x, y) >>> plt.show()
或者,可以调用对象(作为函数)来固定均值和协方差参数,返回一个“冻结的”多元正态随机变量
>>> rv = multivariate_normal(mean=None, cov=1, allow_singular=False) >>> # Frozen object with the same methods but holding the given >>> # mean and covariance fixed.
输入的分位数可以是任何形状的数组,只要最后一个轴标记分量即可。例如,这允许我们显示 2D 中非各向同性随机变量的冻结 pdf,如下所示
>>> x, y = np.mgrid[-1:1:.01, -1:1:.01] >>> pos = np.dstack((x, y)) >>> rv = multivariate_normal([0.5, -0.2], [[2.0, 0.3], [0.3, 0.5]]) >>> fig2 = plt.figure() >>> ax2 = fig2.add_subplot(111) >>> ax2.contourf(x, y, rv.pdf(pos))
方法
pdf(x, mean=None, cov=1, allow_singular=False)
概率密度函数。
logpdf(x, mean=None, cov=1, allow_singular=False)
概率密度函数的对数。
cdf(x, mean=None, cov=1, allow_singular=False, maxpts=1000000*dim, abseps=1e-5, releps=1e-5, lower_limit=None)
累积分布函数。
logcdf(x, mean=None, cov=1, allow_singular=False, maxpts=1000000*dim, abseps=1e-5, releps=1e-5)
累积分布函数的对数。
rvs(mean=None, cov=1, size=1, random_state=None)
从多元正态分布中抽取随机样本。
entropy(mean=None, cov=1)
计算多元正态的微分熵。
fit(x, fix_mean=None, fix_cov=None)
将多元正态分布拟合到数据。