scipy.stats.Mixture.

logcdf#

Mixture.logcdf(x, y=None, /, *, method=None)[源代码]#

累积分布函数的对数

累积分布函数(“CDF”),表示为 \(F(x)\),是随机变量 \(X\) 取小于或等于 \(x\) 的值的概率。

\[F(x) = P(X ≤ x)\]

此函数的双参数变体也被定义为随机变量 \(X\) 取介于 \(x\)\(y\) 之间的值的概率。

\[F(x, y) = P(x ≤ X ≤ y)\]

logcdf 计算累积分布函数的对数(“log-CDF”),\(\log(F(x))\)/\(\log(F(x, y))\),但与朴素实现(计算 CDF 并取对数)相比,它在数值上可能更优。

logcdf 接受 x 表示 \(x\)y 表示 \(y\)

参数:
x, yarray_like

log-CDF 的参数。 x 是必需的; y 是可选的。

method{None, 'formula', 'logexp', 'complement', 'quadrature', 'subtraction'}

用于评估 log-CDF 的策略。默认情况下 (None),函数的单参数形式在以下选项中选择,按优先级顺序排列。

  • 'formula':使用 log-CDF 本身的公式

  • 'logexp':计算 CDF 并取对数

  • 'complement':计算 log-CCDF 并取对数补 (参见注释)

  • 'quadrature':数值地对 log-PDF 进行对数积分

代替 'complement',双参数形式接受

  • 'subtraction':计算每个参数处的 log-CDF 并取对数差(参见注释)

并非所有分布都可使用所有 method 选项。如果所选的 method 不可用,则会引发 NotImplementedError

返回:
outarray

在提供的参数处评估的 log-CDF。

另请参阅

cdf
logccdf

注释

假设连续概率分布的支持为 \([l, r]\)。对于 \(x ≤ l\),log-CDF 的最小值为 \(\log(0) = -\infty\),对于 \(x ≥ r\),其最大值为 \(\log(1) = 0\)

对于具有无限支持的分布,当参数在理论上处于支持范围内时,cdf 通常会返回值 0; 发生这种情况是因为 CDF 的真实值太小而无法用所选的 dtype 表示。但是,logcdf 通常会在更大的域上返回一个有限的(不是 -inf)结果。类似地,logcdf 可能会提供一个严格为负的结果,其参数为 cdf 将返回 1.0 的参数。 因此,可能更倾向于使用概率的对数,以避免下溢和浮点数的其他相关限制。

数字 \(z\) 的“对数补”在数学上等效于 \(\log(1-\exp(z))\),但它是为了避免在 \(\exp(z)\) 接近 \(0\)\(1\) 时损失精度而计算的。 类似地,此处使用 \(w\)\(z\) 的“对数差”来表示 \(\log(\exp(w)-\exp(z))\)

如果 y < x,则 CDF 为负数,因此 log-CCDF 是复数,虚部为 \(\pi\)。 为了保持一致性,无论虚部的值如何,只要提供了 y,此函数的结果始终具有复数 dtype。

参考

[1]

累积分布函数,维基百科https://en.wikipedia.org/wiki/Cumulative_distribution_function

示例

使用所需的参数实例化一个分布

>>> import numpy as np
>>> from scipy import stats
>>> X = stats.Uniform(a=-0.5, b=0.5)

在所需的参数处评估 log-CDF

>>> X.logcdf(0.25)
-0.287682072451781
>>> np.allclose(X.logcdf(0.), np.log(X.cdf(0.)))
True