scipy.stats.Binomial.

logccdf#

Binomial.logccdf(x, y=None, /, *, method=None)[源代码]#

互补累积分布函数的对数

互补累积分布函数 (“CCDF”)，记为 \(G(x)\)，是累积分布函数 \(F(x)\) 的补集；即，随机变量 \(X\) 取大于 \(x\) 的值的概率

\[ \begin{align}\begin{aligned} G(x) = 1 - F(x) = P(X > x)\\此函数的双参数变体为：\end{aligned}\end{align} \]

\[G(x, y) = 1 - F(x, y) = P(X < x \quad \text{或} \quad X > y)\]

logccdf 计算互补累积分布函数的对数 (“log-CCDF”)，\(\log(G(x))\)/\(\log(G(x, y))\)，但与朴素实现（计算 CDF 并取对数）相比，它在数值上可能更有利。

logccdf 接受 x 作为 \(x\)，y 作为 \(y\)。

参数:

x, yarray_like

log-CCDF 的参数。x 是必需的；y 是可选的。

method{None, ‘formula’, ‘logexp’, ‘complement’, ‘quadrature’, ‘addition’}

用于评估 log-CCDF 的策略。默认情况下 (None)，函数的单参数形式在以下选项之间进行选择，按优先级顺序列出。

'formula'：使用 log CCDF 本身的公式
'logexp'：评估 CCDF 并取对数
'complement'：评估 log-CDF 并取对数补码（参见注释）
'quadrature'：以数值方式对 log-PDF 进行对数积分（或者，在离散情况下，对 log-PMF 进行对数求和）

双参数形式在以下两者之间进行选择

'formula'：使用 log CCDF 本身的公式
'addition'：计算 x 处的 log-CDF 和 y 处的 log-CCDF，然后取对数和（参见注释）

并非所有 method 选项都适用于所有分布。如果所选的 method 不可用，则会引发 NotImplementedError。

返回值:

outarray: 在提供的参数处评估的 log-CCDF。

另请参阅

ccdf
logcdf

注释

假设连续概率分布支持 \([l, r]\)。对于 \(x ≥ r\)，log-CCDF 返回其最小值 \(\log(0)=-\infty\)，对于 \(x ≤ l\)，log-CCDF 返回其最大值 \(\log(1) = 0\)。可以对离散分布做出类似的陈述，但控制最大值的不等式是严格的。

对于具有无限支持的分布，ccdf 通常会在参数理论上在支持范围内时返回 0 的值；这可能是因为 CCDF 的真实值太小，无法用所选的 dtype 表示。但是，CCDF 的对数通常会在更大的域上是有限的（不是 -inf）。类似地，logccdf 可以提供严格的负结果，其参数为 ccdf 将返回 1.0。因此，最好使用概率的对数来避免浮点数的下溢和相关限制。

数字 \(z\) 的“对数补码”在数学上等价于 \(\log(1-\exp(z))\)，但它的计算是为了避免在 \(\exp(z)\) 几乎是 \(0\) 或 \(1\) 时精度损失。类似地，\(w\) 和 \(z\) 的“对数和”在此处用于表示 \(\log(\exp(w)+\exp(z))\)，AKA \(\text{LogSumExp}(w, z)\)。

参考文献

[1]

累积分布函数，维基百科，https://en.wikipedia.org/wiki/Cumulative_distribution_function#Derived_functions

示例

使用所需的参数实例化一个分布

>>> import numpy as np
>>> from scipy import stats
>>> X = stats.Uniform(a=-0.5, b=0.5)

在所需的参数处评估 log-CCDF

>>> X.logccdf(0.25)
-1.3862943611198906
>>> np.allclose(X.logccdf(0.), np.log(X.ccdf(0.)))
True