logccdf#
- Binomial.logccdf(x, y=None, /, *, method=None)[源代码]#
互补累积分布函数的对数
互补累积分布函数 (“CCDF”),记为 \(G(x)\),是累积分布函数 \(F(x)\) 的补集;即,随机变量 \(X\) 取大于 \(x\) 的值的概率
\[ \begin{align}\begin{aligned} G(x) = 1 - F(x) = P(X > x)\\此函数的双参数变体为:\end{aligned}\end{align} \]\[G(x, y) = 1 - F(x, y) = P(X < x \quad \text{或} \quad X > y)\]logccdf
计算互补累积分布函数的对数 (“log-CCDF”),\(\log(G(x))\)/\(\log(G(x, y))\),但与朴素实现(计算 CDF 并取对数)相比,它在数值上可能更有利。logccdf
接受 x 作为 \(x\),y 作为 \(y\)。- 参数:
- x, yarray_like
log-CCDF 的参数。x 是必需的;y 是可选的。
- method{None, ‘formula’, ‘logexp’, ‘complement’, ‘quadrature’, ‘addition’}
用于评估 log-CCDF 的策略。 默认情况下 (
None
),函数的单参数形式在以下选项之间进行选择,按优先级顺序列出。'formula'
:使用 log CCDF 本身的公式'logexp'
:评估 CCDF 并取对数'complement'
:评估 log-CDF 并取对数补码(参见注释)'quadrature'
:以数值方式对 log-PDF 进行对数积分(或者,在离散情况下,对 log-PMF 进行对数求和)
双参数形式在以下两者之间进行选择
'formula'
:使用 log CCDF 本身的公式'addition'
:计算 x 处的 log-CDF 和 y 处的 log-CCDF,然后取对数和(参见注释)
并非所有 method 选项都适用于所有分布。 如果所选的 method 不可用,则会引发
NotImplementedError
。
- 返回值:
- outarray
在提供的参数处评估的 log-CCDF。
注释
假设连续概率分布支持 \([l, r]\)。 对于 \(x ≥ r\),log-CCDF 返回其最小值 \(\log(0)=-\infty\),对于 \(x ≤ l\),log-CCDF 返回其最大值 \(\log(1) = 0\)。 可以对离散分布做出类似的陈述,但控制最大值的不等式是严格的。
对于具有无限支持的分布,
ccdf
通常会在参数理论上在支持范围内时返回0
的值;这可能是因为 CCDF 的真实值太小,无法用所选的 dtype 表示。 但是,CCDF 的对数通常会在更大的域上是有限的(不是-inf
)。 类似地,logccdf
可以提供严格的负结果,其参数为ccdf
将返回1.0
。 因此,最好使用概率的对数来避免浮点数的下溢和相关限制。数字 \(z\) 的“对数补码”在数学上等价于 \(\log(1-\exp(z))\),但它的计算是为了避免在 \(\exp(z)\) 几乎是 \(0\) 或 \(1\) 时精度损失。 类似地,\(w\) 和 \(z\) 的“对数和”在此处用于表示 \(\log(\exp(w)+\exp(z))\),AKA \(\text{LogSumExp}(w, z)\)。
参考文献
示例
使用所需的参数实例化一个分布
>>> import numpy as np >>> from scipy import stats >>> X = stats.Uniform(a=-0.5, b=0.5)
在所需的参数处评估 log-CCDF
>>> X.logccdf(0.25) -1.3862943611198906 >>> np.allclose(X.logccdf(0.), np.log(X.ccdf(0.))) True