scipy.stats.levy_stable#

scipy.stats.levy_stable = <scipy.stats._levy_stable.levy_stable_gen object>[source]#

Levy-stable 连续分布变量。

作为 rv_continuous 类的一个实例,levy_stable 对象从它继承一组通用方法(如下查看完整列表),并且用对这个特定分布的细节进行补充。

另请参见

levylevy_lcauchynorm

注释

levy_stable 的分布具有特征函数

\[\varphi(t, \alpha, \beta, c, \mu) = e^{it\mu -|ct|^{\alpha}(1-i\beta\operatorname{sign}(t)\Phi(\alpha, t))}\]

其中支持两个不同的参数化。第一个 \(S_1\)

\[\begin{split}\Phi = \begin{cases} \tan \left({\frac {\pi \alpha }{2}}\right)&\alpha \neq 1\\ -{\frac {2}{\pi }}\log |t|&\alpha =1 \end{cases}\end{split}\]

第二个 \(S_0\)

\[\begin{split}\Phi = \begin{cases} -\tan \left({\frac {\pi \alpha }{2}}\right)(|ct|^{1-\alpha}-1) &\alpha \neq 1\\ -{\frac {2}{\pi }}\log |ct|&\alpha =1 \end{cases}\end{split}\]

levy_stable 的概率密度函数为

\[f(x) = \frac{1}{2\pi}\int_{-\infty}^\infty \varphi(t)e^{-ixt}\,dt\]

其中 \(-\infty < t < \infty\)。此积分没有已知的封闭形式。

levy_stable 概括了多个分布。如果可能,则应改用它们。具体而言,当形状参数取下表中的值时,应使用相应的等效分布。

alpha

beta

等效

1/2

-1

levy_l

1/2

1

levy

1

0

柯西

2

任意

norm(搭配 scale=sqrt(2)

PDF 评估默认采用诺兰的分段积分法,搭配 Zolotarev \(M\) 参数化。还可以选择直接对特征函数的标准参数化进行数值积分,或通过对特征函数取 FFT 来求值。

可以通过将类变量 levy_stable.pdf_default_method 设置为诺兰法的 ‘piecewise’、直接数值积分的 ‘dni’ 或基于 FFT 的方法 ‘fft-simpson’ 来更改默认方法。为了向后兼容,方法 ‘best’ 和 ‘zolotarev’ 等效于 ‘piecewise’,方法 ‘quadrature’ 等效于 ‘dni’。

可以通过将类变量 levy_stable.parameterization 设置为 ‘S0’ 或 ‘S1’ 来更改参数化。默认为 ‘S1’。

如要提升分段和直接数值积分的性能,可以指定 levy_stable.quad_eps(默认为 1.2e-14)。这要用作直接数值积分的绝对和相对求积容差和分段方法的相对求积容差。也可以指定 levy_stable.piecewise_x_tol_near_zeta(默认为 0.005),指定 x 距离 zeta 的距离何时可以被认为与 x 相同 [NO]。精确检查如下 abs(x0 - zeta) < piecewise_x_tol_near_zeta*alpha**(1/alpha)。还可以指定 levy_stable.piecewise_alpha_tol_near_one(默认为 0.005),指定 alpha 距离 1 的距离何时可以被认为等于 1。

如要提升 FFT 计算的准确性,可以指定 levy_stable.pdf_fft_grid_spacing(默认为 0.001)和 pdf_fft_n_points_two_power(默认为 None,表示会计算可以充分覆盖输入范围的值)。

可以通过设置 pdf_fft_interpolation_degree(默认为 3)实现插条阶次和 pdf_fft_interpolation_level来进一步控制 FFT 计算,以确定在使用牛顿-科茨公式逼近特征函数时要使用的点数(此方法被认为具有实验性)。

CDF 估算使用 Nolan 的分段积分法,其中 Zolatarev \(S_0\) 参数化是默认方法。此外,还可以通过对由 FFT 方法计算的 PDF 插值插条进行积分来计算。影响 FFT 计算的设置与 PDF 计算的设置相同。可以通过将 levy_stable.cdf_default_method 设置为“分段”或“fft-simpson”来更改默认的 CDF 方法。对于 CDF 计算,Zolatarev 方法的准确性更优异,因此 FFT 在默认情况下会被禁用。

拟合估计使用 [MC] 中的分位数估计方法。拟合方法中参数的 MLE 估算最初会使用此分位数估算。请注意,如果 PDF 计算使用 FFT,则 MLE 不一定会收敛;如果 alpha <= 1,即 FFT 方法无法提供良好逼近值,就会发生这种情况。

对于属性 levy_stable.pdf_fft_min_points_threshold 的任何非缺失值,如果未另行设置有效默认方法,该方法会将 levy_stable.pdf_default_method 设置为“fft-simpson”。

警告

对于 PDF 计算,FFT 计算被视为实验性。

对于 CDF 计算,FFT 计算被视为实验性。请使用 Zolatarev 方法(默认方法)。

上面定义的概率密度为“标准化”形式。要偏移和/或缩放分布,请使用 locscale 参数。通常 levy_stable.pdf(x, alpha, beta, loc, scale) 与具有 y = (x - loc) / scalelevy_stable.pdf(y, alpha, beta) / scale 完全等效,但 S1 参数化中如果 alpha == 1 除外。在这种情况下,levy_stable.pdf(x, alpha, beta, loc, scale) 与具有 y = (x - loc - 2 * beta * scale * np.log(scale) / np.pi) / scalelevy_stable.pdf(y, alpha, beta) / scale 完全等效。有关更多信息,请参阅 [NO2] 定义 1.8。请注意,偏移分布的位置并不会形成“非中心”分布。

引用

[MC]

McCulloch,J.,1986 年。稳定分布参数的简单一致估计量。统计通信 - 模拟和计算 15,11091136。

[WZ]

王李和张季红,2008 年。基于辛普森法则的 FFT 方法来计算稳定分布的密度。

[NO]

诺兰,J.,1997 年。稳定密度和分布函数的数值计算。

[NO2]

诺兰,J.,2018 年。稳定分布:重尾数据模型。

[HO]

霍普克拉夫特,K. I.,贾克曼,E.,坦纳,R. M. J.,1999 年。具有波动步数和多尺度行为的 Lévy 随机游走。

示例

>>> import numpy as np
>>> from scipy.stats import levy_stable
>>> import matplotlib.pyplot as plt
>>> fig, ax = plt.subplots(1, 1)

计算前四个矩

>>> alpha, beta = 1.8, -0.5
>>> mean, var, skew, kurt = levy_stable.stats(alpha, beta, moments='mvsk')

显示概率密度函数 (pdf)

>>> x = np.linspace(levy_stable.ppf(0.01, alpha, beta),
...                 levy_stable.ppf(0.99, alpha, beta), 100)
>>> ax.plot(x, levy_stable.pdf(x, alpha, beta),
...        'r-', lw=5, alpha=0.6, label='levy_stable pdf')

或者,可以调用分布对象(作为函数)来修复形状、位置和比例参数。这返回一个包含给定固定参数的“冻结”随机变量对象。

冻结分布并显示冻结的 pdf

>>> rv = levy_stable(alpha, beta)
>>> ax.plot(x, rv.pdf(x), 'k-', lw=2, label='frozen pdf')

检查 cdfppf 的准确性

>>> vals = levy_stable.ppf([0.001, 0.5, 0.999], alpha, beta)
>>> np.allclose([0.001, 0.5, 0.999], levy_stable.cdf(vals, alpha, beta))
True

生成随机数字

>>> r = levy_stable.rvs(alpha, beta, size=1000)

并比较直方图

>>> ax.hist(r, density=True, bins='auto', histtype='stepfilled', alpha=0.2)
>>> ax.set_xlim([x[0], x[-1]])
>>> ax.legend(loc='best', frameon=False)
>>> plt.show()
../../_images/scipy-stats-levy_stable-1.png

方法

rvs(alpha, beta, loc=0, scale=1, size=1, random_state=None)

随机变量。

pdf(x, alpha, beta, loc=0, scale=1)

概率密度函数。

logpdf(x, alpha, beta, loc=0, scale=1)

概率密度函数的对数。

cdf(x, alpha, beta, loc=0, scale=1)

累积分布函数。

logcdf(x, alpha, beta, loc=0, scale=1)

累积分布函数的对数。

sf(x, alpha, beta, loc=0, scale=1)

生存函数(还定义为 1 - cdf,但 sf 有时更准确)。

logsf(x, alpha, beta, loc=0, scale=1)

生存函数的对数。

ppf(q, alpha, beta, loc=0, scale=1)

百分点函数(cdf 的反函数 — 百分位数)。

isf(q, alpha, beta, loc=0, scale=1)

逆生存函数(sf 的反函数)。

moment(order, alpha, beta, loc=0, scale=1)

指定阶数的非中心距。

stats(alpha, beta, loc=0, scale=1, moments=’mv’)

平均值(‘m’)、方差(‘v’)、偏度(‘s’)和/或峰度(‘k’)。

entropy(alpha, beta, loc=0, scale=1)

随机变量的(微分)熵。

fit(data)

用于通用数据的参数估计。请参阅 scipy.stats.rv_continuous.fit 了解关键字参数的详细文档。

expect(func, args=(alpha, beta), loc=0, scale=1, lb=None, ub=None, conditional=False, **kwds)

关于分布的函数(一个参数)的期望值。

median(alpha, beta, loc=0, scale=1)

分布的中值。

mean(alpha, beta, loc=0, scale=1)

分布的均值。

var(alpha, beta, loc=0, scale=1)

分布的方差。

std(alpha, beta, loc=0, scale=1)

分布的标准差。

interval(confidence, alpha, beta, loc=0, scale=1)

具有围绕中值相等面积的置信区间。