scipy.stats.levy_stable#

scipy.stats.levy_stable = <scipy.stats._levy_stable.levy_stable_gen object>[源代码]#

一个 Levy-stable 连续随机变量。

作为 rv_continuous 类的实例,levy_stable 对象继承了该类的一组通用方法(请参阅下面的完整列表),并使用此特定分布的详细信息对其进行了补充。

另请参阅

levy, levy_l, cauchy, norm

注释

levy_stable 的分布具有特征函数

\[\varphi(t, \alpha, \beta, c, \mu) = e^{it\mu -|ct|^{\alpha}(1-i\beta\operatorname{sign}(t)\Phi(\alpha, t))}\]

其中支持两种不同的参数化。第一个 \(S_1\)

\[\begin{split}\Phi = \begin{cases} \tan \left({\frac {\pi \alpha }{2}}\right)&\alpha \neq 1\\ -{\frac {2}{\pi }}\log |t|&\alpha =1 \end{cases}\end{split}\]

第二个 \(S_0\)

\[\begin{split}\Phi = \begin{cases} -\tan \left({\frac {\pi \alpha }{2}}\right)(|ct|^{1-\alpha}-1) &\alpha \neq 1\\ -{\frac {2}{\pi }}\log |ct|&\alpha =1 \end{cases}\end{split}\]

levy_stable 的概率密度函数为

\[f(x) = \frac{1}{2\pi}\int_{-\infty}^\infty \varphi(t)e^{-ixt}\,dt\]

其中 \(-\infty < t < \infty\)。此积分没有已知的封闭形式。

levy_stable 推广了几种分布。在可能的情况下,应使用它们代替。具体来说,当形状参数采用下表中的值时,应使用相应的等效分布。

alpha

beta

等效分布

1/2

-1

levy_l

1/2

1

levy

1

0

cauchy

2

任何值

norm (with scale=sqrt(2))

pdf 的评估默认使用 Nolan 的分段积分方法和 Zolotarev \(M\) 参数化。还可以选择使用特征函数的标准参数化的直接数值积分,或通过取特征函数的 FFT 来评估。

可以通过将类变量 levy_stable.pdf_default_method 设置为 ‘piecewise’(Nolan 的方法)、‘dni’(直接数值积分)或 ‘fft-simpson’(基于 FFT 的方法)之一来更改默认方法。为了向后兼容,方法 ‘best’ 和 ‘zolotarev’ 等效于 ‘piecewise’,而方法 ‘quadrature’ 等效于 ‘dni’。

可以通过将类变量 levy_stable.parameterization 设置为 ‘S0’ 或 ‘S1’ 来更改参数化。默认为 ‘S1’。

为了提高分段和直接数值积分的性能,可以指定 levy_stable.quad_eps(默认为 1.2e-14)。这既用作直接数值积分的绝对和相对求积公差,又用作分段方法的相对求积公差。还可以为 x 与 zeta 足够接近以被视为与 x 相同的情况指定 levy_stable.piecewise_x_tol_near_zeta(默认为 0.005)[NO]。确切的检查是 abs(x0 - zeta) < piecewise_x_tol_near_zeta*alpha**(1/alpha)。还可以为 alpha 与 1 足够接近以被视为等于 1 的情况指定 levy_stable.piecewise_alpha_tol_near_one(默认为 0.005)。

为了提高 FFT 计算的准确性,可以指定 levy_stable.pdf_fft_grid_spacing(默认为 0.001)和 pdf_fft_n_points_two_power(默认为 None,这意味着计算一个足以覆盖输入范围的值)。

通过设置样条阶数的 pdf_fft_interpolation_degree(默认为 3)和确定在使用 Newton-Cotes 公式逼近特征函数时要使用的点数的 pdf_fft_interpolation_level(被认为是实验性的),可以进一步控制 FFT 计算。

cdf 的评估默认使用 Nolan 的分段积分方法和 Zolatarev \(S_0\) 参数化。还可以选择通过对通过 FFT 方法计算的 pdf 的插值样条进行积分来进行评估。影响 FFT 计算的设置与 pdf 计算的设置相同。可以通过将 levy_stable.cdf_default_method 设置为 ‘piecewise’ 或 ‘fft-simpson’ 来更改默认 cdf 方法。对于 cdf 计算,Zolatarev 方法在准确性方面更胜一筹,因此默认禁用 FFT。

拟合估计使用 [MC] 中的分位数估计方法。拟合方法中参数的 MLE 估计最初使用此分位数估计。请注意,如果对 pdf 计算使用 FFT,则 MLE 并不总是收敛;如果 alpha <= 1,则 FFT 方法不会给出很好的近似值,情况就是如此。

属性 levy_stable.pdf_fft_min_points_threshold 的任何非缺失值都将 levy_stable.pdf_default_method 设置为 ‘fft-simpson’,如果未以其他方式设置有效的默认方法。

警告

对于 pdf 计算,FFT 计算被认为是实验性的。

对于 cdf 计算,FFT 计算被认为是实验性的。请改用 Zolatarev 的方法(默认)。

上面的概率密度以“标准化”形式定义。要平移和/或缩放分布,请使用 locscale 参数。通常,levy_stable.pdf(x, alpha, beta, loc, scale)levy_stable.pdf(y, alpha, beta) / scale 完全等效,其中 y = (x - loc) / scale,除非在 S1 参数化中,如果 alpha == 1。在这种情况下,levy_stable.pdf(x, alpha, beta, loc, scale)levy_stable.pdf(y, alpha, beta) / scale 完全等效,其中 y = (x - loc - 2 * beta * scale * np.log(scale) / np.pi) / scale。有关更多信息,请参阅 [NO2] 定义 1.8。请注意,移动分布的位置不会使其成为“非中心”分布。

参考文献

[MC]

McCulloch, J., 1986. 稳定分布参数的简单一致估计器。统计通信 - 模拟和计算 15, 11091136。

[WZ]

Wang, Li 和 Zhang, Ji-Hong, 2008。基于辛普森规则的 FFT 方法计算稳定分布的密度。

[NO]

Nolan, J., 1997. 稳定密度和分布函数的数值计算。

[NO2]

Nolan, J., 2018. 稳定分布:重尾数据的模型。

[HO]

Hopcraft, K. I., Jakeman, E., Tanner, R. M. J., 1999. 步数波动和多尺度行为的 Lévy 随机游走。

示例

>>> import numpy as np
>>> from scipy.stats import levy_stable
>>> import matplotlib.pyplot as plt
>>> fig, ax = plt.subplots(1, 1)

计算前四阶矩

>>> alpha, beta = 1.8, -0.5
>>> mean, var, skew, kurt = levy_stable.stats(alpha, beta, moments='mvsk')

显示概率密度函数 (pdf)

>>> x = np.linspace(levy_stable.ppf(0.01, alpha, beta),
...                 levy_stable.ppf(0.99, alpha, beta), 100)
>>> ax.plot(x, levy_stable.pdf(x, alpha, beta),
...        'r-', lw=5, alpha=0.6, label='levy_stable pdf')

或者,可以调用分布对象(作为函数)来固定形状、位置和比例参数。这将返回一个“冻结的” RV 对象,其中保存着给定的固定参数。

冻结分布并显示冻结的 pdf

>>> rv = levy_stable(alpha, beta)
>>> ax.plot(x, rv.pdf(x), 'k-', lw=2, label='frozen pdf')

检查 cdfppf 的准确性

>>> vals = levy_stable.ppf([0.001, 0.5, 0.999], alpha, beta)
>>> np.allclose([0.001, 0.5, 0.999], levy_stable.cdf(vals, alpha, beta))
True

生成随机数

>>> r = levy_stable.rvs(alpha, beta, size=1000)

并比较直方图

>>> ax.hist(r, density=True, bins='auto', histtype='stepfilled', alpha=0.2)
>>> ax.set_xlim([x[0], x[-1]])
>>> ax.legend(loc='best', frameon=False)
>>> plt.show()
../../_images/scipy-stats-levy_stable-1.png

方法

rvs(alpha, beta, loc=0, scale=1, size=1, random_state=None)

随机变量。

pdf(x, alpha, beta, loc=0, scale=1)

概率密度函数。

logpdf(x, alpha, beta, loc=0, scale=1)

概率密度函数的对数。

cdf(x, alpha, beta, loc=0, scale=1)

累积分布函数。

logcdf(x, alpha, beta, loc=0, scale=1)

累积分布函数的对数。

sf(x, alpha, beta, loc=0, scale=1)

生存函数(也定义为 1 - cdf,但 sf 有时更准确)。

logsf(x, alpha, beta, loc=0, scale=1)

生存函数的对数。

ppf(q, alpha, beta, loc=0, scale=1)

百分点函数(cdf 的反函数 — 百分位数)。

isf(q, alpha, beta, loc=0, scale=1)

逆生存函数(sf 的反函数)。

moment(order, alpha, beta, loc=0, scale=1)

指定阶数的非中心矩。

stats(alpha, beta, loc=0, scale=1, moments='mv')

均值('m'),方差('v'),偏度('s') 和/或 峰度('k')。

entropy(alpha, beta, loc=0, scale=1)

随机变量的(微分)熵。

fit(data)

通用数据的参数估计。有关关键字参数的详细文档,请参阅 scipy.stats.rv_continuous.fit

expect(func, args=(alpha, beta), loc=0, scale=1, lb=None, ub=None, conditional=False, **kwds)

关于分布的函数(一个参数)的期望值。

median(alpha, beta, loc=0, scale=1)

分布的中位数。

mean(alpha, beta, loc=0, scale=1)

分布的均值。

var(alpha, beta, loc=0, scale=1)

分布的方差。

std(alpha, beta, loc=0, scale=1)

分布的标准差。

interval(confidence, alpha, beta, loc=0, scale=1)

围绕中位数的等面积置信区间。