scipy.stats.levy_stable#
- scipy.stats.levy_stable = <scipy.stats._levy_stable.levy_stable_gen object>[源代码]#
一个 Levy-stable 连续随机变量。
作为
rv_continuous
类的实例,levy_stable
对象继承了该类的一组通用方法(请参阅下面的完整列表),并使用此特定分布的详细信息对其进行了补充。注释
levy_stable
的分布具有特征函数\[\varphi(t, \alpha, \beta, c, \mu) = e^{it\mu -|ct|^{\alpha}(1-i\beta\operatorname{sign}(t)\Phi(\alpha, t))}\]其中支持两种不同的参数化。第一个 \(S_1\)
\[\begin{split}\Phi = \begin{cases} \tan \left({\frac {\pi \alpha }{2}}\right)&\alpha \neq 1\\ -{\frac {2}{\pi }}\log |t|&\alpha =1 \end{cases}\end{split}\]第二个 \(S_0\)
\[\begin{split}\Phi = \begin{cases} -\tan \left({\frac {\pi \alpha }{2}}\right)(|ct|^{1-\alpha}-1) &\alpha \neq 1\\ -{\frac {2}{\pi }}\log |ct|&\alpha =1 \end{cases}\end{split}\]levy_stable
的概率密度函数为\[f(x) = \frac{1}{2\pi}\int_{-\infty}^\infty \varphi(t)e^{-ixt}\,dt\]其中 \(-\infty < t < \infty\)。此积分没有已知的封闭形式。
levy_stable
推广了几种分布。在可能的情况下,应使用它们代替。具体来说,当形状参数采用下表中的值时,应使用相应的等效分布。alpha
beta
等效分布
1/2
-1
1/2
1
1
0
2
任何值
norm
(withscale=sqrt(2)
)pdf 的评估默认使用 Nolan 的分段积分方法和 Zolotarev \(M\) 参数化。还可以选择使用特征函数的标准参数化的直接数值积分,或通过取特征函数的 FFT 来评估。
可以通过将类变量
levy_stable.pdf_default_method
设置为 ‘piecewise’(Nolan 的方法)、‘dni’(直接数值积分)或 ‘fft-simpson’(基于 FFT 的方法)之一来更改默认方法。为了向后兼容,方法 ‘best’ 和 ‘zolotarev’ 等效于 ‘piecewise’,而方法 ‘quadrature’ 等效于 ‘dni’。可以通过将类变量
levy_stable.parameterization
设置为 ‘S0’ 或 ‘S1’ 来更改参数化。默认为 ‘S1’。为了提高分段和直接数值积分的性能,可以指定
levy_stable.quad_eps
(默认为 1.2e-14)。这既用作直接数值积分的绝对和相对求积公差,又用作分段方法的相对求积公差。还可以为 x 与 zeta 足够接近以被视为与 x 相同的情况指定levy_stable.piecewise_x_tol_near_zeta
(默认为 0.005)[NO]。确切的检查是abs(x0 - zeta) < piecewise_x_tol_near_zeta*alpha**(1/alpha)
。还可以为 alpha 与 1 足够接近以被视为等于 1 的情况指定levy_stable.piecewise_alpha_tol_near_one
(默认为 0.005)。为了提高 FFT 计算的准确性,可以指定
levy_stable.pdf_fft_grid_spacing
(默认为 0.001)和pdf_fft_n_points_two_power
(默认为 None,这意味着计算一个足以覆盖输入范围的值)。通过设置样条阶数的
pdf_fft_interpolation_degree
(默认为 3)和确定在使用 Newton-Cotes 公式逼近特征函数时要使用的点数的pdf_fft_interpolation_level
(被认为是实验性的),可以进一步控制 FFT 计算。cdf 的评估默认使用 Nolan 的分段积分方法和 Zolatarev \(S_0\) 参数化。还可以选择通过对通过 FFT 方法计算的 pdf 的插值样条进行积分来进行评估。影响 FFT 计算的设置与 pdf 计算的设置相同。可以通过将
levy_stable.cdf_default_method
设置为 ‘piecewise’ 或 ‘fft-simpson’ 来更改默认 cdf 方法。对于 cdf 计算,Zolatarev 方法在准确性方面更胜一筹,因此默认禁用 FFT。拟合估计使用 [MC] 中的分位数估计方法。拟合方法中参数的 MLE 估计最初使用此分位数估计。请注意,如果对 pdf 计算使用 FFT,则 MLE 并不总是收敛;如果 alpha <= 1,则 FFT 方法不会给出很好的近似值,情况就是如此。
属性
levy_stable.pdf_fft_min_points_threshold
的任何非缺失值都将levy_stable.pdf_default_method
设置为 ‘fft-simpson’,如果未以其他方式设置有效的默认方法。警告
对于 pdf 计算,FFT 计算被认为是实验性的。
对于 cdf 计算,FFT 计算被认为是实验性的。请改用 Zolatarev 的方法(默认)。
上面的概率密度以“标准化”形式定义。要平移和/或缩放分布,请使用
loc
和scale
参数。通常,levy_stable.pdf(x, alpha, beta, loc, scale)
与levy_stable.pdf(y, alpha, beta) / scale
完全等效,其中y = (x - loc) / scale
,除非在S1
参数化中,如果alpha == 1
。在这种情况下,levy_stable.pdf(x, alpha, beta, loc, scale)
与levy_stable.pdf(y, alpha, beta) / scale
完全等效,其中y = (x - loc - 2 * beta * scale * np.log(scale) / np.pi) / scale
。有关更多信息,请参阅 [NO2] 定义 1.8。请注意,移动分布的位置不会使其成为“非中心”分布。参考文献
[MC]McCulloch, J., 1986. 稳定分布参数的简单一致估计器。统计通信 - 模拟和计算 15, 11091136。
[WZ]Wang, Li 和 Zhang, Ji-Hong, 2008。基于辛普森规则的 FFT 方法计算稳定分布的密度。
[NO]Nolan, J., 1997. 稳定密度和分布函数的数值计算。
[NO2]Nolan, J., 2018. 稳定分布:重尾数据的模型。
[HO]Hopcraft, K. I., Jakeman, E., Tanner, R. M. J., 1999. 步数波动和多尺度行为的 Lévy 随机游走。
示例
>>> import numpy as np >>> from scipy.stats import levy_stable >>> import matplotlib.pyplot as plt >>> fig, ax = plt.subplots(1, 1)
计算前四阶矩
>>> alpha, beta = 1.8, -0.5 >>> mean, var, skew, kurt = levy_stable.stats(alpha, beta, moments='mvsk')
显示概率密度函数 (
pdf
)>>> x = np.linspace(levy_stable.ppf(0.01, alpha, beta), ... levy_stable.ppf(0.99, alpha, beta), 100) >>> ax.plot(x, levy_stable.pdf(x, alpha, beta), ... 'r-', lw=5, alpha=0.6, label='levy_stable pdf')
或者,可以调用分布对象(作为函数)来固定形状、位置和比例参数。这将返回一个“冻结的” RV 对象,其中保存着给定的固定参数。
冻结分布并显示冻结的
pdf
>>> rv = levy_stable(alpha, beta) >>> ax.plot(x, rv.pdf(x), 'k-', lw=2, label='frozen pdf')
检查
cdf
和ppf
的准确性>>> vals = levy_stable.ppf([0.001, 0.5, 0.999], alpha, beta) >>> np.allclose([0.001, 0.5, 0.999], levy_stable.cdf(vals, alpha, beta)) True
生成随机数
>>> r = levy_stable.rvs(alpha, beta, size=1000)
并比较直方图
>>> ax.hist(r, density=True, bins='auto', histtype='stepfilled', alpha=0.2) >>> ax.set_xlim([x[0], x[-1]]) >>> ax.legend(loc='best', frameon=False) >>> plt.show()
方法
rvs(alpha, beta, loc=0, scale=1, size=1, random_state=None)
随机变量。
pdf(x, alpha, beta, loc=0, scale=1)
概率密度函数。
logpdf(x, alpha, beta, loc=0, scale=1)
概率密度函数的对数。
cdf(x, alpha, beta, loc=0, scale=1)
累积分布函数。
logcdf(x, alpha, beta, loc=0, scale=1)
累积分布函数的对数。
sf(x, alpha, beta, loc=0, scale=1)
生存函数(也定义为
1 - cdf
,但 sf 有时更准确)。logsf(x, alpha, beta, loc=0, scale=1)
生存函数的对数。
ppf(q, alpha, beta, loc=0, scale=1)
百分点函数(
cdf
的反函数 — 百分位数)。isf(q, alpha, beta, loc=0, scale=1)
逆生存函数(
sf
的反函数)。moment(order, alpha, beta, loc=0, scale=1)
指定阶数的非中心矩。
stats(alpha, beta, loc=0, scale=1, moments='mv')
均值('m'),方差('v'),偏度('s') 和/或 峰度('k')。
entropy(alpha, beta, loc=0, scale=1)
随机变量的(微分)熵。
fit(data)
通用数据的参数估计。有关关键字参数的详细文档,请参阅 scipy.stats.rv_continuous.fit。
expect(func, args=(alpha, beta), loc=0, scale=1, lb=None, ub=None, conditional=False, **kwds)
关于分布的函数(一个参数)的期望值。
median(alpha, beta, loc=0, scale=1)
分布的中位数。
mean(alpha, beta, loc=0, scale=1)
分布的均值。
var(alpha, beta, loc=0, scale=1)
分布的方差。
std(alpha, beta, loc=0, scale=1)
分布的标准差。
interval(confidence, alpha, beta, loc=0, scale=1)
围绕中位数的等面积置信区间。