scipy.stats.
boxcox_llf#
- scipy.stats.boxcox_llf(lmb, data)[源代码]#
Box-Cox 对数似然函数。
- 参数:
- lmb标量
Box-Cox 转换的参数。有关详细信息,请参见
boxcox
。- data类似数组
用于计算 Box-Cox 对数似然的数据。如果 data 为多维,则沿第一轴计算对数似然。
- 返回值:
- llf浮点或 ndarray
提供 lmb 的 data 的 Box-Cox 对数似然。如果 data 为 1-D,则为浮点数;否则为数组。
注释
此处将 Box-Cox 对数似然函数定义为
\[llf = (\lambda - 1) \sum_i(\log(x_i)) - N/2 \log(\sum_i (y_i - \bar{y})^2 / N),\]其中
y
是 Box-Cox 变换后的输入数据x
。示例
>>> import numpy as np >>> from scipy import stats >>> import matplotlib.pyplot as plt >>> from mpl_toolkits.axes_grid1.inset_locator import inset_axes
生成一些随机变量,并计算一系列
lmbda
值的 Box-Cox 对数似然值>>> rng = np.random.default_rng() >>> x = stats.loggamma.rvs(5, loc=10, size=1000, random_state=rng) >>> lmbdas = np.linspace(-2, 10) >>> llf = np.zeros(lmbdas.shape, dtype=float) >>> for ii, lmbda in enumerate(lmbdas): ... llf[ii] = stats.boxcox_llf(lmbda, x)
同时使用
boxcox
找出最佳 lmbda 值>>> x_most_normal, lmbda_optimal = stats.boxcox(x)
将对数似然值绘制为 lmbda 的函数。将最佳 lmbda 值添加为水平线,以检查该值是否真正为最佳值
>>> fig = plt.figure() >>> ax = fig.add_subplot(111) >>> ax.plot(lmbdas, llf, 'b.-') >>> ax.axhline(stats.boxcox_llf(lmbda_optimal, x), color='r') >>> ax.set_xlabel('lmbda parameter') >>> ax.set_ylabel('Box-Cox log-likelihood')
现在添加一些概率图,以表明对数似然值达到最大值的位置,由
boxcox
变换后的数据看起来最接近正态分布>>> locs = [3, 10, 4] # 'lower left', 'center', 'lower right' >>> for lmbda, loc in zip([-1, lmbda_optimal, 9], locs): ... xt = stats.boxcox(x, lmbda=lmbda) ... (osm, osr), (slope, intercept, r_sq) = stats.probplot(xt) ... ax_inset = inset_axes(ax, width="20%", height="20%", loc=loc) ... ax_inset.plot(osm, osr, 'c.', osm, slope*osm + intercept, 'k-') ... ax_inset.set_xticklabels([]) ... ax_inset.set_yticklabels([]) ... ax_inset.set_title(r'$\lambda=%1.2f$' % lmbda)
>>> plt.show()