scipy.stats.

boxcox_normmax#

scipy.stats.boxcox_normmax(x, brack=None, method='pearsonr', optimizer=None, *, ymax=BIG_FLOAT)[source]#

计算输入数据的最佳 Box-Cox 变换参数。

参数:

xarray_like

输入数组。所有条目必须为正、有限、实数。

brack2-tuple, optional, default (-2.0, 2.0)

对于默认的 optimize.brent 求解器，用于下坡括号搜索的起始区间。请注意，在大多数情况下，这并不重要；最终结果允许超出此括号。如果传递了 optimizer，则 brack 必须为 None。

methodstr, optional

用于确定最佳变换参数的方法 (boxcox lmbda 参数)。选项有

‘pearsonr’ (默认): 最大化 y = boxcox(x) 与 y 的期望值之间的 Pearson 相关系数，如果 x 服从正态分布。
‘mle’: 最大化对数似然 boxcox_llf。这是 boxcox 中使用的方法。
‘all’: 使用所有可用的优化方法，并返回所有结果。用于比较不同的方法。

optimizercallable, optional

optimizer 是一个接受一个参数的可调用对象

funcallable: 要最小化的目标函数。fun 接受一个参数，Box-Cox 变换参数 lmbda，并返回函数（例如，负对数似然）在提供的参数处的值。optimizer 的工作是找到 最小化 fun 的 lmbda 的值。

并返回一个对象，例如 scipy.optimize.OptimizeResult 的实例，该实例在其属性 x 中保存 lmbda 的最佳值。

有关更多信息，请参见下面的示例或 scipy.optimize.minimize_scalar 的文档。

ymaxfloat, optional

不受约束的最佳变换参数可能导致 Box-Cox 变换的数据具有极大的量级，甚至溢出。此参数约束 MLE 优化，使得变换后的 x 的大小不超过 ymax。默认值为输入 dtype 的最大值。如果设置为无穷大，boxcox_normmax 将返回不受约束的最佳 lambda。当 method='pearsonr' 时忽略。

返回值:

maxlogfloat 或 ndarray: 找到的最佳变换参数。对于 method='all'，是一个数组而不是一个标量。

参见

boxcox, boxcox_llf, boxcox_normplot, scipy.optimize.minimize_scalar

示例

>>> import numpy as np
>>> from scipy import stats
>>> import matplotlib.pyplot as plt

我们可以生成一些数据，并以各种方式确定最佳 lmbda

>>> rng = np.random.default_rng()
>>> x = stats.loggamma.rvs(5, size=30, random_state=rng) + 5
>>> y, lmax_mle = stats.boxcox(x)
>>> lmax_pearsonr = stats.boxcox_normmax(x)

>>> lmax_mle
2.217563431465757
>>> lmax_pearsonr
2.238318660200961
>>> stats.boxcox_normmax(x, method='all')
array([2.23831866, 2.21756343])

>>> fig = plt.figure()
>>> ax = fig.add_subplot(111)
>>> prob = stats.boxcox_normplot(x, -10, 10, plot=ax)
>>> ax.axvline(lmax_mle, color='r')
>>> ax.axvline(lmax_pearsonr, color='g', ls='--')

>>> plt.show()

../../_images/scipy-stats-boxcox_normmax-1_00_00.png

或者，我们可以定义自己的 optimizer 函数。假设我们只对区间 [6, 7] 中的 lmbda 值感兴趣，我们想使用 scipy.optimize.minimize_scalar 和 method='bounded'，并且我们希望在优化对数似然函数时使用更严格的容差。为此，我们定义一个函数，该函数接受位置参数 fun 并使用 scipy.optimize.minimize_scalar 在提供的边界和容差范围内最小化 fun

>>> from scipy import optimize
>>> options = {'xatol': 1e-12}  # absolute tolerance on `x`
>>> def optimizer(fun):
...     return optimize.minimize_scalar(fun, bounds=(6, 7),
...                                     method="bounded", options=options)
>>> stats.boxcox_normmax(x, optimizer=optimizer)
6.000000000