scipy.optimize.

dual_annealing#

scipy.optimize.dual_annealing(func, bounds, args=(), maxiter=1000, minimizer_kwargs=None, initial_temp=5230.0, restart_temp_ratio=2e-05, visit=2.62, accept=-5.0, maxfun=10000000.0, seed=None, no_local_search=False, callback=None, x0=None)[source]#

使用双重退火算法找到函数的全局最小值。

参数:
func可调用对象

要最小化的目标函数。必须采用 f(x, *args) 的形式,其中 x 是参数,形式为 1-D 数组,args 是元组,包含任何其他固定参数,这些参数是完全指定函数所需的。

bounds序列或 Bounds

变量的边界。有两种方法可以指定边界:

  1. Bounds 类的实例。

  2. 每个元素在 x 中的 (min, max) 对序列。

args元组,可选

完全指定目标函数所需的任何其他固定参数。

maxiterint,可选

全局搜索迭代的最大次数。默认值为 1000。

minimizer_kwargs字典,可选

要传递给局部最小化器 (minimize) 的关键字参数。一个重要的选项可能是 method,用于指定要使用的最小化器方法。如果没有提供关键字参数,则局部最小化器默认为 ‘L-BFGS-B’,并使用已经提供的边界。如果指定了 minimizer_kwargs,则字典必须包含控制局部最小化的所有参数。 args 在此字典中被忽略,因为它会自动传递。 bounds 不会自动传递给局部最小化器,因为该方法可能不支持它们。

initial_tempfloat,可选

初始温度,使用更高的值可以促进更广泛的能量景观搜索,使双重退火算法能够逃脱它所陷入的局部最小值。默认值为 5230。范围为 (0.01, 5.e4]。

restart_temp_ratiofloat,可选

在退火过程中,温度正在下降,当温度达到 initial_temp * restart_temp_ratio 时,将触发重新退火过程。该比率的默认值为 2e-5。范围为 (0, 1)。

visitfloat,可选

访问分布的参数。默认值为 2.62。更高的值会使访问分布具有更重的尾部,这使得算法能够跳跃到更远的区域。值范围为 (1, 3]。

acceptfloat,可选

接受分布的参数。它用于控制接受概率。接受参数越低,接受概率就越小。默认值为 -5.0,范围为 (-1e4, -5]。

maxfunint,可选

目标函数调用次数的软限制。如果算法处于局部搜索的中间,则会超过此数字,算法将在局部搜索完成后的立即停止。默认值为 1e7。

seed{None, int, numpy.random.Generator, numpy.random.RandomState}, 可选

如果 seed 为 None(或 np.random),则使用 numpy.random.RandomState 单例。如果 seed 是一个整数,则使用一个新的 RandomState 实例,并使用 seed 进行播种。如果 seed 已经是 GeneratorRandomState 实例,则使用该实例。指定 seed 以实现可重复的最小化。使用此种子生成的随机数仅影响访问分布函数和新的坐标生成。

no_local_searchbool,可选

如果 no_local_search 设置为 True,则将执行传统的广义模拟退火,而不应用任何局部搜索策略。

callback可调用对象,可选

具有签名 callback(x, f, context) 的回调函数,该函数将针对所有找到的最小值进行调用。 xf 是最新找到的最小值的坐标和函数值,而 context 的值在 [0, 1, 2] 中,含义如下:

  • 0:在退火过程中检测到的最小值。

  • 1:检测发生在局部搜索过程中。

  • 2:在双重退火过程中完成检测。

如果回调实现返回 True,则算法将停止。

x0ndarray,形状 (n,),可选

单个 N-D 起始点的坐标。

返回值:
resOptimizeResult

优化结果,表示为 OptimizeResult 对象。重要的属性是: x 是解决方案数组, fun 是解决方案处函数的值,而 message 描述了终止的原因。有关其他属性的描述,请参阅 OptimizeResult

注意

此函数实现双重退火优化。这种源自 [3] 的随机方法结合了 CSA(经典模拟退火)和 FSA(快速模拟退火)的泛化 [1] [2],并结合了在接受位置应用局部搜索的策略 [4]。这种算法的另一种实现方式在 [5] 中有描述,并在 [6] 中介绍了基准。这种方法引入了一种先进的方法,用于细化广义退火过程找到的解决方案。该算法使用扭曲的柯西-洛伦兹访问分布,其形状由参数 \(q_{v}\) 控制

\[g_{q_{v}}(\Delta x(t)) \propto \frac{ \ \left[T_{q_{v}}(t) \right]^{-\frac{D}{3-q_{v}}}}{ \ \left[{1+(q_{v}-1)\frac{(\Delta x(t))^{2}} { \ \left[T_{q_{v}}(t)\right]^{\frac{2}{3-q_{v}}}}}\right]^{ \ \frac{1}{q_{v}-1}+\frac{D-1}{2}}}\]

其中 \(t\) 是人工时间。该访问分布用于生成变量 \(x(t)\) 在人工温度 \(T_{q_{v}}(t)\) 下的试验跳跃距离 \(\Delta x(t)\)

从起始点开始,调用访问分布函数后,接受概率计算如下:

\[p_{q_{a}} = \min{\{1,\left[1-(1-q_{a}) \beta \Delta E \right]^{ \ \frac{1}{1-q_{a}}}\}}\]

其中 \(q_{a}\) 是接受参数。对于 \(q_{a}<1\),当

\[[1-(1-q_{a}) \beta \Delta E] < 0\]

时,会为零接受概率分配。

人工温度 \(T_{q_{v}}(t)\) 按照以下方式下降:

\[T_{q_{v}}(t) = T_{q_{v}}(1) \frac{2^{q_{v}-1}-1}{\left( \ 1 + t\right)^{q_{v}-1}-1}\]

其中 \(q_{v}\) 是访问参数。

在版本 1.2.0 中添加。

[1]

参考文献

[2]

Tsallis C. 玻尔兹曼-吉布斯统计的可能泛化。统计物理学杂志,52,479-487 (1998)。

[3]

Xiang Y, Sun DY, Fan W, Gong XG. 广义模拟退火算法及其在汤姆孙模型中的应用. 物理快报 A, 233, 216-220 (1997).

[4]

Xiang Y, Gong XG. 广义模拟退火的效率. 物理评论 E, 62, 4473 (2000).

[5]

Xiang Y, Gubian S, Suomela B, Hoeng J. 广义模拟退火用于高效全局优化:用于 R 的 GenSA 包. R 杂志, 第 5 卷/第 1 期 (2013).

[6]

Mullen, K. R 中的连续全局优化. 统计软件杂志, 60(6), 1 - 45, (2014). DOI:10.18637/jss.v060.i06

示例

以下示例是一个 10 维问题,具有许多局部最小值。所涉及的函数称为 Rastrigin (https://en.wikipedia.org/wiki/Rastrigin_function)

>>> import numpy as np
>>> from scipy.optimize import dual_annealing
>>> func = lambda x: np.sum(x*x - 10*np.cos(2*np.pi*x)) + 10*np.size(x)
>>> lw = [-5.12] * 10
>>> up = [5.12] * 10
>>> ret = dual_annealing(func, bounds=list(zip(lw, up)))
>>> ret.x
array([-4.26437714e-09, -3.91699361e-09, -1.86149218e-09, -3.97165720e-09,
       -6.29151648e-09, -6.53145322e-09, -3.93616815e-09, -6.55623025e-09,
       -6.05775280e-09, -5.00668935e-09]) # random
>>> ret.fun
0.000000