正交距离回归 (scipy.odr)#

包内容#

Data(x[, y, we, wd, fix, meta])

要拟合的数据。

RealData(x[, y, sx, sy, covx, covy, fix, meta])

数据,其中权重是实际标准差和/或协方差。

Model(fcn[, fjacb, fjacd, extra_args, ...])

Model 类存储有关您希望拟合的函数的信息。

ODR(data, model[, beta0, delta0, ifixb, ...])

ODR 类收集所有信息并协调主拟合程序的运行。

Output(output)

Output 类存储 ODR 运行的输出。

odr(fcn, beta0, y, x[, we, wd, fjacb, ...])

ODR 的底层函数。

OdrWarning

警告,表示传递给 ODR 的数据在传递给“odr”时将导致用户应注意的问题。

OdrError

表示拟合中出现错误的异常。

OdrStop

停止拟合的异常。

polynomial(order)

通用多项式模型的工厂函数。

exponential

指数模型

multilinear

任意维度线性模型

unilinear

单变量线性模型

quadratic

二次模型

使用信息#

引言#

为什么选择正交距离回归 (ODR)?有时,解释变量(又称“自变量”)中存在测量误差,而不仅仅是响应变量(又称“因变量”)。普通最小二乘法 (OLS) 拟合过程将解释变量的数据视为固定值,即不受任何误差影响。此外,OLS 过程要求响应变量是解释变量的显式函数;有时,使方程显式化是不切实际的和/或会引入误差。ODR 可以轻松处理这两种情况,如果问题需要,甚至可以简化为 OLS 情况。

ODRPACK 是一个 FORTRAN-77 库,用于执行可能带有非线性拟合函数的 ODR。它使用修改后的信任域 Levenberg-Marquardt 型算法 [1] 来估计函数参数。拟合函数由操作 NumPy 数组的 Python 函数提供。所需的导数也可以由 Python 函数提供,或者可以数值估计。ODRPACK 可以执行显式或隐式 ODR 拟合,也可以执行 OLS。输入和输出变量可以是多维的。可以提供权重来解释观测值的不同方差,甚至变量维度之间的协方差。

scipy.odr 包除了提供低级的 odr 函数外,还提供了 ODRPACK 的面向对象接口。

有关 ODRPACK 的更多背景信息可在ODRPACK 用户指南中找到,建议阅读该指南。

基本用法#

  1. 定义您要拟合的函数。

    def f(B, x):
        '''Linear function y = m*x + b'''
        # B is a vector of the parameters.
        # x is an array of the current x values.
        # x is in the same format as the x passed to Data or RealData.
        #
        # Return an array in the same format as y passed to Data or RealData.
        return B[0]*x + B[1]
    
  2. 创建一个 Model 实例。

    linear = Model(f)
    
  3. 创建一个 Data 或 RealData 实例。

    mydata = Data(x, y, wd=1./power(sx,2), we=1./power(sy,2))
    

    或者,当实际协方差已知时

    mydata = RealData(x, y, sx=sx, sy=sy)
    
  4. 使用您的数据、模型和初始参数估计实例化 ODR。

    myodr = ODR(mydata, linear, beta0=[1., 2.])
    
  5. 运行拟合。

    myoutput = myodr.run()
    
  6. 检查输出。

    myoutput.pprint()
    

参考文献#

[1]

P. T. Boggs 和 J. E. Rogers,“正交距离回归”,收录于“测量误差模型统计分析与应用:AMS-IMS-SIAM 联合夏季研究会议论文集,1989 年 6 月 10-16 日”,当代数学,第 112 卷,第 186 页,1990 年。