正交距离回归 (scipy.odr)#

包内容#

Data(x[, y, we, wd, fix, meta])

要拟合的数据。

RealData(x[, y, sx, sy, covx, covy, fix, meta])

数据,权重为实际标准差和/或协方差。

Model(fcn[, fjacb, fjacd, extra_args, ...])

Model 类存储有关您要拟合的函数的信息。

ODR(data, model[, beta0, delta0, ifixb, ...])

ODR 类收集所有信息并协调主要拟合例程的运行。

Output(output)

Output 类存储 ODR 运行的输出。

odr(fcn, beta0, y, x[, we, wd, fjacb, ...])

ODR 的低级函数。

OdrWarning

警告表示传递到 ODR 的数据在传递到 'odr' 时会导致问题,用户应该注意。

OdrError

表示拟合错误的异常。

OdrStop

停止拟合的异常。

polynomial(order)

用于一般多项式模型的工厂函数。

exponential

指数模型

multilinear

任意维线性模型

unilinear

单变量线性模型

quadratic

二次模型

使用信息#

简介#

为什么选择正交距离回归 (ODR)?有时解释变量(也称为“自变量”)中存在测量误差,而不仅仅是响应变量(也称为“因变量”)。普通最小二乘 (OLS) 拟合程序将解释变量的数据视为固定,即不受任何类型误差的影响。此外,OLS 程序要求响应变量是解释变量的显式函数;有时使方程显式既不切实际又会引入误差。ODR 可以轻松处理这两种情况,如果问题允许,甚至可以简化为 OLS 情况。

ODRPACK 是一个 FORTRAN-77 库,用于执行 ODR,可能具有非线性拟合函数。它使用修改后的置信域 Levenberg-Marquardt 型算法 [1] 来估计函数参数。拟合函数由作用于 NumPy 数组的 Python 函数提供。所需的导数也可以由 Python 函数提供,也可以通过数值估计。ODRPACK 可以执行显式或隐式 ODR 拟合,也可以执行 OLS。输入和输出变量可以是多维的。可以提供权重以解释观测值的差异方差,甚至解释变量的维度之间的协方差。

scipy.odr 包除了低级 odr 函数之外,还提供了一个面向对象的 ODRPACK 接口。

有关 ODRPACK 的更多背景信息,请参阅 ODRPACK 用户指南,建议阅读。

基本用法#

  1. 定义您要拟合的函数。

    def f(B, x):
        '''Linear function y = m*x + b'''
        # B is a vector of the parameters.
        # x is an array of the current x values.
        # x is in the same format as the x passed to Data or RealData.
        #
        # Return an array in the same format as y passed to Data or RealData.
        return B[0]*x + B[1]
    
  2. 创建一个 Model。

    linear = Model(f)
    
  3. 创建一个 Data 或 RealData 实例。

    mydata = Data(x, y, wd=1./power(sx,2), we=1./power(sy,2))
    

    或者,当实际协方差已知时

    mydata = RealData(x, y, sx=sx, sy=sy)
    
  4. 使用您的数据、模型和初始参数估计来实例化 ODR。

    myodr = ODR(mydata, linear, beta0=[1., 2.])
    
  5. 运行拟合。

    myoutput = myodr.run()
    
  6. 检查输出。

    myoutput.pprint()
    

参考文献#

[1]

P. T. Boggs 和 J. E. Rogers,“正交距离回归”,在“测量误差模型的统计分析及其应用:1989 年 6 月 10-16 日举行的 AMS-IMS-SIAM 联合夏季研究会议论文集”,当代数学,第 112 卷,第 186 页,1990 年。