scipy.spatial.

procrustes#

scipy.spatial.procrustes(data1, data2)[源代码]#

Procrustes 分析,两个数据集的相似性检验。

每个输入矩阵都是一组点或向量(矩阵的行)。空间的维度是每个矩阵的列数。给定两个大小相同的矩阵,Procrustes 将两者的标准化,使得

  • \(tr(AA^{T}) = 1\).

  • 两组点均以原点为中心。

Procrustes([1][2])随后将最佳变换应用于第二个矩阵(包括缩放/扩张、旋转和反射),以最小化 \(M^{2}=\sum(data1-data2)^{2}\),即两个输入数据集对应点差值的平方和。

此函数不适用于处理具有不同数据点(行)数量的数据集。如果两个数据集具有不同的维度(不同的列数),只需向较小者添加零列即可。

参数:
data1类数组

矩阵,n 行表示 k(列)空间中的点,data1 是参考数据,经过标准化处理后,将基于 data2 中的数据进行转换,使其符合 data1 中的模式(必须有 >1 个唯一点)。

data2类数组

k 维空间中 n 行数据,以拟合data1。必须与 data1 具有相同的形状 (numrows, numcols)(必须具有 > 1 个唯一点)。

返回:
mtx1array_like

data1 的标准化版本。

mtx2array_like

data1 最匹配的 data2 的方向。居中,但不一定 \(tr(AA^{T}) = 1\)

disparityfloat

如上所定义的 \(M^{2}\)

引发:
ValueError

如果输入数组不是二维数组。如果输入数组的形状不同。如果输入数组没有列或行。

备注

  • 差异不应取决于输入矩阵的顺序,但输出矩阵会,因为只有第一个输出矩阵保证按 \(tr(AA^{T}) = 1\) 缩放。

  • 通常可以有重复的数据点,复制数据点会增加其对 Procrustes 拟合的影响。

  • 差异按每个输入矩阵的点数进行缩放。

参考文献

[1]

Krzanowski, W. J. (2000)。“多变量分析原则”。

[2]

Gower, J. C. (1975)。“广义 Procrustes 分析”。

示例

>>> import numpy as np
>>> from scipy.spatial import procrustes

矩阵 b 是此处 a 的旋转、平移、缩放和镜像版本

>>> a = np.array([[1, 3], [1, 2], [1, 1], [2, 1]], 'd')
>>> b = np.array([[4, -2], [4, -4], [4, -6], [2, -6]], 'd')
>>> mtx1, mtx2, disparity = procrustes(a, b)
>>> round(disparity)
0.0