scipy.spatial.distance.

squareform#

scipy.spatial.distance.squareform(X, force='no', checks=True)[source]#

将向量形式的距离向量转换为方形距离矩阵,反之亦然。

参数:
Xarray_like

压缩或冗余距离矩阵。

forcestr, optional

与 MATLAB(TM) 一样,如果 force 等于 'tovector''tomatrix',则输入将分别被视为距离矩阵或距离向量。

checksbool, optional

如果设置为 False,则不会检查矩阵对称性或零对角线。如果已知 X - X.T1 很小且 diag(X) 接近于零,则此方法很有用。这些值无论如何都会被忽略,因此它们不会扰乱 squareform 变换。

返回值:
Yndarray

如果传递了压缩距离矩阵,则返回冗余矩阵;如果传递了冗余矩阵,则返回压缩距离矩阵。

注释

  1. v = squareform(X)

    给定一个 n 乘 n 的对称距离矩阵 Xv = squareform(X) 返回一个大小为 n * (n-1) / 2(即二项式系数 n choose 2)的向量 v,其中 \(v[{n \choose 2} - {n-i \choose 2} + (j-i-1)]\) 是不同点 ij 之间的距离。如果 X 不是正方形或不对称,则会引发错误。

  2. X = squareform(v)

    给定一个大小为 n * (n-1) / 2 的向量 v,对于某个整数 n >= 1,编码距离如上所述,X = squareform(v) 返回一个 n 乘 n 的距离矩阵 XX[i, j]X[j, i] 的值设置为 \(v[{n \choose 2} - {n-i \choose 2} + (j-i-1)]\),并且所有对角线元素都为零。

在 SciPy 0.19.0 中,squareform 停止将所有输入类型强制转换为 float64,并开始返回与输入具有相同 dtype 的数组。

示例

>>> import numpy as np
>>> from scipy.spatial.distance import pdist, squareform

x 是三维空间中五个点的数组。

>>> x = np.array([[2, 0, 2], [2, 2, 3], [-2, 4, 5], [0, 1, 9], [2, 2, 4]])

pdist(x) 计算 x 中每对点之间的欧几里得距离。距离以一维数组返回,长度为 5*(5 - 1)/2 = 10

>>> distvec = pdist(x)
>>> distvec
array([2.23606798, 6.40312424, 7.34846923, 2.82842712, 4.89897949,
       6.40312424, 1.        , 5.38516481, 4.58257569, 5.47722558])

squareform(distvec) 返回 5x5 距离矩阵。

>>> m = squareform(distvec)
>>> m
array([[0.        , 2.23606798, 6.40312424, 7.34846923, 2.82842712],
       [2.23606798, 0.        , 4.89897949, 6.40312424, 1.        ],
       [6.40312424, 4.89897949, 0.        , 5.38516481, 4.58257569],
       [7.34846923, 6.40312424, 5.38516481, 0.        , 5.47722558],
       [2.82842712, 1.        , 4.58257569, 5.47722558, 0.        ]])

当给定一个方形距离矩阵 m 时,squareform(m) 返回与矩阵关联的一维压缩距离向量。在这种情况下,我们恢复 distvec

>>> squareform(m)
array([2.23606798, 6.40312424, 7.34846923, 2.82842712, 4.89897949,
       6.40312424, 1.        , 5.38516481, 4.58257569, 5.47722558])