scipy.cluster.hierarchy.

is_valid_im#

scipy.cluster.hierarchy.is_valid_im(R, warning=False, throw=False, name=None)[source]#

如果传递的不一致矩阵有效,则返回 True。

它必须是一个 \(n\) 行 4 列的双精度数组。标准差 R[:,1] 必须是非负的。链接计数 R[:,2] 必须为正且不超过 \(n-1\).

参数:
Rndarray

要检查有效性的不一致矩阵。

warningbool, 可选

当为 True 时,如果传递的链接矩阵无效,则会发出 Python 警告。

throwbool, 可选

当为 True 时,如果传递的链接矩阵无效,则会抛出 Python 异常。

namestr, 可选

此字符串指的是无效链接矩阵的变量名。

返回值:
bbool

如果 inconsistency matrix 有效,则为 True。

参见

linkage

有关链接矩阵的描述。

inconsistent

用于创建不一致矩阵。

示例

>>> from scipy.cluster.hierarchy import ward, inconsistent, is_valid_im
>>> from scipy.spatial.distance import pdist

给定数据集 X,我们可以应用聚类方法以获得链接矩阵 Zscipy.cluster.hierarchy.inconsistent 也可用于获得与该聚类过程关联的不一致矩阵 R

>>> X = [[0, 0], [0, 1], [1, 0],
...      [0, 4], [0, 3], [1, 4],
...      [4, 0], [3, 0], [4, 1],
...      [4, 4], [3, 4], [4, 3]]
>>> Z = ward(pdist(X))
>>> R = inconsistent(Z)
>>> Z
array([[ 0.        ,  1.        ,  1.        ,  2.        ],
       [ 3.        ,  4.        ,  1.        ,  2.        ],
       [ 6.        ,  7.        ,  1.        ,  2.        ],
       [ 9.        , 10.        ,  1.        ,  2.        ],
       [ 2.        , 12.        ,  1.29099445,  3.        ],
       [ 5.        , 13.        ,  1.29099445,  3.        ],
       [ 8.        , 14.        ,  1.29099445,  3.        ],
       [11.        , 15.        ,  1.29099445,  3.        ],
       [16.        , 17.        ,  5.77350269,  6.        ],
       [18.        , 19.        ,  5.77350269,  6.        ],
       [20.        , 21.        ,  8.16496581, 12.        ]])
>>> R
array([[1.        , 0.        , 1.        , 0.        ],
       [1.        , 0.        , 1.        , 0.        ],
       [1.        , 0.        , 1.        , 0.        ],
       [1.        , 0.        , 1.        , 0.        ],
       [1.14549722, 0.20576415, 2.        , 0.70710678],
       [1.14549722, 0.20576415, 2.        , 0.70710678],
       [1.14549722, 0.20576415, 2.        , 0.70710678],
       [1.14549722, 0.20576415, 2.        , 0.70710678],
       [2.78516386, 2.58797734, 3.        , 1.15470054],
       [2.78516386, 2.58797734, 3.        , 1.15470054],
       [6.57065706, 1.38071187, 3.        , 1.15470054]])

现在我们可以使用 scipy.cluster.hierarchy.is_valid_im 来验证 R 是否正确

>>> is_valid_im(R)
True

但是,如果 R 构建错误(例如,标准差之一设置为负值),则检查将失败

>>> R[-1,1] = R[-1,1] * -1
>>> is_valid_im(R)
False