maximum_bipartite_matching#
- scipy.sparse.csgraph.maximum_bipartite_matching(graph, perm_type='row')#
返回一个二分图的匹配,其基数至少与图中任何给定匹配的基数相同。
- 参数:
- graph稀疏矩阵
以 CSR 格式输入的稀疏矩阵,其行代表图的一个分区,其列代表另一个分区。两个顶点之间的边由矩阵中相应的条目在其稀疏表示中存在来指示。
- perm_typestr, {‘row’, ‘column’}
以哪个分区来返回匹配:如果为
'row'
,则该函数产生一个长度等于输入列数的数组,其第 \(j\) 个元素是与第 \(j\) 列匹配的行。反之,如果perm_type
为'column'
,则这将返回与每行匹配的列。
- 返回值:
- permndarray
两个分区中一个中顶点的匹配。未匹配的顶点在结果中表示为
-1
。
备注
此函数实现 Hopcroft-Karp 算法 [1]。其时间复杂度为 \(O(\lvert E \rvert \sqrt{\lvert V \rvert})\),其空间复杂度与行数成线性关系。在实践中,行和列之间的这种不对称性意味着如果输入包含的列比行多,则转置输入可能更高效。
根据 Konig 定理,匹配的基数也是图中最小顶点覆盖的顶点数。
请注意,如果稀疏表示包含显式零,则这些零仍然被计为边。
在 SciPy 1.4.0 中更改了实现,以允许匹配一般二分图,而以前版本会假设存在完美匹配。因此,针对 1.4.0 编写的代码不一定能在旧版本上运行。
如果可能存在多个有效解,输出可能会因 SciPy 和 Python 版本而异。
参考文献
[1]John E. Hopcroft 和 Richard M. Karp。“二分图中最大匹配的 n^{5 / 2} 算法” 在:SIAM 计算杂志 2.4 (1973),第 225–231 页。 DOI:10.1137/0202019
示例
>>> from scipy.sparse import csr_matrix >>> from scipy.sparse.csgraph import maximum_bipartite_matching
作为一个简单的例子,考虑一个二分图,其中分区分别包含 2 个和 3 个元素。假设一个分区包含标号为 0 和 1 的顶点,另一个分区包含标号为 A、B 和 C 的顶点。假设存在连接 0 和 C、1 和 A 以及 1 和 B 的边。那么该图将由以下稀疏矩阵表示
>>> graph = csr_matrix([[0, 0, 1], [1, 1, 0]])
这里,1 可以是任何值,只要它们最终被存储为稀疏矩阵中的元素即可。我们现在可以计算最大匹配,如下所示
>>> print(maximum_bipartite_matching(graph, perm_type='column')) [2 0] >>> print(maximum_bipartite_matching(graph, perm_type='row')) [ 1 -1 0]
第一个输出告诉我们 1 和 2 分别与 C 和 A 匹配,而第二个输出告诉我们 A、B 和 C 分别与 1、无和 0 匹配。
请注意,显式零仍然被转换为边。这意味着另一种表示上述图的方法是直接使用 CSR 结构,如下所示
>>> data = [0, 0, 0] >>> indices = [2, 0, 1] >>> indptr = [0, 1, 3] >>> graph = csr_matrix((data, indices, indptr)) >>> print(maximum_bipartite_matching(graph, perm_type='column')) [2 0] >>> print(maximum_bipartite_matching(graph, perm_type='row')) [ 1 -1 0]
当一个或两个分区为空时,匹配也为空
>>> graph = csr_matrix((2, 0)) >>> print(maximum_bipartite_matching(graph, perm_type='column')) [-1 -1] >>> print(maximum_bipartite_matching(graph, perm_type='row')) []
当输入矩阵为方阵且已知图允许完美匹配(即具有所有图中每个顶点都属于匹配中某个边的属性的匹配)时,则可以将输出视为行(或列)的排列,将输入矩阵转换为具有所有对角元素非空的属性的矩阵
>>> a = [[0, 1, 2, 0], [1, 0, 0, 1], [2, 0, 0, 3], [0, 1, 3, 0]] >>> graph = csr_matrix(a) >>> perm = maximum_bipartite_matching(graph, perm_type='row') >>> print(graph[perm].toarray()) [[1 0 0 1] [0 1 2 0] [0 1 3 0] [2 0 0 3]]