maximum_flow#
- scipy.sparse.csgraph.maximum_flow(csgraph, source, sink)#
最大化图中两个顶点之间的流量。
在版本 1.4.0 中添加。
- 参数:
- csgraphcsr_matrix
表示有向图的方阵,其 (i, j) 项是表示顶点 i 和 j 之间边容量的整数。
- sourceint
流量流出的源顶点。
- sinkint
流量流入的汇顶点。
- method: {‘edmonds_karp’, ‘dinic’}, 可选
用于计算最大流量的方法/算法。支持以下方法:
默认为 ‘dinic’。
在版本 1.8.0 中添加。
- 返回值:
- resMaximumFlowResult
由
MaximumFlowResult
表示的最大流量,其中包括flow_value
中的流量值,以及flow
中的流量图。
- 引发:
- TypeError
如果输入图不是 CSR 格式。
- ValueError
如果容量值不是整数,或者源或汇超出范围。
注释
这在给定的有向加权图上解决了最大流问题:流量将小于边容量的值(也称为流量)与每个边相关联,以便对于每个顶点(源和汇顶点除外),总的传入流量等于总的传出流量。流量的值是离开源顶点的所有边的流量之和,最大流问题在于找到具有最大值的流量。
根据最大流最小割定理,最大流量值也是最小割中边的总权重。
为了解决这个问题,我们提供了 Edmonds–Karp [1] 和 Dinic 算法 [4]。两种算法的实现都力求利用稀疏性。前者的时间复杂度为 \(O(|V|\,|E|^2)\),空间复杂度为 \(O(|E|)\)。后者通过构建层次图并在其中找到阻塞流来实现其性能。其时间复杂度为 \(O(|V|^2\,|E|)\),空间复杂度为 \(O(|E|)\)。
最大流问题通常用实值容量定义,但为了确保收敛,我们需要所有容量都是整数。当处理有理容量,或属于 \(x\mathbb{Q}\) 的容量(对于某个固定的 \(x \in \mathbb{R}\) 时),可以通过相应地缩放所有容量将问题简化为整数情况。
解决最大流问题可以用于例如计算机视觉中的图割优化 [3]。
参考资料
[2]Cormen, T. H. and Leiserson, C. E. and Rivest, R. L. and Stein C. 算法导论。第二版。2001 年。麻省理工学院出版社。
示例
也许最简单的流问题是只有两个顶点的图,从源(0)到汇(1)有一条边
(0) --5--> (1)
这里,最大流只是边的容量
>>> import numpy as np >>> from scipy.sparse import csr_matrix >>> from scipy.sparse.csgraph import maximum_flow >>> graph = csr_matrix([[0, 5], [0, 0]]) >>> maximum_flow(graph, 0, 1).flow_value 5 >>> maximum_flow(graph, 0, 1, method='edmonds_karp').flow_value 5
另一方面,如果源和汇之间存在瓶颈,这会降低最大流
(0) --5--> (1) --3--> (2)
>>> graph = csr_matrix([[0, 5, 0], [0, 0, 3], [0, 0, 0]]) >>> maximum_flow(graph, 0, 2).flow_value 3
[2],第 26.1 章中给出了一个不太简单的示例
>>> graph = csr_matrix([[0, 16, 13, 0, 0, 0], ... [0, 0, 10, 12, 0, 0], ... [0, 4, 0, 0, 14, 0], ... [0, 0, 9, 0, 0, 20], ... [0, 0, 0, 7, 0, 4], ... [0, 0, 0, 0, 0, 0]]) >>> maximum_flow(graph, 0, 5).flow_value 23
可以在二分图中找到最大匹配的问题减少为最大流问题:令 \(G = ((U, V), E)\) 为二分图。然后,在图中添加一个源顶点,该顶点与 \(U\) 中的每个顶点相连,并添加一个汇顶点,该顶点与 \(V\) 中的每个顶点相连。最后,给结果图中的每条边赋予容量 1。然后,新图中的最大流给出了原始图中的最大匹配,该匹配由 \(E\) 中流量为正的边组成。
假设边由 \(\lvert U \rvert \times \lvert V \rvert\) 矩阵以 CSR 格式表示,其 \((i, j)\) 项如果从 \(i \in U\) 到 \(j \in V\) 有一条边则为 1,否则为 0;也就是说,输入是
maximum_bipartite_matching
所需的格式。然后,上面构造的图的 CSR 表示包含此矩阵作为块。这是一个例子>>> graph = csr_matrix([[0, 1, 0, 1], [1, 0, 1, 0], [0, 1, 1, 0]]) >>> print(graph.toarray()) [[0 1 0 1] [1 0 1 0] [0 1 1 0]] >>> i, j = graph.shape >>> n = graph.nnz >>> indptr = np.concatenate([[0], ... graph.indptr + i, ... np.arange(n + i + 1, n + i + j + 1), ... [n + i + j]]) >>> indices = np.concatenate([np.arange(1, i + 1), ... graph.indices + i + 1, ... np.repeat(i + j + 1, j)]) >>> data = np.ones(n + i + j, dtype=int) >>> >>> graph_flow = csr_matrix((data, indices, indptr)) >>> print(graph_flow.toarray()) [[0 1 1 1 0 0 0 0 0] [0 0 0 0 0 1 0 1 0] [0 0 0 0 1 0 1 0 0] [0 0 0 0 0 1 1 0 0] [0 0 0 0 0 0 0 0 1] [0 0 0 0 0 0 0 0 1] [0 0 0 0 0 0 0 0 1] [0 0 0 0 0 0 0 0 1] [0 0 0 0 0 0 0 0 0]]
此时,我们可以找到添加的汇和添加的源之间的最大流,并且可以通过将流函数限制在对应于原始图的块来获得所需的匹配
>>> result = maximum_flow(graph_flow, 0, i+j+1, method='dinic') >>> matching = result.flow[1:i+1, i+1:i+j+1] >>> print(matching.toarray()) [[0 1 0 0] [1 0 0 0] [0 0 1 0]]
这告诉我们 \(U\) 中的第一个、第二个和第三个顶点分别与 \(V\) 中的第二个、第一个和第三个顶点匹配。
虽然这在一般情况下解决了最大二分匹配问题,但请注意,专门针对该问题的算法,例如
maximum_bipartite_matching
,通常会表现得更好。这种方法也可以用于解决最大二分匹配问题的各种常见推广。例如,如果某些顶点可以与多个其他顶点匹配,则可以通过适当修改新图的容量来处理。