在有向图的拓扑排序——BFS这篇文章中,介绍了有向图的拓扑排序的定义以及使用广度优先搜索(BFS)对有向图进行拓扑排序的方法,这里再介绍另一种方法:深度优先搜索(DFS)。
算法
考虑下面这张图:
首先,我们需要维护一个栈,用来存放DFS到的节点。另外规定每个节点有两个状态:未访问(这里用蓝绿色表示)、已访问(这里用黑色表示)。
任选一个节点开始DFS,比如这里就从0开始吧。
首先将节点0的状态设为已访问,然后节点0的邻居(节点0的出边指向的节点)共有1个:节点2,它是未访问状态,于是顺下去访问节点2。
节点2的状态也设为已访问。节点2有3个邻居:3、4、5,都是未访问状态,不妨从3开始。一直这样访问下去,直到访问到没有出边的节点7。
节点7没有出边了,这时候就将节点7入栈。
退回到节点6,虽然6还有邻居,但是唯一的邻居节点7是已访问状态,也入栈。再次退回,节点4的两个邻居也都已访问,依旧入栈并后退。以此类推,退回到节点2。
节点2有3个邻居,其中节点3和4已访问,但是节点5还未访问,访问节点5。
接下来的步骤是一样的,不再赘述了,直接退回到节点0并将0入栈。
现在,从节点0开始的DFS宣告结束,但是图中还有未访问的节点:节点1,从节点1继续开始DFS。
节点1的邻居节点2已经访问过了,直接将节点1入栈。
至此,整个DFS过程宣告结束。从栈顶到栈底的节点序列1 0 2 5 3 4 6 7就是整个图的一个拓扑排序序列。
实现
这里同样使用类型别名node_t
代表节点序号unsigned long long
:
using node_t = unsigned long long;
同样使用邻接表来存储图结构,整个图的定义如下:
class Graph {
unsigned long long n;
vector<vector<node_t>> adj;
protected:
void dfs(node_t cur, vector<bool> &visited, stack<node_t> &nodeStack);
public:
Graph(initializer_list<initializer_list<node_t>> list) : n(list.size()), adj({}) {
for (auto &l : list) {
adj.emplace_back(l);
}
}
vector<node_t> toposortDfs();
};
DFS
函数dfs
的参数及说明如下:
-
cur
:当前访问的节点。 -
visited
:存放各个节点状态的数组,false
表示未访问,true
表示已访问。初始化为全为false
。 -
nodeStack
:存放节点的栈。
整个过程如下:
- 首先,我们需要将当前节点的状态设为已访问:
visited[cur] = true;
- 依次检查当前节点的所有邻居的状态:
for (node_t neighbor: adj[cur]) {
// ...
}
- 如果某个节点已访问,则跳过。
if (visited[neighbor]) continue;
- 否则,递归的对该节点进行DFS:
dfs(neighbor, visited, nodeStack);
- 所有邻居检查完后,就将该节点入栈:
nodeStack.push(cur);
整个dfs
函数的代码如下:
void Graph::dfs(node_t cur, vector<bool> &visited, stack<node_t> &nodeStack) {
visited[cur] = true;
for (node_t neighbor: adj[cur]) {
if (visited[neighbor]) continue;
dfs(neighbor, visited, nodeStack);
}
nodeStack.push(cur);
}
拓扑排序
我们需要初始化3个数据结构:
-
sort
:存放拓扑排序序列的数组。 -
visited
:见上文。 -
nodeStack
:见上文。
vector<node_t> sort;
vector<bool> visited(n, false);
stack<node_t> nodeStack;
整个过程如下:
- 依次检查每个节点的状态,如果未访问,则从该节点开始进行DFS:
for (node_t node = 0; node < n; ++node) {
if (visited[node]) continue;
dfs(node, visited, nodeStack);
}
- 此时
nodeStack
已经存储了整个拓扑排序序列,我们只需要转移到sort
数组并返回即可:
while (!nodeStack.empty()) {
sort.push_back(nodeStack.top());
nodeStack.pop();
}
return sort;
整个代码如下:
vector<node_t> Graph::toposortDfs() {
vector<node_t> sort;
vector<bool> visited(n, false);
stack<node_t> nodeStack;
for (node_t node = 0; node < n; ++node) {
if (visited[node]) continue;
dfs(node, visited, nodeStack);
}
while (!nodeStack.empty()) {
sort.push_back(nodeStack.top());
nodeStack.pop();
}
return sort;
}
测试
代码:
int main() {
Graph graph{{2},
{2},
{3, 4, 5},
{4},
{6, 7},
{4},
{7},
{}};
auto sort = graph.toposortDfs();
cout << "The topology sort sequence is:\n";
for (const auto &node: sort) {
cout << node << ' ';
}
return 0;
}
输出:
The topology sort sequence is:
1 0 2 5 3 4 6 7
复杂度分析
- 时间复杂度:\(O(n+e)\),\(n\)为节点总数,\(e\)为边的总数。其中DFS的时间复杂度为\(O(n+e)\)。
- 空间复杂度:\(O(n)\)(邻接表的空间复杂度为\(O(n+e)\),不计入在内),其中维护
visited
数组和nodeStack
栈分别需要\(O(n)\)的额外空间。