关于三个简单的图论算法
prim,dijkstra和kruskal三个图论的算法,初学者容易将他们搞混,所以放在一起了。
prim和kruskal是最小生成树(MST)的算法,dijkstra是单源最短路径的算法。
prim
最小生成树prim算法采用了贪心策略:把点分成两个集合,A为已被处理(已经在最小生成树中)的顶点,B为待处理的顶点,(A,B)也就是一个割。若边(u,v)满足u∈A,v∈B,那么(u,v)就是通过割(A,B)的一条边。
很自然的,会有一定数量的边会通过该割,其中权重最小的边就是轻边。
什么是轻边?
左边集合和右边集合就组成一个割,其中边(a,b)是跨越两个集合最小的边(途中标记为红色),它就是要找的轻边。
每次操作都是选择min{w(u,v)|u∈A,v∈B},从而将v加入到A中,即将v标记为已处理顶点,直到将所有点都处理完为止。
上述过程可以产生最小生成树,即证明:A,B通过轻边(权重最小的边)(u,v)连接,现假设不选择(u,v),而选择(u’,v’)得到了更优的最小生成树,注意w(u,v)<w(u’,v’)。证明推翻这个假设即可。
把(u’,v’)去掉,补上(u,v),这不影响A,B的连通,这样就得到了比上述假设更优的最小生成树,从而推翻假设,同时也证明了这个算法具有最优子结构。
prim的伪代码:
01
02
03
04
05
06
07
08
09
10
11
|
for i=[0,n)
dist[i] = tab[0][i]
visit[0] = true
for i=[1,n)
min = MAX_VALUE
for j=[0,n)
if !visit[j] && min>dist[j]
min = dist[j]
for k=[0,n)
if !visit[k] && dist[j]>tab[i][j]
dist[j] = tab[i][j]
|
kruskal
最小生成树kruskal算法也具有贪心策略:将所有点边按权值大小从小到大排列,每次都从中选取最小权值的边(u,v),并把它添加到正在生长的森林中。所以开始的时候图中n个顶点构成森林中的n棵树(通俗的讲就是n个集合),而且这些树(集合)只有一个顶点。
重复上述过程,就可以将森林中的树不断的合并(通俗的讲就是合并两个不相交集合),直到将所有点同属于一棵树为止(通俗的讲就是只剩下一个集合)。
如上图,有了四个独立的集合,先不管上面的边上从这个集合中哪个点连到那个集合的哪个点,我们只要找到最小权值的边(对于上面的图中是11),合并集合即可。因此上面的例子进行合并后:
kruskal证明过程可以参照prim算法的证明过程。
kruskal实现过程涉及了不相交子集的合并,可以开辟一个简单的数组,然后通过标记每个点的父节点来简化合并过程。举例:图中有10个顶点
一开始:
i | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
parent | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
假设一段时间后:0 1 2 0 0 0 6 7 1 1
i | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
parent | 0 | 1 | 2 | 0 | 0 | 0 | 6 | 7 | 1 | 1 |
从上面的表可以判断顶点1,顶点8和顶点9同属于同一个集合;顶点0,顶点3,顶点4和顶点5同属于一个集合;凡是parent[i]=i都是单个点的集合,比如顶点2等。
所以程序中设计了两个函数,find和makeset,find用于找到一个集合的root,比如find(9)=1,find(5)=0;而makeset用于合并两个不相交的子集,它的作用就是修改其中一个集合的root就可以了。需要注意的是,kruskal算法要防止出现环,所以,当发现最小的边(u,v)同属于一棵树的时候,不能将其makeset。
kruskal的伪代码:
1
2
3
4
5
6
7
8
9
|
for i=[0,n)
parent[i] = i
// 根据权值升序排序 sort while set_count>1
if find(u)!=find(v)
minprice+=w(u,v)
makeset(u,v)
// update u and v;
|
prim和kruskal的实现区别
一个非常明显的区别就是prim在任何时刻都只有两个集合,一个是已处理顶点集合,一个是待处理集合;而kruskal则有多个集合,所以kruskal涉及不相交子集合并的比较复杂的操作问题。
简单的MST应用:
某省调查乡村交通状况,得到的统计表中列出了任意两村庄间的距离。省*“畅通工程”的目标是使全省任何两个村庄间都可以实现公路交通(但不一定有直接的公路相连,只要能间接通过公路可达即可),并要求铺设的公路总长度为最小。请计算最小的公路总长度。
或者
省*“畅通工程”的目标是使全省任何两个村庄间都可以实现公路交通(但不一定有直接的公路相连,只要能间接通过公路可达即可)。经过调查评估,得到的统计表中列出了有可能建设公路的若干条道路的成本。现请你编写程序,计算出全省畅通需要的最低成本。
dijkstra
dijkstra要求所有点边的权值都是非负的,主要是如果出现负权边,可能会出现负权环,dijkstra就无法应付了。
关于dijkstra的小故事
这个人名真不好记,所以我一直把它读作disco,对不住迪科斯彻爹爹。
dijkstra算法中设置了一个顶点集合S,从源点到集合中的顶点的最终最短路径的权值均已经确定。dijkstra过程反复从V-S(V即图的顶点集)中选择一个顶点v,使得d(s,v)为最短,并将v加入到集合S中,接着对v的所有边进行松弛。
什么是松弛?
就是可能会出现这样的情况,假设源点为s,tab(u,v)为顶点u到顶点v的权值,dist(u)为迄今为止找到的s到u最短路径。在松弛(u,v)的过程中,要测试是否可以通过u,对迄今为止找到的v的最短路径进行改进。也就是可能会出现dist(v)>dist(u)+tab(u,v)的情况。
上面的图因为dist(v)>dist(u)+tab(u,v)即6>2+3,故要对边(u,v)进行松弛的时候会将dist(v)从 6更正为5。但对于下面的情况,在松弛过后,dist(v)没有改变因为dist(v)<=dist(u)+tab(u,v)即4& lt;=2+3。
松弛技术在Bellman-Ford负权回路探测算法中也有应用。不禁想起还小的一个作为题:两点之间曲线更短…
dijkstra的过程
初始将顶点s加入到S中,并更新s到其他顶点的路径权值。
- 选择最短路径dist(s,t),并将t加入到S中。
- 在第一步中得到t,对于u∈V-S,松弛边(t,v)。
重复上述过程,直到所有的顶点都被加入到集合S中为止。
可以给出伪代码:
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
|
// 初始化 for i=[0,n)
dist[i] = tab[0][i]
visit[0] = true ;
for i=[1,n)
// 寻找最短路径(s,t),同时把t加入S集合
min = MAX_VALUE
for j=[0,n)
if !visit[j] && dist[j]<min
min = dist[j]
visit[j] = true
// 松弛边(t,v),其中v为顶点
for k=[0,n)
if !visit[k] && dist[k]>dist[j]+tab[j][k]
dist[k] = dist[j]+tab[j][k]
|
简单的dijkstra应用:
某省自从实行了很多年的畅通工程计划后,终于修建了很多路。不过路多了也不好,每次要从一个城镇到另一个城镇时,都有许多种道路方案可以选择,而某些方案要比另一些方案行走的距离要短很多。这让行人很困扰。
现在,已知起点和终点,请你计算出要从起点到终点,最短需要行走多少距离。
总结
prim,kruskal和dijkstra算法有贪心策略,他们贪在哪啊?
- prim:每次执行都选择轻边
- kruskal:每次执行都选择权值最小的边,同时合并两个不相交的子集
- dijkstra:每次执行都选择路径最短d(s,t),并将顶点t加入到集合S中,同时对边进行松弛