求图的最小生成树

上一小节讨论了一些图的基本概念。其中提到，如果有两幅图G=(V,E)，G'=(V',E')，如果V'∈V,E'∈E，则称G'是G的子图。如果V'=V，且E'∈E（即顶点不少，边少了几条），那么G'是G的生成子图。特别的，如果生成子图是一棵树，即满足定点数 = 边树+1，那么这棵树称为生成树。
最小生成树的概念是基于“带权图”的。即图中每条边上都有特定的权值，这样的图又称为网。最小生成树指的是所有生成树中，权值之和最小的树。
当然，这个概念绝非数学家们自己胡思乱想出来的，它能对很多实际的问题建模：比如有A，B，C，D，E，F，6个地方。我们需要修路让他们之间可以相互连通。但是各个节点之间修路的花费可能不一样，n个地方如果两两相通，一共有n(n-1)/2条路，我们想在其中找出n-1条，让它们的花费最小。那么如何选择出这n-1条路径呢？有两种经典的算法Kruskal算法和Prim算法。

先看定义的一些基本的数据结构（总体上跟图的差不多）

#include <stdio.h>
#include <limits.h>
#include <malloc.h>
#define MAX 10
//带权图的基本数据结构
typedef int** adjacentMatrix;

typedef struct WeightedGraph
{
	adjacentMatrix matrix;
	char* vertex;
	int vertexNumber;
	int arcNumber;
}wGraph;

//基本操作声明
//初始化图
wGraph initWgraph(int );
//销毁图
void destroyWgraph(wGraph*);
//增加一条边
bool addArc(wGraph* ,char ,char ,int );
//删除一条边
bool deleteArc(wGraph* ,char ,char );
//显示邻接矩阵
void printfWgraph(wGraph* );

//Kruskal算法相关函数
int findMiniWeightArc(wGraph* ,char*,char*);
void do_dfs(wGraph* ,int );
bool is_loop(wGraph* );
void Kruskal(wGraph* ,wGraph* );

Kruskal算法的基本思路如下：
1.将图的边集合按照权值大小排序（可选）。
2.从E中挑出一个权值最小的边e，权值为we
3.将e加入到生成树的边的集合T中。
4.加入e之后判断T是否形成回路
5.若T的边数<n-1，则转2，否则退出

程序如下：

wGraph initWgraph(int n)
{
	wGraph g;
	g.vertexNumber = n;
	g.arcNumber = 0;
	g.vertex = (char*)malloc(sizeof(char) * n);
	char start = 'A';
	for(int i = 0; i < n;++i)
		g.vertex[i] = start + i;

	g.matrix = (int**)malloc(sizeof(int*) * n);
	for(int i = 0; i < n;++i)
		g.matrix[i] = (int*)malloc(sizeof(int) * n);
	//邻接矩阵的初始为为最大值
	for(int i = 0; i < n;++i)
		for(int j = 0; j < n;++j)
			g.matrix[i][j] = INT_MAX;
	return g;
}

void destroyWgraph(wGraph* g)
{

	free(g->vertex);
	g->vertex = NULL;
	for(int i = 0; i < g->vertexNumber;++i)
		free(g->matrix[i]);
	free(g->matrix);
	g->matrix = NULL;
	g->arcNumber = -1;
	g->vertexNumber = -1;
}

bool addArc(wGraph* g,char vertex1,char vertex2,int weight)
{
	int i = vertex1 - 'A';
	int j = vertex2 - 'A';
	if(i < 0 || i > g->vertexNumber || j < 0 || j > g->vertexNumber)
	{
		printf("vertexes does not exsist!\n");
		return false;
	}
	else
	{
		g->matrix[i][j] = g->matrix[j][i] = weight;	
		g->arcNumber++;
		return true;
	}

}

bool deleteArc(wGraph* g,char vertex1,char vertex2)
{
	int i = vertex1 - 'A';
	int j = vertex2 - 'A';
	if(i < 0 || i > g->vertexNumber || j < 0 || j > g->vertexNumber)
	{
		printf("vertexes does not exsist!\n");
		return false;
	}
	if(INT_MAX == g->matrix[i][j] )
	{
		printf("there is no arc between vertexes!\n");
		return false;
	}
	else
	{
		g->matrix[i][j] = INT_MAX;
		g->matrix[j][i] = INT_MAX;
		g->arcNumber--;
		return true;
	}
}

void printfWgraph(wGraph* g)
{
	printf("     ");
	for(int i = 0 ; i < g->vertexNumber;++i)
		printf("%-4c ",g->vertex[i]);

	for(int i = 0; i < g->vertexNumber;++i)
	{
		printf("\n");
		printf("%-4c ",g->vertex[i]);
		for(int j = 0; j < g->vertexNumber;++j)
		{
			if(INT_MAX == g->matrix[i][j]  )
				printf("NULL ");
			else
				printf("%-4d ",g->matrix[i][j]);
		}

	}
	printf("\n");
}
//找完以后需要打上标记，否则下一次还会找他
int findMiniWeightArc(wGraph* g,char *vertex1,char *vertex2)
{
	int miniWeight = INT_MAX;
	int vex1;
	int vex2;
	for(int i = 0; i < g->vertexNumber;++i)
	{
		for(int j = 0; j< g->vertexNumber;++j)
		{
//			printf("测试边%c%c，它的权值为%d\n",g->vertex[i],g->vertex[j],g->matrix[i][j]);
			if(g->matrix[i][j] < miniWeight && g->matrix[j][i] < miniWeight && g->matrix[i][j] != -1 && g->matrix[j][i] != -1)
			{
				miniWeight = g->matrix[i][j];
				vex1 = i;
				vex2 = j;
			}
		}
	}
	//打上标记
	g->matrix[vex1][vex2] = -1;
	g->matrix[vex2][vex1] = -1;
	*vertex1 = 'A' + vex1;
	*vertex2 = 'A' + vex2;
	return miniWeight;
}

//判断加入以后是否形成回路
//visit1表明该节点是否被访问过
bool visit1[MAX];
//visit2表明该节点在这次搜索中是否被访问过
bool visit2[MAX][MAX];
bool LOOP = false;

void do_dfs(wGraph* g,int i)
{
	visit1[i] = true;

	for(int j = 0; j < g->vertexNumber;++j)
	{
		//对当前节点，挑选可以访问的节点
		if(INT_MAX != g->matrix[i][j])
		{
			//如果这个次访问为回溯，则跳过这个节点
			if(visit2[i][j] == true)
				continue;
			else
			{
				if(visit1[j] == false)
				{
					visit2[i][j] = true;
					visit2[j][i] = true;
					do_dfs(g,j);
				}
				else
					LOOP = true;

			}
		}

	}
}

bool is_loop(wGraph* g)
{
	//重置LOOP
	LOOP = false;
	//

	for(int i = 0; i < g->vertexNumber;++i)
	{
		visit1[i] = false;

	}
	for(int i = 0; i < g->vertexNumber;++i)
	{
		for(int j = 0; j < g->vertexNumber;++j)
		{
			visit2[i][j] = false;
		}
	}
	for(int i = 0; i < g->vertexNumber;++i)
	{
		if(false == visit1[i])
			do_dfs(g,i);
	}

	return LOOP;
}

void Kruskal(wGraph* g,wGraph* tree)
{	
	//先初始化树
	*tree = initWgraph(g->vertexNumber);
	while(tree->arcNumber < g->vertexNumber-1)
	{
		char vertex1;
		char vertex2;
		int weight = findMiniWeightArc(g,&vertex1,&vertex2);
		addArc(tree,vertex1,vertex2,weight);
		if(is_loop(tree) == true)
		{
			printf("被删除的边为：%c,%c\n",vertex1,vertex2);
			deleteArc(tree,vertex1,vertex2);

		}
		else
			printf("挑出来的边为：%c,%c\n",vertex1,vertex2);
//		printfWgraph(tree);
	}
}

再看Prim算法：
1.设顶点集合为V，从V中任取一个顶点，加入U中，并将这个节点从V中删去。
2.在U与V构成的所有边中，选择一个权值最小的，加入树的边集合E
3.将边E的另一个节点vx也加入集合U中。
4.若V不为空，则转2

//Prim算法相关的函数
void selectMiniWeightArc(wGraph* g,bool* u,bool* v,int* indexV,int* indexU);
void Prim(wGraph* g,wGraph* t,char Start);

void Prim(wGraph* g,wGraph* t,char Start)
{

	//将t初始化
	*t = initWgraph(g->vertexNumber);
	bool *V  = (bool*)malloc(sizeof(bool) * g->vertexNumber);
	//V集合初始值为true表示这个集合里的元素都可用，false表示集合中元素被删掉了
	for(int i = 0; i < g->vertexNumber;++i)
		V[i] = true;
	int cnt = g->vertexNumber; 
	bool *U = (bool*)malloc(sizeof(bool) * g->vertexNumber);
	//U集合初始值为false，表明这个集合中还没有任何元素，true表示这个元素可用
	for(int i = 0; i < g->vertexNumber;++i)
		U[i] = false;
	//每次从V中选中一个元素，则把它的V[i]设为false,把U[i]设为true
	int start = Start-'A';
	V[start] = false;
	--cnt;
	U[start] = true;
	while(cnt >0)
	{
		int indexV;
		int indexU;
		//在U与V-U中寻找权值最小的边
		selectMiniWeightArc(g,U,V,&indexV,&indexU);
		char vertex1 = indexV+'A';
		char vertex2 = indexU+'A';
//		printf("挑出V中的节点%c，U中的节点%c\n",vertex1,vertex2);
		addArc(t,vertex1,vertex2,g->matrix[indexV][indexU]);
		V[indexU] = false;
		U[indexU] = true;
		--cnt;

	}
	free(U);
	free(V);
}


void selectMiniWeightArc(wGraph* g,bool* u,bool* v,int* indexV,int* indexU)
{
	int min = INT_MAX;
	//打印一下两个数组的现状
	printf("V:");
	for(int i = 0; i < g->vertexNumber;++i)
		printf("V[%d] = %d  ",i,v[i]);
	printf("\n");
	printf("U:");
	for(int i = 0; i < g->vertexNumber;++i)
		printf("U[%d] = %d  ",i,u[i]);
	printf("\n");
	//遍历整个图
	for(int i = 0; i < g->vertexNumber;++i)
	{
		for(int j = 0; j < g->vertexNumber;++j)
		{
			//i是V中的，j是U中的
			if(false == v[i] && true == u[i] && true == v[j] && false == u[j])		

			{
				if(g->matrix[i][j] < min)
				{
					min = g->matrix[i][j];
					*indexV = i;
					*indexU = j;
				}
			}
		}
	}
}

程序中需要注意，当两个顶点不连通是，我对他们之间的权值设置为INT_MAX，但是在打印时，为了好看一点，显示NULL。具体的算法程序是严格按照算法的步骤写的，基本没有什么花架子。唯一需要说明的是，在Kruskal算法中，需要检测是否形成回路回路，这个问题可让我费了一番周折。因为没有学过离散数学，所以也没有用什么好的办法，而是用了一个比较朴素的办法：深度优先遍历整个图：从A找到C以后，把A->C与C->A的两条路都标记了起来。然后继续向下查找，如果最后能找回来，则说明有回路。

具体的查找过程可以通过注释起来的打印信息看出来，这里就不罗嗦了。

最后简单的比较这两种算法：Prim算法使用的数据结构稍微有点复杂，用两个数组记录了顶点是否被使用过，但是它很好地避免了回路检测这个问题；而Kruskal算法则上手比较容易，更符合我们的基本思维，但是回路检测过程却效率低下（这也与我的回路检测算法有关）。总体上来说，Prim算法跟胜一筹。

秒客网

求图的最小生成树

相关文章