网络数据的可视化
网络图的可视化是图形绘制或者图形可视化领域的重点。这些技术试图将数学、人类和算法的元素结合起来。在简要描述了图形的基本元素后,我们将尝试更加复杂的图布局。
图元素的可视化
假如我们有一组网络测量数据,他们被编码在一个网络图G上。现在我们希望用可视化的技术来展示G。图形可视化的核心是如何通过几何表示。当然如果一个图是画在二维空间,我们理解得更加方便,但事实上,更常见的状况会是高维空间或者是一些更抽象的空间。
原则上,一个人可以简单地以随机的方式在给定的区域里放置顶点,然后在这些顶点之间画线。但不幸的是,尽管这样很简单,但看上去会非常混乱。所以为了改进自动绘图,各种规格和要求被正式作为绘制规则、美学和约束的标志。
从实用的角度看,绘制绘制规则、美学和约束有效的定义了自动绘制方法的参数。除此之外,开发一种计算效率的算法是非常重要的,这种算法寻求一种近似解,通常是通过启发式在符合美学的要求下进行优先排序。
图的布局
我们用r语言自带的aidsblog数据集做例子。这个数据集是关于艾滋病、患者和网络上146个博客相互引用关系集合。下面两张图是不同布局呈现的效果。我们可以看到网格的定义是高度统一的,他确保了各个顶点间的连接性,而网络博客不是。
很显然,网格的可视化比博客网络的视觉效果更令人满意,主要是边缘更加美观整洁。对这种类型的布局来说,围绕圆形的顶点排序是非常重要的。如果是随机排序,则容易出现博客网络的情况。图形布局的常见顶点排序包括按程度排序和按公共顶点属性分组。
其他一些布局:
树状布局:
有向图的布局
虽然顶点的相对位置和它们之间的边缘位置在可视化网络图中是很重要的,但是在可食用的情况下,附加的网络信息可以通过不同的特征(比如顶点的大小、形状和颜色)来整合到可视化中。特别是,这些技术允许可视化图形装饰。
比如说,Zachary的空手道俱乐部网络图。该网络可用的属性信息包括校长和管理员的身份识别,两个派系中会员之间的互动频率。
上面的两张图描述的是同一个数据。第一个没有任何修饰,第二个图中显示了大量的附加信息,顶点所在位置大小的比例表示加权的权重,用边的厚度表示交互频率,不同的形状表示不同的派系*。用颜色来区分会员等等,非常直观。
大型网络图的可视化
接下来我们尝试一些大型网络图的可视化。
这里我们选的数据集是一个关于法国政党选举的。
party.names
[1] ” Cap21”
[2] ” Commentateurs Analystes”
[3] ” Les Verts”
[4] ” liberaux”
[5] ” Parti Radical de Gauche”
[6] ” PCF - LCR”
[7] ” PS”
[8] ” UDF”
[9] ” UMP”
这是各个选区的投票情况,上看两张图分别使用Kamada-Kawai算法和DrL算法得出的结果。
经过修饰,我们得到了一张更加直观的图。