1. 准备网络图
在本入门中,将使用Cora数据集进行学习,Cora数据集由机器学习论文组成,是近年来图深度学习很喜欢使用的数据集。
下载地址:https://linqs.soe.ucsc.edu/data
也可以在github的源码中训练得出:https://github.com/tkipf/gcn
为了实现快速入门,节省大家的时间,本快速入门也准备好了处理之后的Cora数据集,供大家下载学习。
下载地址:https://download.csdn.net/download/weixin_46348799/12745826
压缩包文件中有:
- cora_Nodes.csv:节点表格
- cora_Edges.csv:边表格
- cora_Matrix.csv:邻接矩阵
2. 导入网络图
2.1 使用【节点表格+边表格】导入
节点表格存储有节点的id和label,边表格存储有节点与节点之间的连线。本文均使用csv格式导入。
打开gephi,【文件】→【打开】→【cora_Nodes.csv】→【下一步】→【完成】→【确定】
这时,已经将节点表格导入成功。图上只显示出了节点,没有显示边。
接下来导入边表格。
【文件】→【打开】→【cora_Edges.csv】→【下一步】→【完成】→【确定】
这时候,图中就有节点和边了。
2.2 使用【节点表格+邻接矩阵】导入
除了使用上述方法以外,更常用的为使用【节点表格+邻接矩阵】的方式导入网络图
导入节点表格的步骤和上述相同。
首先,需要导入邻接矩阵。
注意 : 邻接矩阵需要标出点的id,如下图所示
打开gephi,【文件】→【打开】→【cora_Matrix.csv】→【下一步】→【完成】→【确定】
这时候,图中就有节点和边了。
但是这个时候的节点的label将会是1~2708,而非我们所标记的label,因此需要导入节点表格,覆盖标签
【文件】→【打开】→【cora_Nodes.csv】→【下一步】→【完成】→【确定】
至此,已成功导入网络图