gephi是一个数据可视化处理软件,其中有很多对数据分析的统计算法,对于很多数据分析算法都有实现,那么就来看看其中的一些统计方法:
1. degree (平均度)
计算每个节点的度,并统计相同度的节点数量
平均度: 有向图: 所有点的度数总和/节点数*2 无向图: 所有点的度数总和/节点数
在图上能够,看出每个度所占的百分比,能够看到每种度用不同颜色标示
通过这个可以看出哪些节点的度高,反应出连接他的点就多,就越关键
2. weightedDegree 平均加权度
加权入度 加权出度 加权度
有向图: 取得每个点的边,如果该边的源为该节点,那么该边的权重为加权出度,反之亦然。计算出每个点的加权出度,入度和度
其实平均度是平均加权度的一个特例,平均度的每条边的权重为1
加权度为加权出度和入度的总和
计算同样入度出度的节点个数
无向图: 取得每个点的边,将边的权重求和,即为该点的加权度
平均加权度: 有向图:加权度总和/2*节点数 无向图: 加权度总和/节点数
3. GraphDistance 网络直径
后续补充
4. graphdensity 图密度
无向图: 边数*2 / (节点数*节点数-节点数)
有向图: 边数 / (节点数*节点数-节点数)
大概理解: (节点数*节点数-节点数) 这个计算出最多的连接边数(不包含连自己) , 用实际边数除以最大可能边数,即为密度, 结果越大表示图中节点连接越紧密
5. hits(
Hyperlink-Induced Topic Search) 分析经典的基于超链接分析的主题搜索 点击次数
计算2个值
authority: 每个节点入度的比值。 简单的,就是总的节点的入度和,除以该节点入度和,提现节点重要性,或者页面的重要性,被链接的多,说明入度多,就跟重要
计算每个引入(指向该节点)该节点(有入度的节点)的节点的hub(初始为1)总和,用该值除以所有点的authority值
hub:
计算每个引入(指向该节点)该节点(有出度的节点)的节点的 authority (初始为1)总和,用该值除以所有点的 hub 值
6. modularity 模块化
一种聚类算法,后续补充。。。