文件名称:经典聚类算法与Girvan-Newman算法在社交网络中寻找社区的比较分析-研究论文
文件大小:419KB
文件格式:PDF
更新时间:2024-06-30 07:07:38
data mining datasets
如今,在大型社交网络数据集中寻找模式是一项日益严峻的挑战,也是一个重要的课题。 该领域当前的问题之一是识别具有大量节点的社交网络中的集群。 社交网络集群不一定是不相交的集合; 相反,它们可能重叠并具有公共节点,在这种情况下,将它们指定为社区更为合适。 尽管许多聚类算法可以很好地处理小数据集,但它们在大数据集上通常效率极低。 本文展示了常用的经典图聚类算法和著名的用于识别图中社区的 Girvan-Newman 算法的比较分析,该算法特别针对大型数据集进行了优化。 这篇论文的目标是展示哪些算法在给定的数据集上表现最好。 本文介绍了数据聚类的实际问题、可用于其解决方案的算法、分析方法、取得的结果和得出的结论。