TweetAnalysis:使用分布式聚类算法分析推文的存储库

时间:2024-08-01 08:39:01
【文件属性】:

文件名称:TweetAnalysis:使用分布式聚类算法分析推文的存储库

文件大小:3.1MB

文件格式:ZIP

更新时间:2024-08-01 08:39:01

Java

自述文件 硕士论文项目,为了运行,需要启动json格式的dataset,或者一个带有DocumentID,DocumentText的序列文件 要考虑的类在 src/com/luca/filipponi/tweetAnalysis 中: TextualClustering.java,在作为输入提供的数据集上执行指定 k 的集群 Main.java,在作为输入提供的数据集上执行从 k=2 到 k=20 的集群 为了评估结果,该类位于 src/com/luca/filipponi/tweetAnalysis/ClusterEvaluator: ClusterEvaluator.java 用于查看热门词、热门推文、与每个集群的距离以及不同时间窗口上的集群组成,对于时间寡妇部分需要一个 mySql db 连接或将无法工作。 TokenEvaluator.java 用于评估令牌质量。


网友评论