TweetAnalysis:使用分布式聚类算法分析推文的存储库

时间:2021-07-12 14:52:21
【文件属性】:
文件名称:TweetAnalysis:使用分布式聚类算法分析推文的存储库
文件大小:3.1MB
文件格式:ZIP
更新时间:2021-07-12 14:52:21
Java 自述文件 硕士论文项目,为了运行,需要启动json格式的dataset,或者一个带有DocumentID,DocumentText的序列文件 要考虑的类在 src/com/luca/filipponi/tweetAnalysis 中: TextualClustering.java,在作为输入提供的数据集上执行指定 k 的集群 Main.java,在作为输入提供的数据集上执行从 k=2 到 k=20 的集群 为了评估结果,该类位于 src/com/luca/filipponi/tweetAnalysis/ClusterEvaluator: ClusterEvaluator.java 用于查看热门词、热门推文、与每个集群的距离以及不同时间窗口上的集群组成,对于时间寡妇部分需要一个 mySql db 连接或将无法工作。 TokenEvaluator.java 用于评估令牌质量。

网友评论