文件名称:topic-modeling:该项目在使用Java和C的Hadoop MapReduce和MPI等并行计算框架上,使用潜在Dirichlet分配(LDA)算法评估主题建模的性能
文件大小:18KB
文件格式:ZIP
更新时间:2024-06-17 04:37:19
Java
主题建模 该项目在使用Java和C的Hadoop MapReduce和MPI等并行计算框架上,使用潜在Dirichlet分配(LDA)算法评估主题建模的性能。
【文件预览】:
topic-modeling-master
----WordGen.java(3KB)
----start.sh(511B)
----DocTopicDistGenerator.java(3KB)
----hinput.txt(152B)
----nonalpha.txt(102B)
----stopwords.txt(4KB)
----LdaGibbsSampler.java(16KB)
----Naive.java(4KB)
----HTopicModel.java(4KB)
----NaiveMerger.java(1KB)
----README.md(209B)
----MTopicModel.java(4KB)
----TopicModel.java(2KB)
----StopWordRemoval.java(2KB)
----SA2S.java(593B)
----part-00000(84B)