word2vecjava版源码-STTM:短文本主题建模,JAVA

时间:2024-06-25 15:59:29
【文件属性】:

文件名称:word2vecjava版源码-STTM:短文本主题建模,JAVA

文件大小:5.42MB

文件格式:ZIP

更新时间:2024-06-25 15:59:29

系统开源

word2vec java版源码STTM:短文本主题建模库 这是一个基于Java(Version=1.8)的用于短文本主题建模算法的开源库。 该库旨在促进短文本主题建模算法的开发,并在新模型和现有模型之间进行比较。 STTM 在 . STTM 由(中国扬州)维护。 目录 算法 短文本主题模型:KDD2014会议上的Dirichlet Multinomial Mixture(),TKDE2016上的Biterm Topic Model(),KAIS2018上的Word Network Topic Model(),KDD2016上的Pseudo-Document-Based Topic Model(),Self-Aggregation-基于 IJCAI2015 会议中的主题模型 ()、PAKDD2017 会议中的 ()、SIGIR2016 会议中基于广义 P´olya Urn (GPU) 的狄利克雷多项式混合模型 ()、基于泊松的广义 P´olya Urn (GPU) 狄利克雷多项式混合模型 ()在期刊 TIS2017 中和在期刊 TACL2015 中使用 DMM () 的潜在特征模型。


【文件预览】:
STTM-master
----jar()
--------STTM.jar(2.3MB)
--------readme(1B)
----dataset()
--------GoogleNews_LABEL.txt(33KB)
--------SearchSnippets_label.txt(24KB)
--------Pascal_Flickr_LABEL.txt(12KB)
--------*_label.txt(41KB)
--------Tweet.txt(143KB)
--------GoogleNews.txt(464KB)
--------Pascal_Flickr.txt(172KB)
--------Biomedical_label.txt(48KB)
--------corpus.txt(13KB)
--------Tweet_LABEL.txt(7KB)
--------Biomedical.txt(1.22MB)
--------corpus.LABEL(3KB)
--------*.txt(585KB)
--------SearchSnippets.txt(1.35MB)
----src()
--------eval()
--------models()
--------de()
--------STTM.java(7KB)
--------utility()
----run.sh(434B)
----lib()
--------args4j-2.0.6.jar(35KB)
--------mallet.jar(2.03MB)
----README.md(13KB)
----process_wiki.py(1006B)
----Architecture.png(96KB)

网友评论