文件名称:word2vecjava版源码-LFTM:使用词嵌入改进主题模型LDA和DMM(短文本的每文档一个主题模型)(TACL2015)
文件大小:7.25MB
文件格式:ZIP
更新时间:2024-06-25 15:47:22
系统开源
word2vec java版源码LF-LDA 和 LF-DMM 潜在特征主题模型 LF-LDA 和 LF-DMM 潜在特征主题模型的实现,如我的 TACL 论文中所述: Dat Quoc Nguyen、Richard Billingsley、Lan Du 和 Mark Johnson。 . 计算语言学协会汇刊,卷。 3,第 299-313 页,2015 年。 LDA 和 DMM 主题模型的实现可在 用法 本节使用预编译的LFTM.jar文件描述命令行或终端中实现的用法。 在这里,预计 Java 1.7+ 已经设置为在命令行或终端中运行(例如:在 Windows 操作系统中将 Java 添加到path环境变量中)。 预编译的LFTM.jar文件和源代码分别位于jar和src文件夹中。 用户可以通过简单地运行ant重新编译源代码(也期望已经安装了ant )。 此外,用户可以在test文件夹中找到输入示例。 输入主题建模语料库的文件格式 与test文件夹中的corpus.txt文件类似,输入的主题建模语料库中的每一行代表一个文档。 这里,文档是由空格字符分隔的序列词/标记。 用户在训练主题模
【文件预览】:
LFTM-master
----README.md(11KB)
----test()
--------corpus.LABEL(3KB)
--------corpus_test.txt(7KB)
--------corpus.txt(13KB)
--------wordVectors.txt(12.54MB)
----License.txt(813B)
----src()
--------LFTM.java(3KB)
--------eval()
--------utility()
--------models()
----jar()
--------LFTM.jar(2.11MB)
----lib()
--------mallet.jar(2.03MB)
--------args4j-2.0.6.jar(35KB)
----build.xml(2KB)