文件名称:PLSA:概率潜在语义分析模型PLSAPLSI的Java包
文件大小:7.68MB
文件格式:ZIP
更新时间:2024-06-05 07:44:43
topic-modeling Java
jPLSA:PLSA / PLSI模型的Java软件包
本节使用名为jPLSA.jar的预编译文件描述了命令行或终端中jPLSA.jar 。 在这里,假定Java已经设置为在命令行或终端中运行(例如,将Java添加到Windows OS中的环境变量path中)。
用户可以分别在文件夹jar和src找到预编译的文件jPLSA.jar和源代码。 用户可以通过简单地运行ant来重新编译源代码(也应该已经安装了ant )。
输入语料库的文件格式:与data文件夹中的文件corpus.txt相似,jPLSA假定输入语料库中的每一行都代表一个文档。 在此,文档是由空格字符分隔的单词/标记序列。
现在,我们可以通过执行以下命令来训练PLSA / PLSI:
$ java -jar jar/jPLSA.jar -corpus
【文件预览】:
PLSA-master
----License.md(563B)
----libs()
--------mallet.jar(2.03MB)
--------commons-math3-3.3.jar(1.86MB)
--------commons-io-2.4.jar(181KB)
--------args4j-2.0.6.jar(35KB)
----Readme.md(1KB)
----src()
--------PLSA.java(12KB)
--------CmdArgs.java(501B)
--------FuncUtils.java(3KB)
--------MTRandom.java(929B)
----jar()
--------jPLSA.jar(4.1MB)
----data()
--------corpus.txt(426KB)
----build.xml(2KB)