【文件属性】:
文件名称:Mr.LDA:在MapReduce中使用变分推理的可扩展主题建模
文件大小:185KB
文件格式:ZIP
更新时间:2021-05-01 11:23:08
Java
拉达先生
Mr.LDA是一个开源软件包,用于在MapReduce中使用变分推理进行灵活,可扩展的多语言主题建模。 有关更多详细信息,请查阅。 最新版本的代码始终可以在上。
请将任何错误报告或问题发送给Ke Zhai( )。
入门
克隆仓库:
$ git clone git@github.com:lintool/Mr.LDA.git
然后使用标准调用进行构建:
$ mvn clean package
如果要设置Eclipse环境,请执行以下操作:
$ mvn eclipse:clean
$ mvn eclipse:eclipse
语料库准备
美联社的一些样本数据可以在这个找到。 这与使用的示例数据相同。
该回购包含一个Python脚本,用于将语料库解析为Mr.LDA使用的格式。 脚本的输出存储在ap-sample.txt.gz 。 这是您要加载到HDFS中的数据文件。
LDA先
【文件预览】:
Mr.LDA-master
----pom.xml(4KB)
----docs()
--------assets()
--------js()
--------stylesheets()
----index.html(3KB)
----.settings()
--------org.eclipse.jdt.ui.prefs(86B)
--------org.eclipse.jdt.core.prefs(21KB)
----src()
--------test()
--------main()
----.gitignore(72B)
----README.md(18KB)
----LICENSE.txt(11KB)