文件名称:OnlineBTM:在线 Biterm 主题模型代码(发布于 TKDE2014)
文件大小:10.99MB
文件格式:ZIP
更新时间:2024-07-21 11:51:10
C++
在线Biterm主题模型代码 该包包含两种用于 Biterm 主题模型 (BTM) 的在线算法:在线 BTM (oBTM) 和增量 BTM (iBTM)。 oBTM 通过使用足够的统计量作为 Dirichlet 先验来拟合时间片中的单个 BTM; iBTM 使用增量 Gibbs 采样器在双项流上训练单个模型。 更详细的可以参考以下论文: 程雪琪、闫晓慧、蓝燕燕、郭家峰。 BTM:基于短文本的主题建模。 TKDE,2014 年。 用法 该代码包含一个可运行的示例,您可以通过以下方式运行它: $ script/runExample.sh 它在sample-data/0.txt, 1.txt, ... 中的文档上训练 BTM 并输出主题。 n.txt包含时间片(应该是天) n中的训练文档,其中每一行代表一个文档,单词以空格分隔,如下所示: word1 word2 word3 ...
【文件预览】:
OnlineBTM-master
----output()
--------voca.txt(622KB)
--------model()
--------doc_wids()
----src()
--------pmat.h(7KB)
--------obtm.h(1KB)
--------obtm.cpp(4KB)
--------ibtm.h(1KB)
--------sampler.h(1KB)
--------biterm.h(667B)
--------main.cpp(1KB)
--------str_util.h(1KB)
--------infer.h(900B)
--------Makefile(345B)
--------infer.cpp(4KB)
--------doc.h(811B)
--------ibtm.cpp(4KB)
--------pvec.h(6KB)
----script()
--------indexDocs.py(1KB)
--------runExample.sh(1KB)
--------topicDisplay.py(2KB)
----README.md(4KB)
----sample-data()
--------0.txt(913KB)
--------2.txt(943KB)
--------1.txt(919KB)