【文件属性】:
文件名称:ScaCTM:相关主题模型的可扩展推理
文件大小:292KB
文件格式:ZIP
更新时间:2021-06-20 21:31:09
C++
相关主题模型的可扩展推理 (ScaCTM)
介绍
是文本或其他离散数据的主题模型,用于对文档中不同主题出现之间的相关性进行建模(图 1)。
ScaCTM 是从数百万个文档中学习数千个主题的相关主题模型的软件,使用数十台机器。
图 1. 相关主题模型。 (蓝色等宽:输出文件名,黑色等宽:输入参数名)
生成模型描述如下。
下面是一些语料库上 ScaCTM 的速度。 有关更多详细信息,请参阅我们的。
语料库
文件数量
主题数
时间
国家知识产权局
1.2K
100
8.9 分钟
20NG
11K
200
9 分钟
纽约时报
285K
400
0.5 小时
维基
6M
1000
17 小时
安装
假设您已经安装了 BLAS 和 LAPACK,要构建 ScaCTM,只需执行
git clone --recursive http://github.com/cjf00000