ScaCTM:相关主题模型的可扩展推理

时间:2021-06-20 21:31:09
【文件属性】:
文件名称:ScaCTM:相关主题模型的可扩展推理
文件大小:292KB
文件格式:ZIP
更新时间:2021-06-20 21:31:09
C++ 相关主题模型的可扩展推理 (ScaCTM) 介绍 是文本或其他离散数据的主题模型,用于对文档中不同主题出现之间的相关性进行建模(图 1)。 ScaCTM 是从数百万个文档中学习数千个主题的相关主题模型的软件,使用数十台机器。 图 1. 相关主题模型。 (蓝色等宽:输出文件名,黑色等宽:输入参数名) 生成模型描述如下。 下面是一些语料库上 ScaCTM 的速度。 有关更多详细信息,请参阅我们的。 语料库 文件数量 主题数 时间 国家知识产权局 1.2K 100 8.9 分钟 20NG 11K 200 9 分钟 纽约时报 285K 400 0.5 小时 维基 6M 1000 17 小时 安装 假设您已经安装了 BLAS 和 LAPACK,要构建 ScaCTM,只需执行 git clone --recursive http://github.com/cjf00000

网友评论