文件名称:java源码包-LDAGibbsSampling:用于LDA的Gibbs采样的开源软件包
文件大小:512KB
文件格式:ZIP
更新时间:2024-06-13 13:20:05
系统开源
java原始包LDAGibbs采样 / ** SMU Text Mining Group /新加坡管理大学/北京大学版权所有(C)2013 LDAGibbsSampling出于研究目的而分发,但不作任何担保; 甚至没有对适销性或特定用途适用性的暗示保证。 如果发现包装中有任何问题,请随时与以下人员联系。 2016年10月10日更新。* * / 简单的介绍 这是LDA的Gibbs采样的开源实现。 数据集是Newsgroup-18828,它包含在项目中。 您可以使用它测试其他数据集。 只需将项目导入Eclipse并运行LdaGibbsSampling.java即可启动它,而无需进行任何配置。 示例原始文档和示例输出文件已包括在内。 要下载整个Newsgroup-18828数据集,请参考。 输出文件的格式 lda_n.params:LDA模型的超参数。 lda_n.phi:一个K * V矩阵,这是最小的主题词分布。 lda_n.tassign:当进行n次迭代时,每个文档中每个单词的主题分配。 lda_n.theta:M * K矩阵,这是学习到的文档主题分布。 lda_n.twords:最热门