文件名称:BTM算法java实现 主题建模
文件大小:13KB
文件格式:JAVA
更新时间:2019-12-04 07:42:44
BTM 主题建模 算法 实现 java
A Biterm Topic Model for Short Texts提出了一个较为新颖的思路。试想我们人眼分辨短文本的过程,我们并不是孤立的看每个词是否出现,而是要关注,是否某些词一起出现了。这个特征更强,所以区别性也更高。A Biterm Topic Model for Short Texts提出的模型BTM类似如此。他用一个窗口在文档内滑动(如果文本太短,或许就只有窗口了),然后将窗口内的两个词作为一个共现词对,每个词对的生成过程是从全局的主题分布中取一个词,然后从主题-词分布取两个词。