LDA(文档主题模型)时间:2023-03-09 19:28:48 LSA latent semantic analysis 映射词-文档到一个低维隐语义空间 比较词和文档在低纬空间的相似性 topic 是 Vocab 上的概率分布(符合多项式分布) 文档到主题的一个分布,主题到词库的分布,通过训练得到这两个分布模型 plsa 模型 LDA模型 大规模LDA系统 spark LDA Google PLDA 微软LightLDA 腾讯LDA,PEACOCK