文件名称:基于LDA主题特征的自动文摘方法
文件大小:274KB
文件格式:PDF
更新时间:2016-01-17 16:29:42
LDA
近年来概率主题模型受到了研究者的广泛关注,LDA( Latent Dirichlet Allocation) 模型是主题模型中具有代表性的概率生 成模型之一,它能够检测文本的隐含主题。提出一个基于LDA 模型的主题特征,该特征计算文档的主题分布与句子主题分布的距 离。结合传统多文档自动文摘中的常用特征,计算句子权重,最终根据句子的分值抽取句子形成摘要。实验结果证明,加入LDA 模 型的主题特征后,自动文摘的性能得到了显著的提高。