主题模型LDA的多文档自动文摘 (2010年)

时间:2024-06-06 18:56:42
【文件属性】:

文件名称:主题模型LDA的多文档自动文摘 (2010年)

文件大小:632KB

文件格式:PDF

更新时间:2024-06-06 18:56:42

工程技术 论文

近年来使用概率主题模型表示多文档文摘问题受到研究者的关注。LDA(latentdirichletallocation)是主题模型中具有代表性的概率生成性模型之一。提出了一种基于LDA的文摘方法,该方法以混乱度确定LDA模型的主题数目,以Gibbs抽样获得模型中句子的主题概率分布和主题的词汇概率分布,以句子中主题权重的加和确定各个主题的重要程度,并根据LDA模型中主题的概率分布和句子的概率分布提出了2种不同的句子权重计算模型。实验中使用ROUGE评测标准,与代表最新水平的SumBasic方法和其他2种基于L


网友评论