文件名称:基于子主题区域划分的多文档自动文摘方法 (2011年)
文件大小:493KB
文件格式:PDF
更新时间:2024-06-10 22:40:57
工程技术 论文
为解决词频矩阵的词频维数过大和矩阵过于稀疏的问题,提出一种子主题区域划分的多文档自动文摘方法。使用知网进行概念获取,建立概念向量空间模型,代替传统的词频向量空间模型。在概念向量空间模型的基础上,利用一种改进的层次分割法对文档集合进行子主题划分,从各个子主题中抽取出满足一定数量的句子作为文摘。实验结果验证了该方法的有效性。