文件名称:自动文摘系统中的主题划分问题研究
文件大小:681KB
文件格式:PDF
更新时间:2011-09-26 15:59:10
自动文摘 主题划分 中文信息处理 自然语言处理 研究
随着网络的发展,电子文本大量涌现,自动文摘以迅速、快捷、有效、客观等手工文摘无可比拟的优 势,使得其实用价值得到充分体现。而主题划分是自动文摘系统中文本结构分析阶段所要解决的一个重要问 题。本文提出了一个通过建立段落向量空间模型,根据连续段落相似度进行文本主题划分的算法,解决了文 章的篇章结构分析问题,使得多主题文章的文摘更具内容全面性与结构平衡性。实验结果表明,该算法对多 主题文章的主题划分准确率为9212 % ,对单主题文章的主题划分准确率为9911 %。