文件名称:基于文本聚类和NLU的自动文摘研究 (2005年)
文件大小:4.57MB
文件格式:PDF
更新时间:2024-06-12 05:16:39
自然科学 论文
针对当前自动文摘方法的缺陷,提出了基于文本聚类和自然语言理解的自动文摘实现方法。将文本聚类引入自动文摘中,实现多文档的自动文摘。提出了基于标题和段首句的二次自动分词算法。实验结果表明,分词正确率和召回率均在95%以上。实现了面向塑料行业的基于文本聚类和自然语言理解的自动文摘系统,其多文档自动文摘的正确率和召回率都在75%以上。实验表明该方法可行,对自动文摘系统的设计具有借鉴意义和深入研究价值。