文件名称:自动文摘-文本挖掘PPT
文件大小:406KB
文件格式:PPT
更新时间:2024-05-15 19:45:11
文本挖掘
自动文摘 定义: 就是利用计算机自动地从原始文档中提取全面准确地反映该文档中心内容的简单连贯的短文。 自动文摘系统 自动文摘系统应能将原文的主题思想或中心内容自动提取出来。 文摘应具有概况性、客观性、可理解性和可读性。 系统适用于任意领域。 1995年自动文摘系统评测 ⑴ 3个系统都可以按指定的比率从原文中摘取一部分语句。 ⑵ 抽取的文摘都是原文中的语句,只有单位2的文摘中剔除了一些中文数字。 ⑶ 三个系统的文摘几乎完全不相重合。 与专家的文摘完全不同