一种基于XML的Web信息抽取方法.pdf

时间:2011-11-24 04:32:54
【文件属性】:

文件名称:一种基于XML的Web信息抽取方法.pdf

文件大小:208KB

文件格式:PDF

更新时间:2011-11-24 04:32:54

xml web 信息抽取

 目前Web 资源含有大量的有用信息,但由于它们欠结构化,不能为传统的数据库型查询系统所利用。针对这一问题,出现了Web 信息抽取技术。在论述了半结构化Web 信息抽取技术总体解决方案的基础上,研究了Web 信息抽取的实现技术,并从应用的角度提出一种新的半结构化信息获取方法。该方法包括网页分析过程、映射的自动生成和信息抽取过程。在Web 信息抽取的实现部分,提出了抽取规则执行算法,为进一步满足Web 信息检索提供了一 种新的高效的检索方法。


网友评论