网页解析器

时间:2016-12-16 04:21:40
【文件属性】:

文件名称:网页解析器

文件大小:2.34MB

文件格式:PDF

更新时间:2016-12-16 04:21:40

网抓

本文详细介绍了网页信息解析的各种技术手段,并且针对新闻网页,提出了两种解析方案:一.采用面向对象的设计理念,提出了基于模板的网页信息抽取方案;二.提出了基于网页结构分析的信息抽取方案。文中详细讨论了这两套系统的算法及其实现,并探讨了两套系统各自的有缺点。最后并提出了一些新的设想、展望、以及改进方案。


网友评论

  • 介绍的很详细,便于学习实现。