Deep Web 爬虫研究与设计 (2005年)下载

【文件属性】：

文件名称：Deep Web 爬虫研究与设计 (2005年)

文件大小：427KB

文件格式：PDF

更新时间：2024-06-14 06:55:45

自然科学论文

随着Web的发展，越来越多的数据可以通过表单提交来获取，这些表单提交所产生信息是由Deep Web后台数据库动态产生的。在这种情况下，信息集成就更加需要Web爬虫来自动获取这些页面以进一步地处理数据。为了帮助用户完成这样的任务，提出一种用于搜集Deep Web页面的爬虫的设计方法。此方法使用一个预定义的领域本体知识库来识别这些页面的内容，同时利用一些来自Web站点的导航模式来识别自动填写表单时所需进行的路径导航。通过对来自不同领域的Deep Web站点的大量实验，验证了此方法是非常有效的。

立即下载

秒客网

Deep Web 爬虫研究与设计 (2005年)

网友评论

相关文章