文件名称:java抓取网页源码-ldspider:链接数据网络的爬虫
文件大小:473KB
文件格式:ZIP
更新时间:2024-06-25 15:03:41
系统开源
java抓取网页源码介绍 LDSpider项目为关联数据网络提供了一个网络爬行框架。 爬取关联数据网络的要求和挑战不同于常规的网络爬行,因此 LDSpider 项目提供了一个网络爬虫,适用于从关联数据网络中遍历和收集内容。 由于 ,无法再维护下载页面,因此您必须浏览代码和 jar 的存储库。 请注意,您可以将 maven 与 google 代码存储库一起使用。 groupId 是com.ontologycentral , artifactId 是ldspider 。 该项目是 at 和 at 之间的合作。 , Tobias Kaefer 和正在贡献。 引用为 @inproceedings{ldspider, author = { Robert Isele and J\"{u}rgen Umbrich and Chris Bizer and Andreas Harth}, title = { {LDSpider}: An open-source crawling framework for the Web of Linked Data} , year = { 2010 }, bookti