MyWebCrawler:这是一个网页爬虫程序

时间:2024-07-27 04:23:02
【文件属性】:

文件名称:MyWebCrawler:这是一个网页爬虫程序

文件大小:5.76MB

文件格式:ZIP

更新时间:2024-07-27 04:23:02

Java

MyWebCrawler 这是一个网页爬虫程序。 本程序实现了对hupu、sina、qq三个新闻网站的体育专栏的网页爬取和解析。


【文件预览】:
MyWebCrawler-master
----.project(371B)
----src()
--------log4j.xml(3KB)
--------com()
----lib()
--------paranamer-2.3.jar(29KB)
--------slf4j-api-1.6.4.jar(25KB)
--------juniversalchardet-1.0.3.jar(216KB)
--------jackson-mapper-asl-1.9.13.jar(762KB)
--------snappy-java-1.0.5.jar(1.19MB)
--------jsoup-1.7.3.jar(290KB)
--------dom4j-1.6.1.jar(307KB)
--------jaxen-1.1.4.jar(218KB)
--------commons-logging-1.1.1.jar(59KB)
--------avro-1.7.6.jar(416KB)
--------xz-1.0.jar(92KB)
--------jackson-core-asl-1.9.13.jar(227KB)
--------junit-4.11.jar(239KB)
--------hamcrest-core-1.3.jar(44KB)
--------commons-pool2-2.0.jar(105KB)
--------spider.jar(61KB)
--------htmlcleaner-2.8.jar(134KB)
--------commons-compress-1.4.1.jar(236KB)
--------Bloomfilter.jar(479KB)
----config.ini(256B)
----.settings()
--------org.eclipse.jdt.core.prefs(587B)
----README.md(159B)
----crawler.jar(1.18MB)
----.classpath(2KB)
----bin()
--------log4j.xml(3KB)
--------com()

网友评论