文件名称:京东网站评论抽取的爬虫程序
文件大小:1.61MB
文件格式:RAR
更新时间:2013-05-10 05:38:13
京东,crawler,java,爬虫,评论排序,数据挖掘,文本挖掘
对京东网站商品评论信息的抽取,输出后为xml格式文件。几乎可以抽取与评论相关的所有信息。用java写的爬虫程序。
【文件预览】:
Crawler
----.project(383B)
----bin()
--------CommodityLink.class(380B)
--------Statics.class(364B)
--------Statistics.class(2KB)
--------Commodity.class(611B)
--------Crawler.class(13KB)
--------Review.class(539B)
--------Output.class(1KB)
--------TestRegex.class(969B)
--------SearchCrawler.class(8KB)
----3.xml(5.3MB)
----.settings()
--------org.eclipse.jdt.core.prefs(629B)
----Output.xml.bak(3.3MB)
----src()
--------Statistics.java(881B)
--------TestRegex.java(295B)
--------Output.java(558B)
--------Statics.java(84B)
--------Commodity.java(212B)
--------CommodityLink.java(92B)
--------Review.java(180B)
--------SearchCrawler.java(9KB)
--------Crawler.java(13KB)
----dom4j-1.6.1.jar(307KB)
----运动器材.xml(3.3MB)
----.classpath(377B)