京东网站评论抽取的爬虫程序

时间:2013-05-10 05:38:13
【文件属性】:

文件名称:京东网站评论抽取的爬虫程序

文件大小:1.61MB

文件格式:RAR

更新时间:2013-05-10 05:38:13

京东,crawler,java,爬虫,评论排序,数据挖掘,文本挖掘

对京东网站商品评论信息的抽取,输出后为xml格式文件。几乎可以抽取与评论相关的所有信息。用java写的爬虫程序。


【文件预览】:
Crawler
----.project(383B)
----bin()
--------CommodityLink.class(380B)
--------Statics.class(364B)
--------Statistics.class(2KB)
--------Commodity.class(611B)
--------Crawler.class(13KB)
--------Review.class(539B)
--------Output.class(1KB)
--------TestRegex.class(969B)
--------SearchCrawler.class(8KB)
----3.xml(5.3MB)
----.settings()
--------org.eclipse.jdt.core.prefs(629B)
----Output.xml.bak(3.3MB)
----src()
--------Statistics.java(881B)
--------TestRegex.java(295B)
--------Output.java(558B)
--------Statics.java(84B)
--------Commodity.java(212B)
--------CommodityLink.java(92B)
--------Review.java(180B)
--------SearchCrawler.java(9KB)
--------Crawler.java(13KB)
----dom4j-1.6.1.jar(307KB)
----运动器材.xml(3.3MB)
----.classpath(377B)

网友评论

  • 可以参考一下
  • 过时了,不能用了
  • 一般吧,京东都出现反爬虫了
  • 真心不错 可是有点老了
  • 有空去看,可用
  • 是java的呀,学习了。。。。。
  • 感觉不太好用,可能是我水平太低了。。。
  • 实用程序,学习了,谢谢分享
  • 没什么用,代码老了,跟现在的完全不一样
  • 京东的代码更新了吧 不过不错
  • 有没有php的
  • 作为学习的东东还是有参考价值的,但京东页面改了很多,希望及时更新啊
  • 没有运行成功,看底下评论也都这样啊。。
  • 下载了 学习了下 但感觉不适合我
  • 现在不适用
  • 程序用不了,估计京东已经修改网页了。
  • 程序不错,不过京东的网页变了,现在不适用了……
  • 学习了,里面还有一部分抓取的评论信息
  • 现在京东的网站样式什么的都改变了,代码里面的正则表达式都不顶用了。。。望楼主进行更新啊!
  • 还不错。。只是出现好多警告。。表示对于初学的我需要费工夫看懂
  • 不知道怎么使用
  • 还行吧,只是程序有错误。
  • 下载了,在我机器上不能运行。
  • 下载了 学习了下 但感觉不适合我的应用
  • 最近在学爬虫,不知道怎么写。
  • 程序运行不了,可能是没有把SearchCrawler.java加进去造成的。恳请贡献者指教,否则我们这些技术呆是调试不好的。。