JRex java webbrowser 爬虫ajax网页 源码

时间:2013-10-09 07:46:52
【文件属性】:

文件名称:JRex java webbrowser 爬虫ajax网页 源码

文件大小:948KB

文件格式:ZIP

更新时间:2013-10-09 07:46:52

GECKO JRex 爬虫 浏览器引擎 ajax

一般在浏览器中查看页面代码 是浏览器直接下载到的页面代码 在未经渲染前 对于JS AJAX输出的内容是无法得到的 这样我们得到的页面内容和直接走socket抓取回来无任何区别 还是无法得到需要的页面内容。 JS函数及页面元素事件的调用 这些很简单都是依靠用户的EVENT去驱动的,而我们通过SOCKET抓取页面对我们只是流而已无法去模拟用户的EVENT 没有这些EVENT 页面上需要EVENT驱动而展现的内容连显示都不可能 更无从抓取了。 JRex为我们解决了这个问题,试验证明JRex 比cobra的lobobrowser好用。


网友评论

  • 参考学习,感谢分享
  • 学习参考一下,不错的资料,谢谢!
  • 不错的东西,刚好解决了我遇到的一个问题
  • 没什么用啊
  • 貌似用处不大
  • 可以解决,学习一下
  • 我想要能运行起来看效果的东西啊.
  • 几乎木什么用,大家还是别下了
  • 运行没问题,解决问题不需要了
  • 不能完全解决我的问题,但是还是有帮助的
  • 可以跑起来,但是不能我需要的,不过谢谢
  • 可以解决,学习一下
  • 蛮好的 学习了!
  • 可以解决,学习一下
  • 运行成功,但不能解决我的问题,这个能设置代理吗,代理不起作用!!
  • 没有运行成功
  • 没有运行起来,程序结构适合点击运行,不适合代码阅读
  • 不知道有没有不打开窗口的方法
  • 下载了,不知道怎么用。
  • 很不好用。而且都几年没有更新了!
  • 不会用,不知道怎么运行
  • 没用起来,不知道怎么运行
  • 虽然可以解决,但是效率感觉并不是很高,因为里面采用swing进行窗口创建,但是爬虫代码中我只需要得到最后渲染的页面,不知道怎么解决
  • 这个可以解决,所看到的页面和HTTpclient得到不一致的问题。赞!!