【文件属性】:
文件名称:JRex java webbrowser 爬虫ajax网页 源码
文件大小:948KB
文件格式:ZIP
更新时间:2013-10-09 07:46:52
GECKO JRex 爬虫 浏览器引擎 ajax
一般在浏览器中查看页面代码 是浏览器直接下载到的页面代码 在未经渲染前 对于JS AJAX输出的内容是无法得到的 这样我们得到的页面内容和直接走socket抓取回来无任何区别 还是无法得到需要的页面内容。
JS函数及页面元素事件的调用 这些很简单都是依靠用户的EVENT去驱动的,而我们通过SOCKET抓取页面对我们只是流而已无法去模拟用户的EVENT 没有这些EVENT 页面上需要EVENT驱动而展现的内容连显示都不可能 更无从抓取了。
JRex为我们解决了这个问题,试验证明JRex 比cobra的lobobrowser好用。
网友评论
- 参考学习,感谢分享
- 学习参考一下,不错的资料,谢谢!
- 不错的东西,刚好解决了我遇到的一个问题
- 没什么用啊
- 貌似用处不大
- 可以解决,学习一下
- 我想要能运行起来看效果的东西啊.
- 几乎木什么用,大家还是别下了
- 运行没问题,解决问题不需要了
- 不能完全解决我的问题,但是还是有帮助的
- 可以跑起来,但是不能我需要的,不过谢谢
- 可以解决,学习一下
- 蛮好的 学习了!
- 可以解决,学习一下
- 运行成功,但不能解决我的问题,这个能设置代理吗,代理不起作用!!
- 没有运行成功
- 没有运行起来,程序结构适合点击运行,不适合代码阅读
- 不知道有没有不打开窗口的方法
- 下载了,不知道怎么用。
- 很不好用。而且都几年没有更新了!
- 不会用,不知道怎么运行
- 没用起来,不知道怎么运行
- 虽然可以解决,但是效率感觉并不是很高,因为里面采用swing进行窗口创建,但是爬虫代码中我只需要得到最后渲染的页面,不知道怎么解决
- 这个可以解决,所看到的页面和HTTpclient得到不一致的问题。赞!!