请问各位对爬虫分析页面javascript有什么好办法?~

时间:2020-12-02 14:45:12
最初的想法是用gecko渲染页面,得到分析结果,一直都没有成功,请教下各位是怎么处理这个问题的~

9 个解决方案

#1


爬虫需要分析JAVASCRIPT吗?如果真的需要分析JAVASCRIPT,你肯定要一个JAVASCRIPT引擎。可以考虑用MOZILLA的“Tamarin”引擎。

#2


js引擎是不够的,还需要解析DOM

#3


解析DOM可以使用EXPAT或LIBXML/LIBWWW.

#4


解析DOM是有办法的
现在的问题主要是想解析页面中包含的JAVASCRIPT脚本,而想要解析脚本,需要解决怎么在JS脚本引擎上挂接DOM解析器,也就是扩展JS脚本的对象

#5


你从js中,想分析出什么内容呢?

#6


主要是URL

#7


js的url相关的语句,一般是有规律的吧。例如
window.location="www......";

#8


有的js也没有显示url

#9


用gecko的思路是正确的, 我就是用gecko, gecko难于掌握,需要花点时间

#1


爬虫需要分析JAVASCRIPT吗?如果真的需要分析JAVASCRIPT,你肯定要一个JAVASCRIPT引擎。可以考虑用MOZILLA的“Tamarin”引擎。

#2


js引擎是不够的,还需要解析DOM

#3


解析DOM可以使用EXPAT或LIBXML/LIBWWW.

#4


解析DOM是有办法的
现在的问题主要是想解析页面中包含的JAVASCRIPT脚本,而想要解析脚本,需要解决怎么在JS脚本引擎上挂接DOM解析器,也就是扩展JS脚本的对象

#5


你从js中,想分析出什么内容呢?

#6


主要是URL

#7


js的url相关的语句,一般是有规律的吧。例如
window.location="www......";

#8


有的js也没有显示url

#9


用gecko的思路是正确的, 我就是用gecko, gecko难于掌握,需要花点时间