7 个解决方案
#1
好吧,你可以模拟浏览器的工作环境,把页面重新生成一遍。。。。。。虽然这个技术难度极高。。。。。。
但我想不出很好的办法。。。。
不过如果有兴趣的话,可以去研究下google的爬虫,是如何理解网页上脚本行为的吧,也许能对你有所启发......
又或者,干脆放弃你最初的想法,不要想着用WebClient抓取js生成的内容了。。。
但我想不出很好的办法。。。。
不过如果有兴趣的话,可以去研究下google的爬虫,是如何理解网页上脚本行为的吧,也许能对你有所启发......
又或者,干脆放弃你最初的想法,不要想着用WebClient抓取js生成的内容了。。。
#2
我要获取的内容全都是js生成的。
#3
真正商业化的搜索引擎不执行js。
如果你要执行js,考虑使用WebBrowser等控件,或者其它模拟整个浏览器(例如webkit.net)的组件。
如果你要执行js,考虑使用WebBrowser等控件,或者其它模拟整个浏览器(例如webkit.net)的组件。
#4
可不可以在js执行完成之后生成静态页获取所有内容那?
#5
#6
用这个WebBrowser试下
#1
好吧,你可以模拟浏览器的工作环境,把页面重新生成一遍。。。。。。虽然这个技术难度极高。。。。。。
但我想不出很好的办法。。。。
不过如果有兴趣的话,可以去研究下google的爬虫,是如何理解网页上脚本行为的吧,也许能对你有所启发......
又或者,干脆放弃你最初的想法,不要想着用WebClient抓取js生成的内容了。。。
但我想不出很好的办法。。。。
不过如果有兴趣的话,可以去研究下google的爬虫,是如何理解网页上脚本行为的吧,也许能对你有所启发......
又或者,干脆放弃你最初的想法,不要想着用WebClient抓取js生成的内容了。。。
#2
我要获取的内容全都是js生成的。
#3
真正商业化的搜索引擎不执行js。
如果你要执行js,考虑使用WebBrowser等控件,或者其它模拟整个浏览器(例如webkit.net)的组件。
如果你要执行js,考虑使用WebBrowser等控件,或者其它模拟整个浏览器(例如webkit.net)的组件。
#4
可不可以在js执行完成之后生成静态页获取所有内容那?
#5
#6
用这个WebBrowser试下