百分求一个网页抓取的问题

时间:2022-04-20 23:17:58
现在要从一个网页抓取一些数据,该数据源是一个Gridview分页的数据,用一个AutoPostbask=true的checkbox来控制是否要分页显示,缺省(第一次访问页面)是分页显示的。
现在我想一次从网址上获得所有的数据,如何实现??即想取得Gridview不分页显示时,所有的源数据? 能得到包含所有源数据的html网页即可。

多谢!!

9 个解决方案

#1


你打算能够使用程序去控制它?难度高了点

#2


抓取倒是可以实现,不过显示的速度恐怕难以接收(里面要通过很多正则来解析);
一般小偷程序是先把数据抓到本地数据库,然后再显示.

#3


用httpwacth看一下,他不分页的时候发送的http请求是什么,然后用webClient去读取
也可以用webbrowser把页面载入,然后通过dom对象控制checkbox,然后提取数据

第一种方法可以参考
http://blog.csdn.net/jinjazz/archive/2007/12/28/1996163.aspx

#4


关注~

#5


做搜索引勤啊?

#6


一般的网络爬虫程序都是先抓取,后在数据库中显示。抓取程序设计用python非常方便。LZ有空学习下

#7


搜索引勤啊?

#8


用DotNetOpenMail(去搜索下载)来分析数据就可以了

抓去的花,用requestHTTP,好像是这个类名,既不得清楚了

#9


都是高手呀。

#1


你打算能够使用程序去控制它?难度高了点

#2


抓取倒是可以实现,不过显示的速度恐怕难以接收(里面要通过很多正则来解析);
一般小偷程序是先把数据抓到本地数据库,然后再显示.

#3


用httpwacth看一下,他不分页的时候发送的http请求是什么,然后用webClient去读取
也可以用webbrowser把页面载入,然后通过dom对象控制checkbox,然后提取数据

第一种方法可以参考
http://blog.csdn.net/jinjazz/archive/2007/12/28/1996163.aspx

#4


关注~

#5


做搜索引勤啊?

#6


一般的网络爬虫程序都是先抓取,后在数据库中显示。抓取程序设计用python非常方便。LZ有空学习下

#7


搜索引勤啊?

#8


用DotNetOpenMail(去搜索下载)来分析数据就可以了

抓去的花,用requestHTTP,好像是这个类名,既不得清楚了

#9


都是高手呀。