本文实例讲述了Python抓取百度查询结果的方法。分享给大家供大家参考。具体实现方法如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
|
#win python 2.7.x
import re,sys,urllib,codecs
xh = urllib.urlopen( "http://www.baidu.com/s?q1=123&rn=100" ).read().decode( 'utf-8' )
rc = re. compile (r '<td class=f><h3 class="t"><a.*?>(?P<first>.*?)</h3>' ,re.I)
match = rc.finditer(xh)
rcr = re. compile (r '<[^>]+>' ,re.I)
f = codecs. open ( "xiaohei.txt" , "w" , "utf-8" )
for i in rc.finditer(xh):
ss = i.group( 0 )
s1 = rcr.sub('',ss)
print (s1)
f.write(s1)
f.close()
|
希望本文所述对大家的Python程序设计有所帮助。