python使用post登陆电子科大信息门户并保存登陆后页面
作者:vpoet
日期:大约在夏季
#coding=utf-8 import HTMLParser import urlparse import urllib import urllib2 import cookielib import string import re #登录的主页面 hosturl = 'https://uis.uestc.edu.cn/amserver/UI/Login?goto=http%3A%2F%2Fportal.uestc.edu.cn%2Flogin.portal' #post数据接收和处理的页面(我们要向这个页面发送我们构造的Post数据) posturl = 'https://uis.uestc.edu.cn/amserver/UI/Login' #设置一个cookie处理器,它负责从服务器下载cookie到本地,并且在发送请求时带上本地的cookie cj = cookielib.LWPCookieJar() cookie_support = urllib2.HTTPCookieProcessor(cj) opener = urllib2.build_opener(cookie_support, urllib2.HTTPHandler) urllib2.install_opener(opener) #打开登录主页面(他的目的是从页面下载cookie,这样我们在再送post数据时就有cookie了,否则发送不成功) h = urllib2.urlopen(hosturl) #构造header,一般header至少要包含一下两项。这两项是从抓到的包里分析得出的。 headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.135 Safari/537.36', 'Referer' : 'https://uis.uestc.edu.cn/amserver/UI/Login?goto=http%3A%2F%2Fportal.uestc.edu.cn%2Flogin.portal'} #构造Post数据,他也是从抓大的包里分析得出的。 postData = {'encoded' : 'true', 'gx_charset' : 'UTF-8', 'IDToken1' : '学号', 'IDToken2' : '密码, 'IDButton' : 'Submit', 'goto' : 'aHR0cDovL3BvcnRhbC51ZXN0Yy5lZHUuY24vbG9naW4ucG9ydGFs' , 'IDToken0' : '', } #需要给Post数据编码 postData = urllib.urlencode(postData) #通过urllib2提供的request方法来向指定Url发送我们构造的数据,并完成登录过程 request = urllib2.Request(posturl, postData, headers) print request response = urllib2.urlopen(request) data = response.read() fobj=open("1.html",'w') fobj.write(data) fobj.close()
运行截图:
打开后: