爬虫模拟登陆之formdata表单数据

时间:2021-11-26 18:13:45

首先HTTP协议是个无连接的协议,浏览器和服务器之间是以循环往复的请求回复来交互的,交互的形式是以文件形式来进行的。比如在chrome开发者工具network中看到了

爬虫模拟登陆之formdata表单数据

每一行是一个文件,又文件大小啊,文件类型啊,比如脚本,图片等。

根据协议,把每个文件的内容按照协议格式填入HTTP数据协议结构,其中,对于爬虫模拟登陆来说最重要的是表单数据formdata这个字段

爬虫模拟登陆之formdata表单数据

在这我们看到又loginname字段,又password字段,我们看到这都是明码,所以做了遮挡。我们得到了这个,就可以根据字段名称自己组装数据了,

另外还需要注意的是,formdata所在的文件,前面我们说了,浏览器与服务器之间是以文件形式交互的,开发者工具也是以文件为单位来抓包的,所以我们需要找对文件

这个只能自己找了,比如知乎,包含账号密码的表单数据存在与“email"文件中,比如在智联招聘中,包含账号密码的表单数据存在与“login"文件中

爬虫模拟登陆之formdata表单数据