利用爬虫刷网课
1
前言:
用过python的人应该都会知道爬虫这个东西,网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。
今天就来讲讲如何利用爬虫技术刷网课。
2
实战:
最近学校又推送了一波网课,一个一个的看实在太费时间,于是乎就想到了爬虫来自动刷网课。
第一步
iukl
分析网站源代码,看看网站是如何上传用户的数据的。
这是我们的主站
这是我们要刷的课程
接下来就开始分析源代码了哦,
这个就是播放视频相关的js代码。
我们点进去找找播放之后上传相关的函数。
从这个javascript函数我们可以看到这个是播放完毕以后上传到服务器的json数据包。
我们只需要两个参数就可以实现这个函数的重放了。
courseId就是url里面的419
couttentkpointId就是url里面的10506
每个视频的pointid不一样,我们只需要for循环遍历就行了。
第二步
接下来我们就需要看看这个网站是如何登录的了。
看到没,这个网站连验证码都没有,模拟登录就是小儿科了。
打开我们的brup suite抓个包看看,当然也可以不需要抓包,直接分析源代码就可以,照顾一下新手,我们就来抓个包吧。
从这里我们就可以看到这是一个POST方法,三个参数分别是account,password,ipForget。
好的接下来我们就用python来模拟登陆了。
第三步
首先在终端下面安装一下requests。我的系统是mac os
这个是已经安装好了的,没有安装就安装一下,windows是需要先安装python的。这里我就不讲如何安装了。
然后打开我们的代码编辑器。我这里用的是sublime.
代码如下:
首先就是一个登陆,登陆之后我们就有了cookie,然后利用这个cookie来发包刷网课就行了。
3
文章结尾:
这个网站还是存在很多问题的,如何登陆缺乏验证就可快速爆破,在笔记的地方存在xss漏洞,具体分析过程我在这里就不写了。谢谢大家。
—END—