文件名称:源代码--LOL皮肤爬虫
文件大小:1KB
文件格式:PY
更新时间:2023-04-11 05:02:01
python
爬取LOL所有英雄皮肤源代码,我们通过分析英雄联盟官网页面,进入到资料库页面,分析英雄所在的页面这里有两种类型的同样的图片,一种是大图片的,一种是类似头像的小图片。我们这里抓取大图片拿到几种图片链接分析https://game.gtimg.cn/images/lol/act/img/skin/big5000.jpg可以发现所有英雄皮肤链接url除了数字之前的都一样,而且后面的数字都是以英雄id+三位数拼接而成(三位数从000开始,但是有的英雄并不是就是依次排列,可能000,,001,002会直接跳到013) 由于英雄联盟官网也是做了反爬措施了的,所有图片也是使用局部加载的方式,在开发者工作中,可以找到一个js文件,里面包含了英雄id与英雄的对应关系通过请求该js,获取其源代码,使用正则表达式将其提取出来,用于后面的url拼接