可能是小编本身就有一定的基础!当然我没有瞧不起小白的看法,知识觉得要入门一门编程语言确实比较简单,而且小编本身也是从小白过来的,但是当初接触Python爬虫的时候真的用了很短的时间,爬虫这种东西本来就是比较有兴趣的,所以学起来也比较有意思。六行代码就能写一个小爬虫的!
节约时间,不废话介绍了,直接上例子!!!输入以下代码(共6行)
我们来看下获取的数据
在这里还是要推荐下我自己建的Python开发学习群:483546416,群里都是学Python开发的,如果你正在学习Python ,小编欢迎你加入,大家都是软件开发党,不定期分享干货(只有Python软件开发相关的),包括我自己整理的一份2018最新的Python进阶资料和高级开发教程,欢迎进阶中和进想深入Python的小伙伴
爬虫结束~~~有木有满满成就感!!!
以上代码爬取的是这个页面,红色框框里面的数据,也就是豆瓣电影本周口碑榜。
第一步,爬虫的网址,这个…那就豆瓣吧,我也不知道为啥爬虫教程都要拿豆瓣开刀–!
第二部,需要爬取的内容(数据)。
这也正是上面6行代码中的最后一行,也可能是新手觉得最难的地方了。代码的这个部分就是获取数据。
鼠标点击需要爬取的数据,这里我们点“看不见的客人”,如图所示。
看到大红色框框里的东西,是不是和我们最“重要”的代码有很多相似的地方。
爬虫介绍结束,看完你也该试试手了。
试试爬“即将上映”
是不是感觉爬虫很简单,已经会了。
现实中,在爬虫乎面临很多问题,比如:
1. 页面规则不统一;
2. 爬下来的数据处理;
3. 反爬虫机制。
还有很多类似的各种问题,想要深入变成大神,还是需要一步一步来,5分钟变大神是不可能啦~~!
上面6行代码包括的内容有python requests包,html知识,XPATH等。网上资料很多,这里就不做介绍了。
是不是非常简单?爬虫其实真的很容易,做出点成就感来就好了!