爬虫入门到放弃系列04：我对钱没有兴趣

前言

我们身处大数据时代，数据趋于透明化、公开化，我们是否就可以拿着数据为所欲为？几年前很多人向往着"车厘子*"，同样在也有很多人也追求着技术*。时至今日，我们可以在合法的范围内*应用技术，那么对于爬虫的合法化，到底有哪些的法律可以来界定？

在很长的一段时间内，很多人谈爬虫色变，同时很多调侃爬虫的段子也应运而生。

因为兴趣学习了爬虫，后来也承担下了爬虫开发的工作。我也是被调侃大军中一员，甚至有一段时间我也都有点不敢开发爬虫了，现在想想，有点盲目了... 所以本篇文章着重于这一方面来展开，毕竟克服恐惧最好的方法就是去了解它。

法律条文

我曾经跨过山和大海，也穿过人山人... 经过我的百度，发现和爬虫直接相关的法律条文就只有两条：

从上图可以看出，在上述法律中只要爬虫程序不破坏别人的服务器、不影响网站正常运行即可，一般通过限制请求的频率和线程数量就可以避开这个雷区。但是，往往最简单的问题都会伴随着一个经典案例。

2019年，某互联网公司200人因为一段爬虫程序被抓的消息传得沸沸扬扬，起因是一技术小哥对爬虫程序没有限制请求频率、并增加了线程数后进行测试，下班忘了停止程序，大半夜导致目标网站的服务器宕机了，然后被顺着网线找到了... 当然，最后200人大多数都没事，技术小哥承担了主要责任，而一开始技术小哥由于缺乏这一方面的法律认知，抱着"技术无罪"的心态，导致这个事情走向了极坏的结果。

从这个案例可以明白，限制请求频率是多么重要！！正如我前面文章所写，开发爬虫要不仅要考虑本身程序性能，更要考虑网站用户数量级对应的网站服务器规模和性能，有的网站的服务器可能只有一台，还是服务共用的。

除了上述的法律规定了爬虫开发规范，是否还有其他的法律可以间接影响着爬虫的应用。

案例分析

非法侵入计算机信息系统罪

《刑法》第二百八十六条还规定，违反国家规定，对计算机信息系统功能进行删除、修改、增加、干扰，造成计算机信息系统不能正常运行，后果严重的，构成犯罪，处五年以下有期徒刑或者拘役；后果特别严重的，处五年以上有期徒刑。而违反国家规定，对计算机信息系统中存储、处理或者传输的数据和应用程序进行删除、修改、增加的操作，后果严重的，也构成犯罪，依照前款的规定处罚。

非法入侵系统，这不是黑客的工作么，这个和爬虫程序有啥关系，爬虫又不能进入到后台系统？网站的反爬技术一般是通过参数加密等手段，类似于操作系统的密码，以此来阻止爬虫获取数据，在广义上爬虫破解反爬技术也算是非法入侵的一种。而爬虫衍生出来的产业：验证码识别服务贩卖、SEO，如果为不法分子提供了相关的服务，同样也算是非法入侵。

经典案例：

知乎某极验破解者自述被抓
永嘉警方揪出“黑”百度黑客团伙干扰搜索引擎牟利超七千万元
“快啊答题”AI破解验证码服务开发者被判刑

侵犯公民个人信息罪

《刑法》修正案（九）中将刑法第二百五十三条进行了修订，明确规定违反国家有关规定，向他人出售或者提供公民个人信息，情节严重的，构成犯罪；在未经用户许可的情况下，非法获取用户的个人信息，情节严重的也将构成“侵犯公民个人信息罪”。根据《最高人民法院最高人民检察院关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》第五条规定，对“情节严重”的解释，（1）非法获取、出售或者提供行踪轨迹信息、通信内容、征信信息、财产信息五十条以上的；（2）非法获取、出售或者提供住宿信息、通信记录、健康生理信息、交易信息等其他可能影响人身、财产安全的公民个人信息五百条以上的；（3）非法获取、出售或者提供第三项、第四项规定以外的公民个人信息五千条以上的便构成“侵犯公民个人信息罪”所要求的“情节严重”。

个人信息数据是万万碰不得的。非法获取和出售个人信息和隐私数据至少三年起步。

经典案例：