关于网络爬虫,

时间:2021-10-05 16:57:43
我买了本<自己动手写网络爬虫>,写了前几个个程序,全连接超时,报异常,百度说这本书10年的太早了。想问问有没有推荐的书籍去学习呀,

8 个解决方案

#1


推荐 《python网络数据采集》  

#2


书 只是给你展示 爬虫的来龙去脉,而你用现在的工具去开发,最大的障碍就是 版本问题,不同的版本甚至语法都不同,比如python,2.x和3.x就有不同的语法。
书本只能给你了解爬虫的架构,如何使用,如果设计,但最后还是要融入自己的设计思维里,做多了,就有经验,就更明白自己的项目中那一部分需要增强改进。而爬虫设计就是一步一步改进的过程。

#3


引用 2 楼 bobolnear的回复:
书 只是给你展示 爬虫的来龙去脉,而你用现在的工具去开发,最大的障碍就是 版本问题,不同的版本甚至语法都不同,比如python,2.x和3.x就有不同的语法。
书本只能给你了解爬虫的架构,如何使用,如果设计,但最后还是要融入自己的设计思维里,做多了,就有经验,就更明白自己的项目中那一部分需要增强改进。而爬虫设计就是一步一步改进的过程。

在学习的过程中,不可能一路看书下去额,每个程序都测试一下,才能体会到,目前测试都测试不了

#4


确实,上次看电子书的时候也发现同样的问题

#5


你可以用jsoup.jar ,挺简单的

#6


引用 5 楼 老鼠拧刀满街找猫的回复:
你可以用jsoup.jar ,挺简单的

这个是神马。 关于网络爬虫,关于网络爬虫,关于网络爬虫,关于网络爬虫,关于网络爬虫,

#7


引用 4 楼 老鼠拧刀满街找猫的回复:
确实,上次看电子书的时候也发现同样的问题

你怎么解决的,或者后来怎么学习的

#8


引用 6 楼 weixin_36044385 的回复:
Quote: 引用 5 楼 老鼠拧刀满街找猫的回复:
你可以用jsoup.jar ,挺简单的

这个是神马。 关于网络爬虫,关于网络爬虫,关于网络爬虫,关于网络爬虫,关于网络爬虫,


http://www.open-open.com/jsoup/parsing-a-document.htm

#1


推荐 《python网络数据采集》  

#2


书 只是给你展示 爬虫的来龙去脉,而你用现在的工具去开发,最大的障碍就是 版本问题,不同的版本甚至语法都不同,比如python,2.x和3.x就有不同的语法。
书本只能给你了解爬虫的架构,如何使用,如果设计,但最后还是要融入自己的设计思维里,做多了,就有经验,就更明白自己的项目中那一部分需要增强改进。而爬虫设计就是一步一步改进的过程。

#3


引用 2 楼 bobolnear的回复:
书 只是给你展示 爬虫的来龙去脉,而你用现在的工具去开发,最大的障碍就是 版本问题,不同的版本甚至语法都不同,比如python,2.x和3.x就有不同的语法。
书本只能给你了解爬虫的架构,如何使用,如果设计,但最后还是要融入自己的设计思维里,做多了,就有经验,就更明白自己的项目中那一部分需要增强改进。而爬虫设计就是一步一步改进的过程。

在学习的过程中,不可能一路看书下去额,每个程序都测试一下,才能体会到,目前测试都测试不了

#4


确实,上次看电子书的时候也发现同样的问题

#5


你可以用jsoup.jar ,挺简单的

#6


引用 5 楼 老鼠拧刀满街找猫的回复:
你可以用jsoup.jar ,挺简单的

这个是神马。 关于网络爬虫,关于网络爬虫,关于网络爬虫,关于网络爬虫,关于网络爬虫,

#7


引用 4 楼 老鼠拧刀满街找猫的回复:
确实,上次看电子书的时候也发现同样的问题

你怎么解决的,或者后来怎么学习的

#8


引用 6 楼 weixin_36044385 的回复:
Quote: 引用 5 楼 老鼠拧刀满街找猫的回复:
你可以用jsoup.jar ,挺简单的

这个是神马。 关于网络爬虫,关于网络爬虫,关于网络爬虫,关于网络爬虫,关于网络爬虫,


http://www.open-open.com/jsoup/parsing-a-document.htm