一个获取供应商余额的项目中,使用了 selenium 来爬虫,原因是获取余额不用太频繁,对性能要求不高。第二是 selenium 更好应对各种页面。
项目中,selenium webdriver使用了全局变量,因为
- 想要避免重复打开、关闭 phantomJS 带来的损耗。(这个损耗到底有多大?)如果是 requests,我就是局部变量,觉得损耗不打,也更加灵活。引申出一个问题,如何 benchmark,应该是根据 benchmark来,而不仅仅是`感觉`。
- cookie 不用手动干预
遇到的问题
- celery 关闭不了 phantomJS,我现在是每次启动程序的时候,先杀死运行用户账户下所有的 `phantomJS` 。如果有其他程序也用到这个,就会对别人造成问题