文件名称:YelpCrawler:在 www.yelp.com 上抓取美国企业的爬虫
文件大小:80.21MB
文件格式:ZIP
更新时间:2024-07-22 01:46:41
JavaScript
YelpCrawler 是一个网络爬虫,用于从爬取美国商业信息 系统依赖 需要安装Redis和Imagemagick brew install redis brew install imagemagick 用法 应用程序设置 bundle exec redis-server bundle exec rake resque:scheduler bundle exec resque-pool --environment development 网页界面 http://localhost:3000/resque/ YAML文件配置 工人数量可自行设定。 例如在 config/resque-pool.yml area_crawler: 2 business_link_finder: 4 business_info_crawler: 2 development: area_crawl