CrawlerMain:基于PythonScrapyMongoDB的分布式搜寻器系统

时间:2024-05-18 08:22:53
【文件属性】:

文件名称:CrawlerMain:基于PythonScrapyMongoDB的分布式搜寻器系统

文件大小:138KB

文件格式:ZIP

更新时间:2024-05-18 08:22:53

Python

履带式 这是一个分布式的垂直爬虫系统,用于一系列网站,包括广泛的Eastmoney.com的股票消息,新闻Web门户Sina.com.cn和Social Trading平台Xueqiu.com 。 设计 Windows平台 Python3 + Scrapy Redis用于排队和分布式爬网。 MongoDB作为数据存储系统。


网友评论