新浪微博爬虫代码+结果

时间:2021-06-24 09:30:06
【文件属性】:

文件名称:新浪微博爬虫代码+结果

文件大小:111KB

文件格式:RAR

更新时间:2021-06-24 09:30:06

python爬虫

新浪爬虫的python代码以及部分结果整理 文件列表 1. spider_try.py 爬虫主程序,采用抓取html源码解析的方式获取用户信息。针对每个用户按照person类定义解析。 2. person.py 定义person类,将相应的html标签段解析为可读形式 3. format.py 将最终的结果输出为gexf标准格式方便图处理


网友评论