新浪微博爬虫代码+结果 时间:2021-06-24 09:30:06 【文件属性】: 文件名称:新浪微博爬虫代码+结果 文件大小:111KB 文件格式:RAR 更新时间:2021-06-24 09:30:06 python爬虫 新浪爬虫的python代码以及部分结果整理 文件列表 1. spider_try.py 爬虫主程序,采用抓取html源码解析的方式获取用户信息。针对每个用户按照person类定义解析。 2. person.py 定义person类,将相应的html标签段解析为可读形式 3. format.py 将最终的结果输出为gexf标准格式方便图处理 立即下载