文件名称:赶集网房源爬取.py
文件大小:19KB
文件格式:PY
更新时间:2023-04-01 17:04:03
爬虫 赶集网 python 房源信息
1.分区爬取了赶集网上某个城市的二手房/租房房源信息 2.爬取的具体数据包括:'标题描述', '房租', '整租/合租','面积','户型', '朝向', '装修情况', '楼层', '小区名称', '贴数', '所在地址', '联系人', '房屋描述', '小区房价','小区房价增长率', '区域商圈', '详细地址', '建筑类型', '物业费用', '产权类别', '容积率', '总户数', '绿化率', '建筑年代', '停车位', '开发商', '物业公司', '在租房源', '在售房源' 3.使用了亿牛云的代理(7元/天的套餐)(赶集网反爬虫非常严重,不用代理爬不到什么的) 4.进行了headers优化