文件名称:大数据作业,python MOOC网数据爬虫
文件大小:8.93MB
文件格式:ZIP
更新时间:2023-12-31 14:25:31
爬虫 python mooc
运行环境为windows,需要安装python编辑器,及合适版本Chorme浏览器,可爬取课程、评论、学生相关信息,大数据作业。仅供参考,严禁进行非法用途。
【文件预览】:
mooc_spider
----data()
--------user_info_all.xlsx(169KB)
--------class.xlsx(183KB)
--------user_url_all.xlsx(1.92MB)
--------class_info_with_score_all.xlsx(6KB)
--------cate.xlsx(6KB)
--------class_cate_url.xlsx(6KB)
--------school_url.xlsx(21KB)
--------comment_all.xlsx(2.22MB)
--------class_info_with_url.xlsx(335KB)
----src()
--------file_processing.py(1KB)
--------get_into_page.py(16KB)
--------utils.py(2KB)
--------__pycache__()
--------map.py(17KB)
----log()
--------spider_log20201204093239.txt(5.85MB)
----requirement.txt(70B)
----.idea()
--------.gitignore(257B)
--------misc.xml(188B)
--------encodings.xml(321B)
--------workspace.xml(21KB)
--------mooc_spider.iml(324B)
--------inspectionProfiles()
--------.name(7B)
--------modules.xml(281B)
----__pycache__()
----test.py(25B)
----chromedriver.exe(9.27MB)
----picture_dir()
--------area_have_student_block.html(7KB)
--------area_have_class_block.html(7KB)
--------area_have_study_time_avg_block.html(7KB)
--------area_have_study_time_all_block.html(7KB)
----main.py(8KB)