文件名称:web-scraping:网络抓取的东西
文件大小:4KB
文件格式:ZIP
更新时间:2024-05-05 08:30:57
Python
网页抓取 包含各种网页抓取脚本的回购 euroleague_webcalendar_to_ics.py 我太懒了,无法手动将今年欧洲联赛赛季的团队所有游戏添加到我的日历中,所以我编写了一个脚本以Web方式为我抓取并创建一个.ics文件,该文件可以导入到任何选择的日历中。 这也可以与锦标赛中的任何其他团队一起完成。 所需的软件包:icalendar(ics写作),pytz(正确的时区),Beautiful Soup(网页抓取)。 需要一个html解析器,我在这里使用了lxml(在第41行定义)。 lsmu_webcalendar_to_ics.py LSMU大学在一个几乎无法读取的表格中为学生提供了格式错误的网上授课时间表,无法选择将事件添加到个人日历中。 我在这里的工作是帮助他们和网站抓取表格以输出.ics文件。 脚本核心与euroleague脚本相同,只是html读取部分不同。
【文件预览】:
web-scraping-master
----euroleague_webcalendar_to_ics.py(3KB)
----lsmu_webcalendar_to_ics.py(3KB)
----README.md(921B)