web-scrapper:使用Python抓取工具获取网站信息(有用的数据)

时间:2024-03-02 06:12:13
【文件属性】:

文件名称:web-scrapper:使用Python抓取工具获取网站信息(有用的数据)

文件大小:24.21MB

文件格式:ZIP

更新时间:2024-03-02 06:12:13

Python

PYTHON应用程序从网站获取数据 从多个表中获取数据(排名,排行榜等)| 网址:website.txt 检索数据,例如排名,团队,奖杯,积分,电话代码和订单 爬虫类使用REGEX从website.txt读取URL 文件“ script_list”包含参数列表 “ web-scrapper.py”将每一行作为与“ websites.txt”不同的网站来循环“ script_list.txt” 只需在“ websites.txt”和“ script_list.txt”中添加更多信息即可从不同的数据集中检索更多数据 SCRAPPER仅解析表元素以进行演示 使用库(例如漂亮的汤)进行html解析和请求http请求 RUN:要运行该应用,只需以管理员身份运行“ run_scrapper.bat”(WINDOWS) 测试:5个站点的执行时间:20s(平均每个站点要废弃4s)


【文件预览】:
web-scrapper-master
----web-scrapper.py(3KB)
----python()
--------python373.exe(24.47MB)
----websites.txt(234B)
----script_list.txt(438B)
----run_scrapper.bat(485B)
----README.md(827B)

网友评论