【文件属性】:
文件名称:webscraping_python_selenium:使用Python和Selenium进行Web爬网Javascript生成的页面
文件大小:3KB
文件格式:ZIP
更新时间:2021-05-17 07:02:22
Python
使用Python Web抓取JavaScript生成的页面
这个项目是专为教育提案而创建的。
该代码显示了如何使用Python和Selenium进行网络抓取从Javascript生成的动态内容页面。
我们使用NBA网站作为数据从球员中提取统计信息,并生成一个排名前10位的json文件。 重要提示:仅用于教育目的
入门
这些说明将为您提供在本地计算机上运行并运行的项目的副本,以进行开发和测试。
先决条件
您需要什么东西来安装软件以及如何安装它们
Python 3.x
壁虎
Firefox(可以使用其他浏览器)
以下一些Python库
正在安装
一系列循序渐进的示例,告诉您如何运行开发环境
安装以下Python库:
request2-要求是唯一适用于Python的Non-GMO HTTP库,可供人类安全使用;
pandas-一个很棒的Python数据分析库;
lxml-用于处理X
【文件预览】:
webscraping_python_selenium-master
----requirements.txt(84B)
----README.md(2KB)
----.gitignore(116B)
----webscraping.py(2KB)