文件名称:web_scraping:我已经使用Selenium,BeautifulSoup和请求完成的Web Scraping项目
文件大小:6.11MB
文件格式:ZIP
更新时间:2024-03-04 01:09:02
JupyterNotebook
网页抓取 信息:在这里,我添加了一些过去使用Selenium,requests和BeautifulSoup开发的网络抓取笔记本。 1.从Macrotrends.net网站抓取财务数据-我的第一个抓取工具 库:熊猫,请求,BeautifulSoup,openpyxl,re,json 我创建的第一个网络抓取工具是一个简单的机器人,该机器人从网站提取了信息,我的最终目标是使用数据创建Tableau可视化效果(我尚未完成...) 2.从Indeed.com刮取工作-加强游戏 库:Selenium,熊猫,numpy,操作系统,scikit-learn,matplotlib,pickle 这是我开始使用Selenium的地方。 我创建了一个前往的机器人,并根据您指定的任何关键字提取作业。 我还分析了用于每个职位(业务,数据分析师,数据科学家,机器学习工程师,软件工程师)的关键字。