Web爬网:使用Selenium和BeautifulSoup进行Web爬网,以获取有关个人资料(Linkedin)和公司招聘模式的见解

时间:2024-03-06 05:24:57
【文件属性】:

文件名称:Web爬网:使用Selenium和BeautifulSoup进行Web爬网,以获取有关个人资料(Linkedin)和公司招聘模式的见解

文件大小:1.05MB

文件格式:ZIP

更新时间:2024-03-06 05:24:57

JupyterNotebook

理想工作/角色的路线图 客观的 该项目的目的是通过从不同的员工档案和公司中获取数据来创建一个干净的数据集,以便根据位置,大学,学位,课程和技能组来分析公司的招聘模式,这可以帮助人们制定职业路线图任何人想要探索新的工作角色或改变职业道路以进入*公司之一,就不会意识到工作角色对这个人的期望技能,以前的工作经验,教育背景等方面的知识。我们为学期项目选择该主题的主要原因是我们认为它是一个引人入胜的领域,在该领域中获取和集成各种数据集可能具有挑战性,并且也可以提供有用的信息想要使用此数据集的用户的见解。 除了基于公司和工作角色收集干净的数据集外,我们还希望创建一个框架,该框架可用于以横截面方式创建数据集,其中用户可以根据需要选择所需的公司和工作角色要求。 此外,重点放在连接各种数据源以创建工作流上。 数据源 Linkedin LinkedIn是一项美国商业和就业导向型在线服务,可通过网站和移动应


【文件预览】:
Web-Scraping-master
----.DS_Store(10KB)
----Images()
--------FlowDiagram.png(293KB)
--------.DS_Store(6KB)
--------Skills.png(58KB)
--------University.png(45KB)
--------Company.png(30KB)
--------Degree.png(30KB)
----README.md(14KB)
----Code()
--------.ipynb_checkpoints()
--------.DS_Store(6KB)
--------WebScraping.ipynb(160KB)
----DSCI_final.pptx(589KB)

网友评论