文件名称:Capstone_Project:大会DSI课程的最终顶点项目
文件大小:1.9MB
文件格式:ZIP
更新时间:2024-04-20 18:59:28
JupyterNotebook
大会-数据科学沉浸式课程-顶峰项目已提交给同类群组 使用公司数据和员工评论预测英国性别工资差距统计 1.储存库内容 2.项目目标和数据收集 性别工资差距是整个劳动力队伍中所有男性和女性的平均小时工资之差。 如果女性在组织中薪资较低的工作比男性做更多的工作,例如兼职工作或较少担任高级职位,则性别薪资差距通常会更大。 该项目使用一系列与公司信息和员工评价相关的数据,目的是确定哪些因素可以最好地预测公司的性别工资差距统计数字会好还是坏。 性别薪资差距数据来自英国*网站,其中包括公司的基本信息以及一系列不同的性别薪资差距绩效衡量指标,包括平均性别薪资差距-这显示了男性和女性时薪的平均百分比差异。 使用CH API可从Companies House网站获取更多公司数据。 我还执行了Web抓取,以从求职发布网站的确地收集员工审核数据。 3.数据建模和见解 使用许多不同的方案,将一系列模型应用于
【文件预览】:
Capstone_Project-main
----3_gender_guesser.ipynb(61KB)
----6_final_models(446KB)
----1_indeed_scraping.ipynb(45KB)
----README.md(11KB)
----Capstone_Project_Presentation.pdf(1.85MB)
----2_CH_API.ipynb(26KB)
----5_EDA.ipynb(1.09MB)
----.DS_Store(6KB)
----4_combining_and_cleaning.ipynb(68KB)