文件名称:Salary-Prediction
文件大小:1.09MB
文件格式:ZIP
更新时间:2024-04-04 09:27:14
JupyterNotebook
薪资预测 预测员工的薪水是否超过5万或将低于5万。 介绍 根据所考虑的数据集,我们需要预测归类为“工资”的分类特征“薪水”,工资<= 50k和工资> 50k分为两类。 数据集是分类特征和连续特征的混合,其中其他分类特征包括“工作类别”,“教育”,“婚姻状况”,“职业”,“关系”,“种族”,“性别”,“本国” '。 同样,此数据集包含缺失值以及离群值,然后将其剔除。 分类特征经过标签编码和分析。 在数据集上进行了各种探索性数据分析技术和可视化。 数据集 这里使用的数据集是“成人收入”数据集,由32561个观察值和14个属性组成,目的是预测员工薪水是否超过5万。 方法 •导入HR数据集。 •开始探索性数据分析,以检测数据集中的关键因素,趋势和模式。 •应用各种数据清理技术来准备数据集。 数据清理技术包括查找缺失值,离群值和重复项(如果有)。 •尝试各种可视化技术,掌握手中的数据。 详细说明训练
【文件预览】:
Salary-Prediction-main
----README.md(2KB)
----HR web()
--------templates()
--------static()
--------aaa(1B)
----Salary_prediction.ipynb(847KB)