文件名称:罗氏招聘:初级数据科学软件工程师
文件大小:171KB
文件格式:ZIP
更新时间:2024-03-08 18:33:20
JupyterNotebook
泰坦尼克号-数据科学项目 介绍 这是一个简单的数据科学项目,旨在预测给定的人是否会幸免于泰坦尼克号坠机事故。 代码结构 该存储库包括: 2个Jupyter笔记本运行代码以训练和预测数据 data /:资料集以csv格式储存的资料夹 src /:具有所有必要类和功能的文件夹 数据 有2个包含Titanic数据的csv文件: 802条记录和12列的train.csv 带有89条记录和12列的val.csv这两个数据集都揭示了passanger是否幸存。 列说明: passengerId :此数据集的乘客识别号 生存:生存结果(0 =否,1 =是) pclass :机票类 名称:标题和名称 性别:性别 年龄:岁数 同胞:泰坦尼克号上的兄弟姐妹/配偶 干燥:泰坦尼克号上的父母/子女数量 票号:票号 票价:旅客票价 机舱:机舱号 走上:登船的端口(C =瑟堡,Q =皇后,S =南安普敦) M
【文件预览】:
roche-recruitment-master
----app.py(2KB)
----docs()
--------friends_ryanair.txt(73B)
--------friends_ryanair.jpg(39KB)
--------.gitkeep(0B)
----Titanic_predict_data.ipynb(2KB)
----data()
--------train.csv(52KB)
--------val.csv(6KB)
--------.gitkeep(0B)
----src()
--------train.py(4KB)
--------predict.py(2KB)
--------__init__.py(0B)
--------build_features.py(5KB)
--------preprocess.py(3KB)
--------model.py(866B)
--------.gitkeep(0B)
----requirements.txt(61B)
----.gitignore(2KB)
----README.md(2KB)
----notebooks()
--------Feature_engineering.ipynb(4KB)
--------Model_selection.ipynb(130KB)
--------.gitkeep(0B)
----Titanic_train_data.ipynb(20KB)