文件名称:数据挖掘、机器学习+数据集+糖尿病遗传风险预测挑战赛公开数据(讯飞开放平台)
文件大小:103KB
文件格式:ZIP
更新时间:2022-07-14 09:40:32
数据挖掘 机器学习
赛事链接:https://challenge.xfyun.cn/topic/info?type=diabetes&ch=ds22-dw-wd01 内容概要:赛题数据由训练集和测试集组成,具体情况如下: - 训练集:共有5070条数据,用于构建您的预测模型 - 测试集:共有1000条数据,用于验证预测模型的性能。 其中训练集数据包含有9个字段:性别、出生年份、体重指数、糖尿病家族史、舒张压、口服耐糖量测试、胰岛素释放实验、肱三头肌皮褶厚度、患有糖尿病标识(数据标签)。 在此基础上增加了两种训练策略的机器学习代码:官方的demo的ipynb代码和一个决策树实现的代码。 适用人群:初学数据挖掘、机器学习的新手 使用目标及场景:初学数据挖掘、机器学习,,提高实践技能 其他说明:学习交流。
【文件预览】:
糖尿病遗传风险预测挑战赛公开数据
----比赛测试集.csv(45KB)
----比赛训练集.csv(242KB)
----result-de.csv(7KB)
----提交示例.csv(7KB)
----xunfei_demo.ipynb(57KB)
----test.ipynb(4KB)
----result.csv(7KB)
----.ipynb_checkpoints()
--------test-checkpoint.ipynb(4KB)
--------xunfei_demo-checkpoint.ipynb(51KB)