文件名称:数据分析练习
文件大小:19KB
文件格式:PY
更新时间:2022-03-31 04:58:50
txt py
1.读入aviation数据集,剔除重复值、缺失值。 2.切片抽取5000样本,使用交叉验证方法比较逻辑回归、决策树算法性能差异 3.使用网格搜索对上题中性能较好的算法进行超参数调优。 4.使用3、4中确定的最优算法和最优参数建立模型。 5.按照6:4划分数据集。 6.使用训练集数据进行模型训练,对测试集数据进行预测,计算F1分数,画出ROC曲线。
文件名称:数据分析练习
文件大小:19KB
文件格式:PY
更新时间:2022-03-31 04:58:50
txt py
1.读入aviation数据集,剔除重复值、缺失值。 2.切片抽取5000样本,使用交叉验证方法比较逻辑回归、决策树算法性能差异 3.使用网格搜索对上题中性能较好的算法进行超参数调优。 4.使用3、4中确定的最优算法和最优参数建立模型。 5.按照6:4划分数据集。 6.使用训练集数据进行模型训练,对测试集数据进行预测,计算F1分数,画出ROC曲线。