文件名称:WQI:预测模型,可预测格林斯伯勒市水资源司的水质指数
文件大小:70KB
文件格式:ZIP
更新时间:2024-03-09 11:15:43
Python
水质指数 预测模型,预测格林斯伯勒市水资源司的水质指数 加载库 标题名称被调用以供以后在程序中使用。 加载和框架数据集以及默认标题。 运行原始数据的描述性统计信息,以深入了解和理解数据,以进行进一步的操作(例如清理和标注尺寸) 总结每个属性的分布 相关性 单峰数据可视化 直方图 密度 箱须图 多峰数据可视化 散点图矩阵 相关矩阵 通过删除空单元格来清洁数据集,以实现更好的可视化 窥探干净的数据 标准化数据集的平均值,以获得良好的数据总体分布 窥探数据 按4:1的比例分拆训练和测试数据集,训练:以7的随机种子值进行测试以启动程序 窥探X和Y训练数据集 数据预处理 功能扩展 缩放数据特征以在固定范围内标准化数据中存在的独立特征,以便处理幅度变化很大的特征单元 识别并删除训练数据集中的异常值 窥探数据 应用PCA将特征数量从23个减少到影响WQI预测的重要组件(根据模型) 窥探新数据维度 在
【文件预览】:
WQI-master
----Input()
--------WQI_data.csv(194KB)
----Output()
--------result(1B)
----src()
--------WQI.py(9KB)
----README.md(2KB)