文件名称:Portfolio_Project_Ternary_Classification_Tanzanian_Water_Well
文件大小:19.82MB
文件格式:ZIP
更新时间:2024-04-22 01:04:44
JupyterNotebook
数据科学与提升竞争 坦桑尼亚是非洲大湖地区内东非最大的国家,人口为5900万人。 像世界上许多贫穷国家一样,坦桑尼亚也面临着严重的问题,包括无法获得清洁的水。 坦桑尼亚水利部同意Taarifa,他们开始了DrivenData的竞赛,以通过改善清洁水源来解决此问题。 该项目涉及使用有关坦桑尼亚水位的信息来预测给定的水源(井,水泵,竖管,喷泉,钻Kong等)是否正常工作。 共有3个不同的数据集:训练集,测试集和训练标签集,其中包含井的状态。 给定的数据包括具有三个类别的目标-“功能正常”,“功能异常”和“功能需求修复”。 训练和测试集包含59400个水位数据和40个功能。 想法是建立一个模型,该模型可以预测给定的水位是否会落入这三个类别之一。 商业声明 Q1。 Q2。 Q3。 可交付成果 此项目有5个可交付成果: 记录良好的Jupyter Notebook,包含任何代码和解释它的