文件名称:disaster-response-pipeline:ETL管道与ML模型相结合,用于监督学习和网格搜索,以对灾难事件期间发送的文本消息进行分类
文件大小:2.07MB
文件格式:ZIP
更新时间:2024-04-14 12:53:46
text-classification disaster-management gridsearchcv etl-pipeline Python
项目:灾难响应管道 表中的内容 1.项目概述 在“灾难响应管道”项目中,我将应用数据工程和机器学习来分析和提供的灾难数据,以建立一个ML分类器模型,该模型将来自社交媒体和新闻的灾难消息分类。 “数据”目录包含在灾难事件期间发送的真实消息。 我将创建一个机器学习管道来对这些事件进行分类,以便可以找到适当的灾难帮助机构以寻求帮助。 在项目数据中,包含26248条具有唯一ID的消息。 每种按摩将在ML模型中分为36个类别。 该项目将包括一个Web应用程序,应急人员可以在该应用程序中输入新消息并获得多个类别的分类结果。 该网络应用程序还将显示数据的可视化。 2.项目软件堆栈 该项目的软件堆栈包含三个主要部分: 2.1。 ETL管道 文件/data/process_data.py包含数据清理管道: 加载“ disaster_messages”和“ disaster_categories”数据
【文件预览】:
disaster-response-pipeline-main
----app()
--------templates()
--------run.py(1B)
----data()
--------disaster_categories.csv(11.31MB)
--------disaster_messages.csv(4.83MB)
----models()
--------train_classifier.py(6KB)
----README.md(5KB)