文件名称:NLP-Binary-Classification-Machine-Learning
文件大小:866KB
文件格式:ZIP
更新时间:2024-05-11 03:22:03
JupyterNotebook
数据源 在第四周,我们了解了一些不同的分类器。 在第五周中,我们将学习网络抓取,API和自然语言处理(NLP)。 该项目将测试这些技能。 在这个项目中 使用API从两个子收集帖子。 使用NLP训练分类器,以预测给定帖子的原始分类。 (二进制分类问题。) 结构 数据采集 数据清理和EDA 造型 具有所有必要数据的数据集。 以PDF形式展示项目。 系统要求 必要的可交付成果/提交 代码和执行摘要必须放在明确注释的Jupyter Notebook中。 您必须提交幻灯片。 资料必须在12月4日(星期五)美国东部标准时间晚上11:59之前提交。 演示文稿必须在12月4日(星期五)美国东部标准时间上午10:30之前准备好。 我彻底遵守了数据科学过程 问题陈述 数据采集 数据清理和EDA 预处理和建模 评估与概念理解 结论与建议
【文件预览】:
NLP-Binary-Classification-Machine-Learning-main
----2_Data_Cleaning_EDA.ipynb(198KB)
----Presentation.pdf(912KB)
----3_Modeling.ipynb(252KB)
----1_Data_Collection.ipynb(12KB)
----README.md(1KB)
----.gitignore(0B)