文件名称:Sentiment-Analysis
文件大小:13.2MB
文件格式:ZIP
更新时间:2024-03-28 12:00:41
Python
情绪分析-COVID-19鸣叫 项目概况 在这个项目中,我为COVID-19推文创建了一个分类系统:正面,负面,中立。 我使用了朴素贝叶斯分类和词袋功能。 使用的代码和资源 的Python版本: 3.7 软件包: pandas,numpy,sklearn,matplotlib,seaborn Kaggle:数据集 数据清理 删除的网址 删除以@开头的Twitter用户名 删除主题标签 删除数字 将逗号等转换为空格 将所有字母转换为小写 执行词干,以便仅保留词根 删除了除“ not”以外的停用词 数据可视化 建筑模型 我尝试了以下两种模型。 我之所以选择MAE,是因为它相对容易解释,并且离群值对于这种类型的模型而言并不是特别糟糕。 我尝试了以下模型: 朴素贝叶斯 逻辑回归 模型表现 朴素贝叶斯(Naive Bayes) :准确性得分= 0.61 Logistic回归:准确性得\u5206=
【文件预览】:
Sentiment-Analysis-main
----Word_cloud_All.pdf(8.89MB)
----word_counts_test_set.pdf(11KB)
----corona_tweet_sentiment-analysis.py(5KB)
----Corona_NLP_test.csv(979KB)
----word_counts_training_set.pdf(11KB)
----README.md(1KB)
----Corona_NLP_train.csv(10.01MB)