文件名称:假新闻检测
文件大小:45.98MB
文件格式:ZIP
更新时间:2024-03-22 08:42:29
JupyterNotebook
FakeNews_Detection 假新闻检测器通过使用“ doc2vec”模型学习美国新闻的模式来建立分类器 假新闻检测 概述 社交媒体上的虚假新闻检测主题最近引起了极大的关注。 比较网站与带有标签的假新闻来源列表的基本对策是不灵活的,因此需要一种机器学习方法。 我们的项目旨在基于新闻文章的文本内容,使用自然语言处理技术直接检测虚假新闻。 问题定义 开发机器学习程序,以识别新闻源何时可能产生虚假新闻。 我们的目标是使用带有标签的真实和伪造的新文章语料库来构建分类器,该分类器可以根据语料库中的内容做出有关信息的决策。 该模型将重点根据来自某个来源的多篇文章来识别假新闻来源。 一旦某个来源被标记为虚假新闻的产生者,我们就可以高度肯定地预测该来源未来的任何文章也将是虚假新闻。 专注于来源扩大了我们对文章分类错误的容忍度,因为我们将从每个来源获得多个数据点。 该项目的预期应用是用于在社交媒
【文件预览】:
Fake-News-Detection-master
----getEmbeddings.py(3KB)
----main.py(1KB)
----datasets()
--------.ipynb_checkpoints()
--------test2.ipynb(87KB)
--------train.csv(94.06MB)
--------test.ipynb(4KB)
--------test.csv(23.98MB)
----naive-bayes.py(1020B)
----svm.py(1KB)
----README.md(2KB)
----__pycache__()
--------getEmbeddings.cpython-37.pyc(3KB)
--------svm.cpython-37.pyc(1KB)