文件名称:Hoaxify:Hoaxify是使用NLP技术构建的虚假新闻分类器
文件大小:53.21MB
文件格式:ZIP
更新时间:2024-03-08 07:23:17
JupyterNotebook
骗局2.0 介绍 假新闻是虚假或误导性信息,以新闻形式呈现。 它的目的通常是损害个人或实体的声誉,或通过广告收入来赚钱。 假新闻是当今政治格局中越来越普遍的特征。 为了解决这个问题,研究人员和媒体专家提出了采用自然语言处理(NLP)来分析新闻报道的单词模式和统计相关性的伪造新闻检测器。 训练ML(DL)模型的数据集可以通过众包技术进行整理,或者我们可以使用kaggle等已整理的数据集。 数据整理 众包收集虚假新闻数据。 已经准备好的数据。 属性:新闻:新闻文章编号。 标题:新闻文章的标题文本:文章的文本; 可能是不完整的标签:将文章标记为可能不可靠的标签。 假:不可靠,真实:可靠 造型 :fireworks: 比较结果矩阵 :magnifying_glass_tilted_right: 创建可视化以比较不同算法的结果矩阵。 依存关系 :backhand_index_pointing_down: Python 3.x Keras / Tensorflow NLTK NumPy 大熊猫 斯克莱恩 贡献 需要技
【文件预览】:
Hoaxify-master
----True.zip(18.17MB)
----.ipynb_checkpoints()
--------Final-checkpoint.ipynb(34KB)
----news.csv(29.27MB)
----CODE_OF_CONDUCT.md(3KB)
----LICENSE(1KB)
----.github()
--------ISSUE_TEMPLATE()
--------pull_request_template.md(2KB)
--------config.yml(1KB)
----Final.ipynb(42KB)
----README.md(4KB)
----Fake.zip(22.94MB)
----CONTRIBUTION.md(4KB)
----ANN_model()
--------Initial_Model_Run_W2V.ipynb(833KB)
--------Initial Modeling_uni_bi_tri_grams.ipynb(552KB)
--------create_credible_file_structures_and_convert_articles_requests_to_json.ipynb(46KB)
--------LDA Visualization.ipynb(1.5MB)
--------real_news_data_and_fake_news_corpus_prep.ipynb(21KB)
----Logo()
--------hoaxify3.PNG(20KB)