文件名称:Faker:虚假信息挑战SBPBRiM
文件大小:33.08MB
文件格式:ZIP
更新时间:2024-03-07 00:41:12
JupyterNotebook
朝着自动系统检测政治媒体中的虚假信息 介绍 根据各种因素,任何信息都可以是真实的或虚假的。 在此项目中,我们在两个基准数据集上使用深度学习和NLP技术将一段文本分类为真实或伪造。 请查看最终报告以查看有关体系结构和性能指标的更多信息。 说谎者 LIAR数据集有6种不同的类别,从True到Pants fire。 假新闻网 FNN有两个不同的类。 真实和虚假。 分词器 我们使用pyTorch的BERT标记工具。 我们删除了TF-IDF表示的停用词,并保留了双字TF-IDF的停用词。 嵌入 对于骗子 TF-IDF用于基线逻辑回归 Google新闻针对神经体系结构的Word2vec 300量纲 假新闻网 TF-IDF用于基线逻辑回归和前馈神经网络 神经架构 神经网络 双神经网络 LSTM 双LSTM 格鲁 双GRU 实验装置 对于它们中的每一个,我们在测试25个纪元 学习率= 0.001
【文件预览】:
Faker-master
----liar_dataset()
--------valid.tsv(294KB)
--------acl2017.pdf(215KB)
--------Liar_dataset.ipynb(35KB)
--------training.csv(2.66MB)
--------test.tsv(294KB)
--------train.tsv(2.3MB)
--------Liardataset.py(9KB)
--------README(2KB)
----BuzzFeedDataset()
--------code.py(1KB)
--------facebook-fact-check.csv(356KB)
--------Buzzfeeddata.ipynb(18KB)
----Faker- final report.pdf(268KB)
----fnn.py(7KB)
----Haritha_Giridhar_Project Checkpoint 1.pdf(68KB)
----liar_dataset_Analysis.py(1KB)
----fnn_read_data.py(964B)
----Kaggledataset()
--------fake.csv.zip(19.42MB)
----README.md(1KB)
----Papers related()
--------C18-1287.pdf(195KB)
--------socialmedia-survey.pdf(2.71MB)
--------fake_news[1828].pdf(1.17MB)
--------Paper_Whatsapp.pdf(3.49MB)
--------3316809.pdf(1.68MB)
--------1904.03989.pdf(479KB)
--------fakenewsNet.pdf(3.17MB)
----disinformation.py(7KB)