【文件属性】:
文件名称:Faker:虚假信息挑战SBPBRiM
文件大小:33.08MB
文件格式:ZIP
更新时间:2021-02-15 06:54:32
JupyterNotebook
朝着自动系统检测政治媒体中的虚假信息
介绍
根据各种因素,任何信息都可以是真实的或虚假的。 在此项目中,我们在两个基准数据集上使用深度学习和NLP技术将一段文本分类为真实或伪造。
请查看最终报告以查看有关体系结构和性能指标的更多信息。
说谎者
LIAR数据集有6种不同的类别,从True到Pants fire。
假新闻网
FNN有两个不同的类。 真实和虚假。
分词器
我们使用pyTorch的BERT标记工具。 我们删除了TF-IDF表示的停用词,并保留了双字TF-IDF的停用词。
嵌入
对于骗子
TF-IDF用于基线逻辑回归
Google新闻针对神经体系结构的Word2vec 300量纲
假新闻网
TF-IDF用于基线逻辑回归和前馈神经网络
神经架构
神经网络
双神经网络
LSTM
双LSTM
格鲁
双GRU
实验装置
对于它们中的每一个,我们在测试25个纪元
学习率= 0.001
【文件预览】:
Faker-master
----liar_dataset()
--------valid.tsv(294KB)
--------acl2017.pdf(215KB)
--------Liar_dataset.ipynb(35KB)
--------training.csv(2.66MB)
--------test.tsv(294KB)
--------train.tsv(2.3MB)
--------Liardataset.py(9KB)
--------README(2KB)
----BuzzFeedDataset()
--------code.py(1KB)
--------facebook-fact-check.csv(356KB)
--------Buzzfeeddata.ipynb(18KB)
----Faker- final report.pdf(268KB)
----fnn.py(7KB)
----Haritha_Giridhar_Project Checkpoint 1.pdf(68KB)
----liar_dataset_Analysis.py(1KB)
----fnn_read_data.py(964B)
----Kaggledataset()
--------fake.csv.zip(19.42MB)
----README.md(1KB)
----Papers related()
--------C18-1287.pdf(195KB)
--------socialmedia-survey.pdf(2.71MB)
--------fake_news[1828].pdf(1.17MB)
--------Paper_Whatsapp.pdf(3.49MB)
--------3316809.pdf(1.68MB)
--------1904.03989.pdf(479KB)
--------fakenewsNet.pdf(3.17MB)
----disinformation.py(7KB)