Fake-News-Detector:基于机器学习的虚假新闻检测器

时间:2024-06-01 07:05:42
【文件属性】:

文件名称:Fake-News-Detector:基于机器学习的虚假新闻检测器

文件大小:215.26MB

文件格式:ZIP

更新时间:2024-06-01 07:05:42

machine-learning pipeline word2vec classification paragraph-vector

假新闻检测器 欢迎分类为假新闻。 目标 端到端的机器学习管道将: 提取原始文本数据。 将原始文本数据处理为段落向量 将受过训练的有监督学习分类器应用于段落向量,以将原始文本标记为fake或not_fake fake 知识 比较当今使用的词嵌入应用程序的不同方法 在两者上都使用像Gensim这样的神经嵌入实现 词向量化和 段落矢量化 超调谐神经嵌入算法作为端到端流水线的一部分 使用标准的行业分类器,并将其与端到端管道集成 对多阶段机器学习管道进行故障排除 结构 (第一阶段)假新闻分类: 分类器应用程序伪造新闻文本。 嵌入代码是为学生事先准备的,因此他们可以专注于应用分类器基础知识。 将关注度量(精度,召回率,F1)和模型选择 (第2阶段)文本嵌入技术: 什么是Word2Vec,什么是Paragraph2vec 回顾历史策略以及word2vec为什么效果更好 TF IDF(历史简


【文件预览】:
Fake-News-Detector-master
----Phase_01_Progress.ipynb(48KB)
----Phase_03_report_plus.ipynb(47KB)
----Phase_02.ipynb(87KB)
----Phase_01.ipynb(53KB)
----Personal.ipynb(156KB)
----doc2vec.bin.gz(78.36MB)
----images()
--------nfl.png(49KB)
--------linefit.png(61KB)
--------dataset.png(18KB)
--------standardLogisticFunction.png(26KB)
--------unbalanced.png(132KB)
--------logistic.png(92KB)
--------cross-validation.jpg(19KB)
--------gridsearch.png(262KB)
--------odds.png(247B)
--------skip-gram.png(40KB)
--------overview_paragraph.png(41KB)
--------tfidf.jpg(85KB)
--------cbow.png(43KB)
--------odds_double.png(724B)
--------odds_ratio.png(29KB)
--------overview_word.png(31KB)
--------AdaBoost_part.png(55KB)
--------GradientBoosting_scheme.png(42KB)
--------testtrainvalidation.png(37KB)
----LICENSE(1KB)
----README.md(2KB)
----Phase_02_Progress.ipynb(61KB)
----data()
--------Doc2Vec(dmm,d50,n10,w8,mc5,s0.001,t4,0.001,iter40,epochs10)(33.26MB)
--------embeddings2.txt(18.95MB)
--------fake_or_real_news.csv(55.37MB)
--------movie_reviews.csv(73.45MB)
--------grad.csv(5KB)
--------tfidf_matrix_2500_700.bin(33.83MB)
--------embeddings.txt(18.95MB)
--------tfidf_pca_vec.py(2KB)
--------onion_reuters_embeddings.csv(24.81MB)
----papers()
--------Word2Vec original paper.pdf(109KB)
--------Paragraph2Vec original paper.pdf(286KB)
----tfidf_pca_vec.py(2KB)
----.gitignore(1KB)
----Phase_03_report.ipynb(1.03MB)
----Phase_03.ipynb(25KB)

网友评论