文件名称:clickbait_classifer
文件大小:1.67MB
文件格式:ZIP
更新时间:2024-04-20 21:45:18
JupyterNotebook
使用基于NLP的机器学习和深度学习进行假新闻分类 项目概况 这种误导性虚假新闻在互联网上的术语是“点击诱饵”(clickbait),这些标题引起读者的注意,以使他们点击虚假新闻。 这类假新闻充其量会误导您,而在最坏的情况下则不会真实。 在这个项目中,我使用NLP(自然语言处理)从标题文本中提取了许多有趣的模式,并进行了探索性数据分析,以通过创建直观功能来提供有关假冒或点击诱饵标题的有用见解。 在此项目中,我使用NLP从标题文本中提取了有趣的模式,并进行了探索性数据分析,以通过创建直观功能来提供有关假标题的有用见解。 该项目包括以下详细工作: 使用NLP进行探索性数据分析和特征工程 使用基于文本的功能进行机器学习建模 使用基于文本的功能的深度学习建模(LSTM) 从基于tex的功能构建BERT模型 关于数据 该项目中使用的是Kaggle的。 数据集包含两种类型的文章:假新闻和真实新闻。
【文件预览】:
clickbait_classifer-main
----.gitignore(2KB)
----README.md(5KB)
----Fake_news_preprocessing.ipynb(25KB)
----fake_news_classification_machine_learning_approach.ipynb(189KB)
----fake news Analysis.ipynb(2.08MB)