Abusive-Text-Detection

时间:2024-03-30 08:32:14
【文件属性】:

文件名称:Abusive-Text-Detection

文件大小:279.19MB

文件格式:ZIP

更新时间:2024-03-30 08:32:14

JupyterNotebook

滥用文本检测:从传统的机器学习到深度学习方法 如今,社交媒体的表现如此Swift,以至于挑衅,侮辱或仇恨的言语刺激了某些极端无法接受的社会问题,例如性别歧视,种族主义以及其他形式的暴力和网络欺凌行为。 这种暴力对个人的心理影响可能是严重而持久的。 结果,进行了大量的研究工作,以研究自然语言处理(NLP)领域中诸如Facebook和Twitter之类的普通社交网络上的这些虐待行为。 Twitter上的各种仇恨和令人讨厌的语音数据集具有更大的规模和可靠性,现在可以在各种站点上找到。 在本文中,我们确定了一个现有的数据集并研究了基于机器学习和深度学习的几种算法,例如线性支持向量分类器(LinearSVC),K最近邻(KNN),逻辑回归(Logit)分类器,多项式朴素贝叶斯(MNB),随机森林(RF),长期短期记忆(LSTM)和门控循环单元(GRU)来检测滥用的Twitter内容。 我们执行了参数


【文件预览】:
Abusive-Text-Detection-main
----comparison_between_traditional_ML_deep_learning()
--------comparison.ipynb(52KB)
----training_classification_evaluation()
--------Traditional_ML()
--------Deep_Learning()
----Dataset_collection()
--------original_hatespeechtwitter.xlsx(1.47MB)
--------original_hatespeechtwitter.csv(1.97MB)
--------Dataset_find_from_twitter.ipynb(5KB)
--------extract_from_twitter_hatespeech_labels.csv(8.65MB)
--------final_hatespeechtwitter.csv(7.27MB)
----Parameter_Tuning()
--------Deep_Learning.ipynb(9KB)
--------Traditional_ML.ipynb(12KB)
----README.md(2KB)
----Preprocess()
--------dataset_preprocess.ipynb(11KB)
--------final_data.json(3.66MB)
--------class_value.json(535KB)
----Feature_extraction()
--------Label()
--------Feature_extraction.ipynb(21KB)
--------Extracted_feature_traditional_ML()
--------Extracted_feature_deep_learning()

网友评论