文件名称:仇恨言论和攻击性语言:“自动仇恨语音检测和攻击性语言问题”论文的存储库,ICWSM 2017
文件大小:4.3MB
文件格式:ZIP
更新时间:2024-02-24 02:32:01
nlp classifier machine-learning natural-language-processing twitter
自动仇恨语音检测和令人反感的语言问题 Thomas Davidson,Dana Warmsley,Michael Macy和Ingmar Weber的存储库。 2017年。“自动仇恨语音检测和令人反感的语言问题。” ICWSM。 您在阅读了这篇论文。 注意:该存储库不再有效维护。 请不要发布有关现有代码与新版本的Python或所用软件包的兼容性的问题。 2019年新闻 我们在这个数据集和其他数据集中有一篇关于种族偏见的新论文,您可以阅读 警告:数据,词典和笔记本都包含种族歧视,性别歧视,仇视同性恋和令人反感的内容。 您可以在data目录中找到我们标记的data 。 我们将它们包括为pickle文件(Python 2.7)和CSV。 您还可以在src目录中找到一个笔记本,其中包含Python 2.7代码以复制本文中的分析结果,并在lexicons目录中找到一个词典,以便更好地对仇恨言论进行分类。 classifier目录包含脚本,说明和在新数据上运行分类器的必要文件,并提供了一个测试用例。 请在使用任何这些资源的任何已发表作品中引用我们的论文。 @inproceedings{hat
【文件预览】:
hate-speech-and-offensive-language-master
----data()
--------labeled_data.p(3.18MB)
--------readme.md(642B)
--------labeled_data.csv(2.43MB)
----classifier()
--------classifier.py(9KB)
--------final_pos.pkl(704B)
--------trump_tweets.csv(4.2MB)
--------final_idf.pkl(1KB)
--------final_model.pkl(5KB)
--------final_classifier.ipynb(42KB)
--------final_tfidf.pkl(5KB)
--------README.md(516B)
----LICENSE(1KB)
----src()
--------Automated Hate Speech Detection and the Problem of Offensive Language Python 3.6.ipynb(93KB)
--------readme.md(100B)
--------Automated Hate Speech Detection and the Problem of Offensive Language.ipynb(82KB)
----.gitignore(19B)
----README.md(2KB)
----lexicons()
--------readme.md(825B)
--------refined_ngram_dict.csv(3KB)
----ICWSM_poster.pdf(976KB)