文件名称:who-is-the-asshole
文件大小:255KB
文件格式:ZIP
更新时间:2024-04-25 02:49:33
JupyterNotebook
谁是混蛋 一个NLP道德哲学家,他将阅读冲突的文字说明,并就作者是否是这种情况的混蛋做出道德判断。 数据源 数据来自subreddit 并已被此 根据subreddit本身,它是一个讲述您经历过的非暴力冲突的故事的地方; 讲故事的两面,找出你是对的还是你是个混蛋。 该项目中使用的功能是 帖子标题 柱体 裁决(YTA,NTA,ESH,NAH) 是混蛋 下面的参考图来自subreddit中的automod。 每个帖子评论都必须给出以下5个判断之一。 根据社群成员在评论中给出的判断,最终裁决以职位的天赋来表达。 如果故事中的另一方是混蛋,对于该项目而言并不重要,则将YTA和ESH转换为1,将NTA和NAH转换为0,表示OP(原始海报)是混蛋还是不是混蛋。 EDA 判决频率 在此数据集中的97,455个帖子中,大多数人都收到了NTA的裁决(不是混蛋)。 这是有道理的,因为人们倾向于发布
【文件预览】:
who-is-the-asshole-main
----who_the_a_2.ipynb(75KB)
----.gitignore(2KB)
----README.md(5KB)
----who_the_a.ipynb(129KB)
----who_the_a_min5.ipynb(68KB)
----image()
--------post_length.png(20KB)
--------verdict.png(28KB)
--------post_freq_hist.png(21KB)
--------sgd_sen_conf_matrix.png(10KB)
--------verdict_bar.png(14KB)
--------age_sex.png(26KB)
--------rfc_sen_conf_matrix.png(9KB)
----who_the_a_word2vec.ipynb(23KB)
----helpers.py(3KB)