Mitigating-Gender-Bias-in-Generated-Text:重现“女王也很强大

时间:2024-04-05 04:00:17
【文件属性】:

文件名称:Mitigating-Gender-Bias-in-Generated-Text:重现“女王也很强大

文件大小:2.19MB

文件格式:ZIP

更新时间:2024-04-05 04:00:17

JupyterNotebook

缓解文本中的性别偏见 设置该存储库的目的是提供对代码和数据的访问,该代码和数据用于编写和论文 。 的原始论文利用进行培训,评估和文本生成。 这些论文中使用的模型是一个88M参数转换器,具有16个关注头,8个编码器层,8个解码器层,并且嵌入大小为512。该模型在具有大约17亿评论的数据集上进行了预训练。 在本文进行的所有实验中,都使用某种形式的数据增强或训练在数据集上对该预训练模型进行了微调,以减轻游戏对话中的性别偏见。 在大型语料库中,文本可能包含性别偏见,模型可以从中学习并生成性别偏见的文本。 这些论文的目的是减轻语料库中存在的性别偏见,并防止模型产生性别偏见的文本。 为了完成此任务,原始论文创建了三种缓解偏差的技术。 反事实数据增强这种扩充方法使用一组带有性别的单词,并将其替换为相反的单词。 例如,它将国王换成女王,将牧师换成女祭司。 正偏数据收集这种方法利用正向偏向的,众包数据将


【文件预览】:
Mitigating-Gender-Bias-in-Generated-Text-main
----images()
--------F0M1BinTable.PNG(26KB)
--------GeneratedResponsesPerBinTable.PNG(35KB)
--------CdaAndBiasResults.PNG(28KB)
--------F1M1BinTable.PNG(27KB)
--------ReproducibilityChartResults.PNG(45KB)
--------CdaAndBiasAndNeutralDataResults.PNG(38KB)
--------F1M0 BinTable.PNG(27KB)
--------GeneratedResponsesPerBinChart.PNG(31KB)
--------F0M0BinTable.PNG(27KB)
----data()
--------light_genderation_bias()
--------light_dialogue()
--------responses()
----LICENSE(1KB)
----src()
--------gender_bias_project.ipynb(11.66MB)
----.gitignore(2KB)
----README.md(9KB)
----.gitattributes(84B)

网友评论