硕士论文

时间:2021-02-14 06:23:57
【文件属性】:
文件名称:硕士论文
文件大小:27.87MB
文件格式:ZIP
更新时间:2021-02-14 06:23:57
JupyterNotebook 硕士论文 资料准备 数据准备代码包含在目录-DataPreparation中 以下脚本应按顺序运行,以最终生成对模型进行去偏(微调)所需的数据并进行评估。 DataPreparation / reddit_data.py->使用查询匹配(目标组词和属性词)检索原始reddit注释 DataPreparation / reddit_data_process->处理检索到的注释 DataPreparation / reddit_data_phrases->从已处理的Reddit注释生成短语 创建手动偏差注释并生成文件“ reddit_comments_gender_female_processed_phrase_annotated.csv” DataPreparation / reddit_data_phrases_replace_target.py->提取有偏见的短语并创建计数器目标数据

网友评论