硕士论文

时间:2024-03-06 00:10:37
【文件属性】:

文件名称:硕士论文

文件大小:27.87MB

文件格式:ZIP

更新时间:2024-03-06 00:10:37

JupyterNotebook

硕士论文 资料准备 数据准备代码包含在目录-DataPreparation中 以下脚本应按顺序运行,以最终生成对模型进行去偏(微调)所需的数据并进行评估。 DataPreparation / reddit_data.py->使用查询匹配(目标组词和属性词)检索原始reddit注释 DataPreparation / reddit_data_process->处理检索到的注释 DataPreparation / reddit_data_phrases->从已处理的Reddit注释生成短语 创建手动偏差注释并生成文件“ reddit_comments_gender_female_processed_phrase_annotated.csv” DataPreparation / reddit_data_phrases_replace_target.py->提取有偏见的短语并创建计数器目标数据


网友评论