文件名称:Noise-label-generation-and-relabeling:在给定噪声率的情况下为数据集生成噪声标签,并使用重新标记算法对这些噪声标签进行重新标记
文件大小:196.28MB
文件格式:ZIP
更新时间:2024-05-04 17:35:47
Python
噪声标签生成和重新标记 在给定噪声率的情况下为数据集生成噪声标签,并使用重新标记算法对这些噪声标签进行重新标记 f1.test.py为all_tickets.csv数据集生成嘈杂的标签,使用“ body”作为特征,使用“ urgency”和“ ticket_type”作为预测标签。 我们假设'紧急'标签可能有一些嘈杂的标签,所以我们在'紧急'上添加了噪音。我们将48000数据拆分为火车数据集,将左侧的数据拆分为测试数据。在为'紧急'生成嘈杂标签's'之后,我们将' body。,'ticket_type'和's'到train_data.csv。在category.py中,我们生成重新标记的标签'relabel'并将其写入relabel.csv文件。除了门票数据集之外,我们还测试了其他数据集。 资料集 文件 结果文件夹 all_tickets.csv test.py 票 情绪训练 tes