文件名称:Multi-label-classification:识别和分类有毒的在线评论
文件大小:2.25MB
文件格式:ZIP
更新时间:2024-05-07 05:12:26
visualization transfer-learning bert lstm-neural-networks multilabel-classification
多标签分类 多标签分类是毒性评论分类的一个项目。(以kaggle毒性评论分类挑战为我们的数据集)。 在此存储库中,我们将研究不同的多任务模型,以在不同模型中使用静态单词嵌入和上下文单词表示来解决多标签问题。 问题描述 与Perspective的当前模型相比,您面临的挑战是建立一个多头模型,该模型能够更好地检测各种类型的毒性,例如威胁,淫秽,侮辱和基于身份的仇恨。 您将使用来自Wikipedia对话页编辑的评论数据集。 当前模型的改进有望帮助在线讨论变得更加富有成效和受人尊敬。 另请参阅- 多标签和多类别之间的区别 图为多标签和多类别问题之间的区别。 这张照片是由EurLex提供的。 多类任务假定一张图片一次仅具有一个类,而多标签任务假定一幅图片可以具有服务器类。 在我们的任务中,每个有毒评论都可能同时具有服务器毒性类型。 (例如,评论可能同时包含“威胁”和“侮辱”)。 综上所述,任务
【文件预览】:
Multi-label-classification-main
----multi_label.py(14KB)
----README.md(13KB)
----Img()
--------data_sample.png(206KB)
--------acc_foss.png(13KB)
--------word_frequency_distribution.png(28KB)
--------structure2.png(51KB)
--------structure1.png(25KB)
--------multi-label.png(301KB)
--------loss foss.png(12KB)
--------test.png(21KB)
--------mulit-label-count.png(21KB)
--------test_ori.png(21KB)
--------loss_tren.png(11KB)
--------wordCloud.png(1.34MB)
--------auc_foss.png(11KB)
--------training_matrics.png(85KB)
--------stc2_acc.png(12KB)
--------sc2_loss.png(11KB)
--------testing_matrics.png(82KB)
--------acc.png(13KB)
--------trend.png(11KB)
--------categories.png(82KB)
--------commentCounts.png(11KB)
----multi_label_bert.py(15KB)