文件名称:NAACL-SRW-2021:代码和数据集
文件大小:1.3MB
文件格式:ZIP
更新时间:2024-05-07 19:48:25
JupyterNotebook
资源受限语言中基于变压器的方法进行情感分类 作者: Avishek Das,Omar Sharif,Mohammed Moshiul Hoque和Iqbal H. Sarker 地点: 抽象的 尽管在高资源语言中关于情感分类的研究已经取得了显着进展,但对于像孟加拉语这样的资源受限的语言来说,它仍处于起步阶段。 但是,由于缺少必要的语言处理工具和基准语料库的缺乏,孟加拉语中的情感分类任务变得更具挑战性和复杂性。 这项工作提出了一种基于变压器的技术,将孟加拉语文本分为六种基本情绪之一:愤怒,恐惧,厌恶,悲伤,喜悦和惊奇。 孟加拉语情感语料库由6243个文本组成,用于分类任务。 使用各种基于机器学习(LR,RF,MNB,SVM),深度神经网络(CNN,BiLSTM,CNN + BiLSTM)和转换器(Bangla-BERT,m-BERT,XLM-R)的方法进行了实验。 实验结果表明,XLM-
【文件预览】:
NAACL-SRW-2021-main
----Code Snippets()
--------ML_Algorithms_NAACL_(Emotion_Data).ipynb(55KB)
--------preprocessing_functions.py(763B)
----NAACL-Emotion-Classification.pdf(574KB)
----README.md(2KB)
----Figures()
--------readme.md(1B)
--------naacl-2021.PNG(188KB)
----Dataset()
--------val.xlsx(82KB)
--------readme.md(1B)
--------test.xlsx(84KB)
--------train.xlsx(592KB)