文件名称:A-Tranformer-based-hybrid-model-for-sarcasm-and-sentiment-detection:WANLP 2021
文件大小:26.19MB
文件格式:ZIP
更新时间:2024-04-03 11:36:17
JupyterNotebook
问题陈述概述 该存储库包含我的团队SPPU_AASM为WANLP Arsarcasm共享任务2021提交的代码。共享任务包含以下两个研究陈述。 子任务1(讽刺检测):标识一条推文是否具有讽刺性,这是一个二进制分类任务。 子任务2(情感分析):识别一条推文的情感并分配三个标签(正,负,中性)多类分类任务之一。 数据集 标签的分布以进行Sarcasm检测 放 真的 错误的 全部的 训练 1734 8305 10039 验证 434 2076 2510 测验 821 2179 3000 全部的 2989 12559 15548 标签分布,用于情感识别 放 积极的 消极的 中性的 全部的 训练 1744 3697 4598 10039 验证 436 925 1149 2510 测验 575 1677 748 3000 全部的 2755 6298
【文件预览】:
A-Tranformer-based-hybrid-model-for-sarcasm-and-sentiment-detection-main
----Model Architecture Diagram.png(111KB)
----dataset()
--------stopwords_list.txt(6KB)
--------emoticon dictionary()
--------trial()
--------lexicon dictionary()
--------main()
----main()
--------text-classification-pipeline.ipynb(68KB)
--------data_processing_pipeline.ipynb(13KB)
--------train_word_vectors.ipynb(5.24MB)
--------model_evaluation.ipynb(21KB)
--------__pycache__()
--------transformer_model.py(4KB)
--------run.py(8KB)
--------preprocess.py(1KB)
--------custom_models.py(13KB)
--------multi-channel-models.ipynb(402KB)
--------custom_functions.py(20KB)
----EDA()
--------EDA on trial set.ipynb(122KB)
--------EDA on training set.ipynb(121KB)
----README.md(2KB)