文件名称:KcELECTRA:Comments韩语评论ELECTRA
文件大小:5KB
文件格式:ZIP
更新时间:2024-04-27 13:17:40
korean-nlp electra
KcELECTRA:韩国评论ELECTRA 已发布的韩文BERT是基于完善的数据(例如韩文Wiki,新闻文章和书籍)学习的模型。 另一方面,实际上,诸如NSMC之类的注释类型数据集没有得到完善,口语功能中有许多新词,而且在正式文字中没有出现的表述(如错别字)也经常出现。 KcELECTRA是一种预训练的ELECTRA模型,它从收集令牌和ELECTRA模型开始就通过从Naver News收集评论和大量评论来学习,以应用于具有上述特征的数据集。 与现有的KcBERT相比,通过增加数据集和vocab扩展,性能已显着提高。 可通过Huggingface的Transformers库轻松导入和使用KcELECTRA。 (无需单独下载文件。) :light_bulb: NOTE :light_bulb: General Corpus로 학습한 KoELECTRA가 보편적인 task에서는 성능이 더 잘 나올 가능성이 높습니다.
【文件预览】:
KcELECTRA-main
----LICENSE(1KB)
----README.md(10KB)