rank4_NLP_textclassification:阿里云天池零基础入门NLP比赛_rank4选手比赛总结

时间:2021-05-07 23:52:46
【文件属性】:
文件名称:rank4_NLP_textclassification:阿里云天池零基础入门NLP比赛_rank4选手比赛总结
文件大小:5.54MB
文件格式:ZIP
更新时间:2021-05-07 23:52:46
Python 2020阿里云tianchi零基础入门NLP比赛: rank4选手总结 -该比赛面向零基础小白,比赛赛题是匿名数据的文本分类比赛,所谓匿名数据也就是脱敏数据,文字是用数字来表示的,所以该比赛一个重点就是如今比较火的预训练模型: Bert系列可能没办法拿来直接使用,以及Word2Vec和GloVe等词向量也必须选手重新自己训练,所以如果是对整个流程不是很清楚的选手,很建议参加该比赛或者复盘比赛来进一步深入地学习。 -GloVe: 环境配置: pytorch sklearn gensim Tensorflow2.0+ xgboost lightgbm tqdm huggingface/transformers 比赛数据集简介 该比赛为14个类别的新闻文本分类比赛,本次比赛数据集分为线下的有标签训练数据以及A榜以及B榜的测试数据,选手们需要用线下的有标签训练数据来进行监督学习,最后用对应的模型

网友评论