smp2018:smp2018用户画像技术评测下载

【文件属性】：

文件名称：smp2018:smp2018用户画像技术评测

文件大小：408KB

文件格式：ZIP

更新时间：2024-05-20 16:46:14

smp2018 Python

smp2018用户画像技术评测基础方案给定一个由若干媒体内容文档构成的数据集，参赛队伍采用适当的算法，对每篇文档的作者进行身份识别，区分出该文档属于人类写作、机器写作、机器翻译和机器自动摘要中的哪一类。简单的来说就是文本分类任务。原始训练集用于模型的学习，共146,421篇，其中自动摘要31034篇，机器翻译36206，人类作者 48018，机器作者31163。每一种类型中各取5000篇作为测试集，剩下的作为训练集。分别使用词汇级别CNN和RNN+CNN的模型进行文本分类。结果自构建的测试集上，使用RNN+CNN的模型，达到了98%的准确率。使用全部数据训练的RNN+CNN模型，在第一轮评测中的结果如图所示：环境 Python (>=3.6.1) TensorFlow (=1.6.0) jieba 文件结构 data: 存储中间生成的数据 model: 存储训练完成的模型 or

立即下载

【文件预览】：
smp2018-master
----data()
--------.DS_Store(6KB)
--------cnn_pred_200.npy(156KB)
----model()
--------.DS_Store(6KB)
--------checkpoint(103B)
----test_pred.py(1015B)
----cnnmodel.py(8KB)
----rnn_cnn_model.py(10KB)
----README.md(2KB)
----result()
--------origin_cnn.csv(1.12MB)
----init.py(7KB)
----image()
--------result.png(74KB)
----preprocess.py(4KB)
----origin_data()
--------.DS_Store(6KB)
--------eupt_sample_submission.csv(1.12MB)

秒客网

smp2018:smp2018用户画像技术评测

网友评论

相关文章