【PyTorch深度学习项目实战100例】—— 基于Transformer实现电影评论星级分类任务 | 第42例

时间:2022-10-16 08:01:05

前言

大家好,我是阿光。

本专栏整理了《PyTorch深度学习项目实战100例》,内包含了各种不同的深度学习项目,包含项目原理以及源码,每一个项目实例都附带有完整的代码+数据集。

正在更新中~ ✨

???? 我的项目环境:

  • 平台:Windows10
  • 语言环境:python3.7
  • 编译器:PyCharm
  • PyTorch版本:1.8.1

???? 项目专栏:【PyTorch深度学习项目实战100例】


一、基于Transformer实现电影评论星级分类任务

本文主要用近几年兴起的Transformer拟合微调实现一个包含5个类别的电影评论星级文本分类任务,主要是对电影评论内容进行特征抽取,获取语义分析来实现分类任务。

训练集的规模有1000条,大概训练了100个epoch,最终的分类精度为96%。

二、数据集介绍

电影将所有电影分为22种不同的类型,对于每种类型,都会抓取2000条电影评论,评论按照评论者进行评论时的评分等级分为三类。

整个数据集的大小为2.3GB,为了简单测试demo,所以从所有数据中随机抽取了1000条。

  • Comment:电影评论
  • Star:分类标签,代表不