【PyTorch深度学习项目实战100例】—— 基于word2vec(CBOW)方法训练词向量 | 第61例

时间:2022-10-21 20:53:05

前言

大家好,我是阿光。

本专栏整理了《PyTorch深度学习项目实战100例》,内包含了各种不同的深度学习项目,包含项目原理以及源码,每一个项目实例都附带有完整的代码+数据集。

正在更新中~ ✨

???? 我的项目环境:

  • 平台:Windows10
  • 语言环境:python3.7
  • 编译器:PyCharm
  • PyTorch版本:1.8.1

???? 项目专栏:【PyTorch深度学习项目实战100例】


一、基于word2vec(CBOW)方法训练词向量

word2vec是一种将word转为向量的方法,其包含两种算法,分别是skip-gram和CBOW,它们的最大区别是skip-gram是通过中心词去预测中心词周围的词,而CBOW是通过周围的词去预测中心词。

本项目使用CBOW来训练一个word2vec模型,得到语料库中的词向量表示。

【PyTorch深度学习项目实战100例】—— 基于word2vec(CBOW)方法训练词向量 | 第61例

二、数据集介绍

本项目使用的预料数据是使用的英文小说呼啸山庄,由于版权问题这里就不提供数据集了,可以自己去百度一些英文文章或者爬一些小说作为预料数据进行训练。