文件名称:word2vec词向量训练及中文文本相似度计算
文件大小:2.83MB
文件格式:PDF
更新时间:2021-03-15 13:41:06
自然语言处理
word2vec词向量训练及中文文本相似度计算。 word2vec是google在2013年推出的一个NLP工具,它的特点是将所有的词向量化,这样词与词之间就可以定量的去度量他们之间的关系,挖掘词之间的联系。虽然源码是开源的,但是谷歌的代码库国内无法访问,因此本文的讲解word2vec原理以Github上的word2vec代码为准。本文关注于word2vec的基础知识。