文件名称:论文研究-基于中心化相似度矩阵的词向量方法.pdf
文件大小:1.52MB
文件格式:PDF
更新时间:2022-08-11 13:02:01
词向量,中心化,相似度矩阵
对基于矩阵分解的词向量方法进行了研究,发现降维前相似度矩阵质量与词向量质量存在线性相关性,提出了一种基于中心化相似度矩阵的方法。该方法使得相似(不相似或弱相似)词间的相似程度相对增强(减弱)。在WS-353和RW数据集的词语相似性实验中验证了所提出方法的有效性,两个数据集下词向量质量最高提升0289 6和0180 1。中心化能够提升降维前相似度矩阵质量,进而提升词向量质量。