文件名称:论文研究-基于分布的中文词表示研究.pdf
文件大小:1.25MB
文件格式:PDF
更新时间:2022-08-11 15:45:49
分布表示,语义相似度,逐点互信息
针对基于分布的中文词表示构造过程中的参数选择问题进行了系统性的研究。选择了六种参数进行对比实验,在中文语义相似度任务上对不同参数设置下得到的中文词表示的质量进行了评估。实验结果表明,通过选择合适的参数,基于分布的词表示在中文语义相似度任务上能够得到较高的性能,而且这种高维的词分布表示的质量甚至优于目前流行的基于神经网络(Skip-gram)或矩阵分解(GloVe)得到的低维的词表示。