Word2Vec的相关知识
1.预备知识
1.1 统计语言模型
统计语言模型是用来计算一个句子的概率的概率模型,通常是基于一个语料库来构建的。而一个句子的概率可以用一下的公式来表示:
其中,
1.2 n-gram 模型
首先假设,与它前面的所有词都相关,那么我们有:
那么,根据大数定律,也就是在语料库足够大的情况下,我们有:
其中,
如果计算所有的词,那么计算量将会非常的大,因此使用
因此得到如下公式:
1.3 sigmoid函数
sigmoid函数是神经网络中的激活函数之一,在不同的阈值下会有不同的输出结果。其定义为:
该函数的定义域为:
https://upload.wikimedia.org/wikipedia/commons/thumb/2/2f/Error_Function.svg/600px-Error_Function.svg.png‘/ width=’400’>
图1 sigmoid函数的图像
sigmoid的导函数有一下形式:
由此可得到,函数
1.4 逻辑回归
用于解决二分类问题,对样本数据