判别式模型和产生式模型的区别

时间:2024-02-23 10:31:23

 

判别式模型(Discriminative Model)是直接对条件概率p(y|x;θ)建模。常见的判别式模型有 线性回归模型、线性判别分析、支持向量机SVM、神经网络等。

生成式模型(Generative Model)则会对x和y的联合分布p(x,y)建模,然后通过贝叶斯公式来求得p(yi|x),然后选取使得p(yi|x)最大的yi,即:

判别式模型(discriminative model)

特点是寻找不同类别之间的最优分类面,反映的是异类数据之间的差异,估计的是条件概率分布。

常见的有:线性回归模型、线性判别分析、支持向量机SVM、神经网络等。

主要应用于:图像处理分类,时间序列分析,数据预测等。

优点:

1)分类边界更灵活,比使用纯概率方法或产生式模型更高级;

2)能清晰的分辨出多类或某一类与其他类之间的差异特征;

3)在聚类、viewpoint changes, partial occlusion and scale variations中的效果较好;

4)适用于较多类别的识别;

5)判别模型的性能比产生式模型要简单,比较容易学习。

缺点:

1)不能反映训练数据本身的特性。能力有限,可以告诉你的是1还是2,但没有办法把整个场景描述出来;

2)Lack elegance of generative: Priors, 结构, 不确定性;

3)Alternative notions of penalty functions, regularization, 核函数;

4)黑盒操作: 变量间的关系不清楚,不可视。

 

产生式模型(generative model)

特点是对对后验概率建模,从统计的角度表示数据的分布情况,能够反映同类数据本身的相似度,估计的是联合概率分布。

常见的有:朴素贝叶斯算法,高斯混合模型,HMM,马尔科夫模型,贝叶斯信念网络,贝叶斯网络等

主要应用于自然语言处理等。

优点:

 1)实际上带的信息要比判别模型丰富;

 2)研究单类问题比判别模型灵活性强;

 3)模型可以通过增量学习得到;

 4)能用于数据不完整(missing data)情况。

缺点:

 1)学习和计算过程比较复杂

由产生式模型可以得到判别式模型,但由判别式模型得不到产生式模型。

具体应用有待进一步的学习,这里只是一个概念。

参考资料:http://blog.csdn.net/wolenski/article/details/7985426

               Andrew Ng大神的机器学习课程 http://cs229.stanford.edu