Logistic回归的基本思想与公式推导

讲前小碎话

Logistic回归是一种线性分类模型，通常用来解决线性二分类或多分类问题。无论是在李航老师的《统计学习方法》书中，还是在吴恩达老师的机器学习课程中，都是先假设随机变量x服从Logistic分布，即有如下的分布函数和概率密度函数：

可是为什么定义这样的分布函数和概率密度函数，对于初学者来说，还是很难理解的。我们从Logistic回归的来源（也就是从贝叶斯学习发展来的）来理解其的基本思想，会让人明白很多！

对数似然比假设

后验概率：：在x条件下，事件w发生的概率。后验概率 = 先验概率 × 类别条件概率。对于分类问题，当属于某一类的后验概率最大时，判断为该类别。

Logistic回归的基本思想与公式推导

几率：一个事件的几率，是指该事件发生的概率与该事件不发生的概率的比值，事件发生的概率为p，则该事件的对数几率为 Logistic回归的基本思想与公式推导。Logistic回归的对数几率函数为。

贝叶斯分类器极大似然估计：对于贝叶斯分类器来说，极大似然估计参数时的似然函数为 Logistic回归的基本思想与公式推导（频率派的做法，可以先看一下贝叶斯学习的极大似然估计法~），参数估计时对其进行最大化。

线性判别函数：对于线性分类器来说：线性判别函数是分类超平面的数学公式表示。

线性判别函数： Logistic回归的基本思想与公式推导

分类超平面： Logistic回归的基本思想与公式推导

线性判别：if Logistic回归的基本思想与公式推导 assign x to ; if assign x to

对数几率似然假设：假设似然比（likelihood ratio）的对数为线性判别函数。(是先有的这个假设，才有的sigmoid函数，以及Logistic回归的一系列公式)。面试的时候曾被问道为什么要做这么一个假设，因为想用回归的方式去解决分类问题，这时候需要找到一个函数将类别y与线性回归的预测值联系起来，但是单位阶跃函数不连续，因此使用了对数几率函数，假设对数几率为线性函数。这时候为什么要假设对数几率为线性函数而不是假设几率为线性呢？几率（似然比）的取值范围是0~+∞，而线性函数的取值范围是-∞~+∞，取值范围不同，目标函数不同，此时则不能采用最大似然估计的方式估计参数了，并且假设几率为线性函数的话，本质就是典型的线性分类模型。

Logistic回归的基本思想与公式推导，带入贝叶斯公式，推导得到（注意和是不同的，应该差了一个常数倍数）。