1. 为什么不选用线性回归
线性回归并不适用于定性预测值的预测
即使在二元分类中利用哑变量对类别编码,其预测的值也会不落在[0,1],这样就很难利用概率的方式来解释
2.逻辑回归
逻辑回归对目标值属于某个类别建模
如何对
在线性回归的基础上引入逻辑函数,将预测值限制在(0,1)之间
利用 最大似然方法拟合该模型
odds:
log-odds:
经过简单的数学变化,可以获得odds和log-odds,odd反应了属于c类的可能性,log-odds反应了逻辑回归模型和线性回归模型的关系,虽然log-odds和X不是线性增长的关系,但X增加和log-odds也呈现了正相关。
3.参数估计
同线性回归模型一样,逻辑回归模型中
4.多元逻辑回归
注意分析特征之间的相关性
5.多类别逻辑回归
例如当数据可以划分为
多类别的逻辑回归效果并不好,线性判别分析是更为流行的多类别分类问题
逻辑回归方法是线性回归模型的拓展,参数式的学习方法更容易理解和解释,逻辑回归适用于二类分类,容易实现和解释。