1.什么是逻辑回归

在前面讲述的回归模型中，处理的因变量都是数值型区间变量，建立的模型描述是因变量的期望与自变量之间的线性关系。比如常见的线性回归模型：

而在采用回归模型分析实际问题中，所研究的变量往往不全是区间变量而是顺序变量或属性变量，比如二项分布问题。通过分析年龄、性别、体质指数、平均血压、疾病指数等指标，判断一个人是否换糖尿病，Y=0表示未患病，Y=1表示患病，这里的响应变量是一个两点（0-1）分布变量，它就不能用h函数连续的值来预测因变量Y（只能取0或1）。
总之，线性回归模型通常是处理因变量是连续变量的问题，如果因变量是定性变量，线性回归模型就不再适用了，需采用逻辑回归模型解决。

逻辑回归（Logistic Regression）是用于处理因变量为分类变量的回归问题，常见的是二分类或二项分布问题，也可以处理多分类问题，它实际上是属于一种分类方法

2.逻辑回归的推导

　　1.Sigmoid 函数：（z值就是预测值）

　　　　Logistic Regression虽然名字里带“回归”，但是它实际上是一种分类方法，用于两分类问题（即输出只有两种）。根据第二章中的步骤，需要先找到一个预测函数（h），显然，该函数的输出必须是两个值（分别代表两个类别）

　　　　所以利用了Logistic函数（或称为Sigmoid函数），函数形式为：

　　　　　　　　　　　　逻辑回归（分类算法）

　　　二分类问题的概率与自变量之间的关系图形往往是一个S型曲线，如图所示，采用的Sigmoid函数实现：

　　　　　　　　逻辑回归（分类算法）

　　2.推导

　　　　逻辑回归（分类算法）

　　3.得到似然函数，和对数似：

　　逻辑回归（分类算法）

　　4.求导计算

　　逻辑回归（分类算法）

　　5.求解(通过参数的变化得到最优解)：

　　逻辑回归（分类算法）

3.自我总结：

逻辑回归就是一个分类的算法，常见用在二分类当中，就是把我们的输入值在线性回归中转化为预测值，然后映射到Sigmoid 函数中，讲值作为x轴的变量，y轴作为一个概率，预测值对应的Y值越接近于1说明完全符合预测结果。但是拟合的越好，不代表效果就越好，有可能拟合过度。

注：拟合的越好的意思是，测试集的测试效果符合训练集的训练效果。在我看来训练集就是真实值的集合，测试集就是预测值的集合。

秒客网

逻辑回归（分类算法）

1.什么是逻辑回归

2.逻辑回归的推导

1.Sigmoid 函数：（z值就是预测值）

2.推导

3.得到似然函数，和对数似：

4.求导计算

3.自我总结：

相关文章