回到逻辑回归中sigmoid函数
让我们从使用牛顿方法求0点开始。给一个一元函数
这个方法的几何阐述是很直接的。从某一初始位置出发,做函数的切线与y轴相交,交点的x值即为下一次画切线的出发点,依次循环直至收敛。下图是整个过程的图示:
牛顿方法是一种快速寻找
最后在我们的逻辑回归中,
上式中,
普遍而言,牛顿方法的收敛速度比梯度下降要快得多,他只需要很少的迭代次数就可以收敛。但需要注意的是牛顿方法每一次迭代的时间成本比梯度下降要大得多,因为它每次都要求海森矩阵。即使如此,在维数n不是特别大的情况下,牛顿方法的表现要好很多。