在使用梯度下降最小化损失函数时,如果学习率过大会导致问题不能收敛到最优解,学习率过小,虽然可以收敛到最优解,但是需要的迭代次数会大大增加,在Tensorflow中,可以用指数衰减法设置学习率,tf.train.exponential_decay()函数会指数级地减小学习率,这样可以让模型在前期快速接近最优解,在后期不至于有太大的波动,从而更加接近最优解。
在使用梯度下降最小化损失函数时,如果学习率过大会导致问题不能收敛到最优解,学习率过小,虽然可以收敛到最优解,但是需要的迭代次数会大大增加,在Tensorflow中,可以用指数衰减法设置学习率,tf.train.exponential_decay()函数会指数级地减小学习率,这样可以让模型在前期快速接近最优解,在后期不至于有太大的波动,从而更加接近最优解。