想象一下,当mini-batch 是真个数据集的时候,是不是就退化成了 Gradient Descent,这样的话,反而收敛速度慢。你忽略了batch 增大导致的计算 batch 代价变大的问题。如果盲目增大mini-batch size 确实是迭代次数减少了,但是计算时间反而会增加,因为每次计算代价大了。
相关文章
- Predicting effects of noncoding variants with deep learning–based sequence model | 基于深度学习的序列模型预测非编码区变异的影响
- Confluence 6 对一个空间进行归档后产生的影响
- Kafka vs RocketMQ—— Topic数量对单机性能的影响
- TCP BBR算法中Pacing,cwnd,fq以及TSQ对RTT的影响
- 国债收益率曲线变动对市场的影响
- UTF-8 BOM对PHP的影响
- UTF-8 BOM编码格式文件对SSI的影响
- 我的侠客把NPC杀了怎么办 把NPC杀了之后的影响
- 深入理解this和call、bind、apply对this的影响及用法
- CI中获取读操作的结果集行数+获取写操作的影响行数