1. 神经网络的符号表示
L = 4 层数为4
n[l]=5 第l层有5个神经元
n[0]=nx=3 输入层有3个特征值
a[l]第l层的激活函数
X=a[0] a[L]=y hat输出层
2. 为什么用深度来表示
1)大脑学习:从边缘的细节开始学习,一层层递进到大一点的范围(比如人脸识别,先从学习眼睛、鼻子再到大一点的脸的轮廓)
2)电路理论:为了达到同样的效果,层数少的可能需要指数增长的单元数量(比如计算一个异或式子)
3. 神经网络模块构建
4. 参数VS超参数
参数:W^[1], b^[1]等
超参数:学习率, 隐层数,激活函数,梯度下降的循环次数
超参数在某种程度上控制了参数的结果值
超参数的调整(经验性)方法:
先尝试一个范围内的结果;勤检验且调整值