LLM - 神经网络的组成

时间:2024-07-06 07:21:52

1. 一个神经元的结构:即接受多个输入X向量,在一个权重向量W和一个偏执标量b的作用下,经过激活函数后,产生一个输出。

2. 一层神经网络的结构:该层网络里的每个神经元并行计算,得到各自的输出;计算方式是输入向量X,在权重矩阵W和偏置向量B的作用下,经过激活函数,产生n个输出(输出是一个向量)

3. 多次神经网络的结构:由输入层,隐层,输出层组成,每一层的输出结构是由上一层的线性变换和激活函数得到。

4. 为什么要引入激活函数?因为如果不引入激活函数,多层神经网络会塌缩成一层神经网络,如下图示意,神经网络每层都是线性变换,最终多层网络的结果只相当于一层网络。

     

5. 激活函数有哪些?

6. 输出层:分为线性输出层(用于回归问题,预测连续的值);以及Sigmoid输出层(用于二分类问题,预测输入属于某个类的概率);和Softmax输出层(用于多分类问题,预测输入属于某个类的概率,有多少个分类就有多少个输出)