机器学习笔记——人工神经网络(1)

时间:2022-12-25 17:40:50

模型表示

简单的神经网络表示
机器学习笔记——人工神经网络(1)

[ x 1 x 2 x 3 ] [       ] h θ ( x )

神经网络的输入是特征 x 1 , x 2 , x 3 ,输出是假设函数的结果
在神经网络中,仍采用同样的逻辑函数 h θ ( x ) = 1 1 + e θ T x
在神经网络中,也称逻辑函数为激励函数, θ 参数为权重。
机器学习笔记——人工神经网络(1)
x 0 为偏置单元,它的值总是等于1
上图中,输入节点Layer1称为输入层,输出假设函数结果的Layer3称为输出层,介于输入层与输出层之间的称为隐藏层。
位于隐藏层的节点(或神经元)称为激励单元。
[ x 0 x 1 x 2 x 3 ] [ a 1 ( 2 ) a 2 ( 2 ) a 3 ( 2 ) ] h θ ( x )

a i ( j ) = "activation" of unit  i  in layer  j Θ ( j ) = matrix of weights controlling function mapping from layer  j  to layer  j + 1

a 1 ( 2 ) = g ( Θ 10 ( 1 ) x 0 + Θ 11 ( 1 ) x 1 + Θ 12 ( 1 ) x 2 + Θ 13 ( 1 ) x 3 ) a 2 ( 2 ) = g ( Θ 20 ( 1 ) x 0 + Θ 21 ( 1 ) x 1 + Θ 22 ( 1 ) x 2 + Θ 23 ( 1 ) x 3 ) a 3 ( 2 ) = g ( Θ 30 ( 1 ) x 0 + Θ 31 ( 1 ) x 1 + Θ 32 ( 1 ) x 2 + Θ 33 ( 1 ) x 3 ) h Θ ( x ) = a 1 ( 3 ) = g ( Θ 10 ( 2 ) a 0 ( 2 ) + Θ 11 ( 2 ) a 1 ( 2 ) + Θ 12 ( 2 ) a 2 ( 2 ) + Θ 13 ( 2 ) a 3 ( 2 ) )

假设在Layer j有 s j 个单元,Layer j+1有 s j + 1 个单元,那么 Θ ( j ) 表示从第j层到第j+1层的权重矩阵,是一个 s j + 1 × ( s j + 1 ) 的矩阵

向量化计算

z 1 ( 2 ) = Θ 10 ( 1 ) x 0 + Θ 11 ( 1 ) x 1 + Θ 12 ( 1 ) x 2 + Θ 13 ( 1 ) x 3 z 2 ( 2 ) = Θ 20 ( 1 ) x 0 + Θ 21 ( 1 ) x 1 + Θ 22 ( 1 ) x 2 + Θ 23 ( 1 ) x 3 z 3 ( 2 ) = Θ 30 ( 1 ) x 0 + Θ 31 ( 1 ) x 1 + Θ 32 ( 1 ) x 2 + Θ 33 ( 1 ) x 3

即, 机器学习笔记——人工神经网络(1),得到如下表示
a 1 ( 2 ) = g ( z 1 ( 2 ) ) a 2 ( 2 ) = g ( z 2 ( 2 ) ) a 3 ( 2 ) = g ( z 3 ( 2 ) )

x z j 的向量形式为
x = [ x 0 x 1 x n ] , z ( j ) = [ z 1 ( j ) z 2 ( j ) z n ( j ) ]

x = a ( 1 ) ,可以写出向量表示的等式 z j = Θ ( j 1 ) a ( j 1 ) , Θ ( j 1 ) s j × ( n + 1 ) 的矩阵, a ( j 1 ) ( n + 1 ) × 1 的矩阵,得出 z j s j × 1 的矩阵, a ( j ) = g ( z ( j ) ) 把函数g作用到 z ( j ) 的每一个元素上。
在计算了 a ( j ) 后,增加偏置单元 a 0 ( j ) = 1 ,得到 z j + 1 = Θ ( j ) a ( j ) ,进一步计算出最终结果
h Θ ( x ) = a ( j + 1 ) = g ( z ( j + 1 ) )

Example XNOR

A N D : Θ ( 1 ) = [ 30 20 20 ] N O R : Θ ( 1 ) = [ 10 20 20 ] O R : Θ ( 1 ) = [ 10 20 20 ]

同或XNOR可以通过与AND、异或NOR、或OR组合得到,在神经网络Layer2计算AND和NOR,再通过Layer3输出层计算OR最终得到XNOR的输出。
[ x 0 x 1 x 2 ] [ a 1 ( 2 ) a 2 ( 2 ) ] [ a ( 3 ) ] h Θ ( x )

机器学习笔记——人工神经网络(1)

神经网络多类别分类

当进行多类别分类时,使假设函数 h Θ ( x ) 的输出值为一个向量。
例如对有4种类别的分类,令机器学习笔记——人工神经网络(1)
机器学习笔记——人工神经网络(1)