*****************************归一化*******************************
1)把数据变成(0,1)之间的小数
2)把有量纲表达式变成无量纲表达式
归一化算法有:
1.线性转换
y=(x-MinValue)/(MaxValue-MinValue
2.对数函数转换:
y=log10(x)
3.反余切函数转换
y=atan(x)*2/PI
4.线性也与对数函数结合
式(1)将输入值换算为[-1,1]区间的值,
在输出层用式(2)换算回初始值,其中 和分别表示训练样本集中负荷的最大值和最小值。
**************************标准化****************************************
1)把数据按比例缩放,使之落入一个小的空间里
1.最小-最大规范化(线性变换)
y=( (x-MinValue) / (MaxValue-MinValue) )(new_MaxValue-new_MinValue)+new_minValue
2.z-score规范化(或零-均值规范化)
y=(x-X的平均值)/X的标准差
优点:当X的最大值和最小值未知,或孤立点左右了最大-最小规范化时, 该方法有用
3.小数定标规范化:通过移动X的小数位置来进行规范化
y= x/10的j次方 (其中,j使得Max(|y|) <1的最小整数
4.对数Logistic模式:
新数据=1/(1+e^(-原数据))
5.模糊量化模式:
新数据=1/2+1/2sin[派3.1415/(极大值-极小值)*
(X-(极大值-极小值)/2) ] X为原数据
简单来说,标准化是依照特征矩阵的列处理数据,其通过求z-score的方法,将样本的特征值转换到同一量纲下。归一化是依照特征矩阵的行处理数据,其目的在于样本向量在点乘运算或其他核函数计算相似性时,拥有统一的标准,也就是说都转化为“单位向量‘’。