归一化处理的目的和意义

时间:2022-05-03 06:15:48


    1.为什么进行数据的归一化处理?

    2.matlab里归一化的方法有哪些?


1.归一化处理的目的和意义

     归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在-1--+1之间是统计的坐标分布。归一化有同一、统一和合一的意思。无论是为了建模还是为了计算,首先基本度量单位要同一,神经网络是以样本在事件中的统计分别几率来进行训练(概率计算)和预测的,且sigmoid函数的取值是0到1之间的,网络最后一个节点的输出也是如此,所以经常要对样本的输出归一化处理。归一化是统一在0-1之间的统计概率分布,当所有样本的输入信号都为正值时,与第一隐含层神经元相连的权值只能同时增加或减小,从而导致学习速度很慢。另外在数据中常存在奇异样本数据,奇异样本数据存在所引起的网络训练时间增加,并可能引起网络无法收敛。为了避免出现这种情况及后面数据处理的方便,加快网络学习速度,可以对输入信号进行归一化,使得所有样本的输入信号其均值接近于0或与其均方差相比很小。


2.matlab里常见归一化的方法

第一种:在matlab里面,用于归一化的方法共有三种:

   

(1)线性函数的转换,表达式如下:

     y=(x-MinValue)/(MaxValue-MinValue) (归一到0 1 之间)

     y=0.1+(x-min)/(max-min)*(0.9-0.1)(归一到0.1-0.9之间)

     说明:x、y分别为转换前、后的值,MaxValue、MinValue分别为样本的最      大值和最小值。


(2)对数函数转换,表达式如下:

      y=log10(x)

      说明:以10为底的对数函数转换。


(3)反余切函数转换,表达式如下:

    y=atan(x)*2/PI


第二种:premnmx、tramnmx、postmnmx、mapminmax

    premnmx函数用于将网络的输入数据或输出数据进行归一化,归一化后的数据将分布在[-1,1]区间内。

    

    premnmx语句的语法格式是:[Pn,minp,maxp,Tn,mint,maxt]=premnmx(P,T),其中P,T分别为原始输入和输出数据。


    在训练网络时如果所用的是经过归一化的样本数据,那么以后使用网络时所用的新数据也应该和样本数据接受相同的预处理,这就要用到tramnmx函数:

    tramnmx语句的语法格式是:[PN]=tramnmx(P,minp,maxp)


    其中P和PN分别为变换前、后的输入数据,maxp和minp分别为premnmx函数找到的最大值和最小值。


    网络输出结果需要进行反归一化还原成原始的数据,常用的函数是:postmnmx   

    postmnmx语句的语法格式是:[PN] = postmnmx(P,minp,maxp)


    其中P和PN分别为变换前、后的输入数据,maxp和minp分别为premnmx函数找到的最大值和最小值。


    还有一个函数是mapminmax,该函数可以把矩阵的每一行归一到[-1 1]mapminmax语句的语法格式是:[y1,PS] = mapminmax(x1)


    其中x1 是需要归一的矩阵 y1是结果。


    当需要对另外一组数据做归一时,就可以用下面的方法做相同的归一了。

    

    y2 = mapminmax('apply',x2,PS)


    当需要把归一的数据还原时,可以用以下命令:


    x1_again = mapminmax('reverse',y1,PS)


第三种:prestd、poststd、trastd

    prestd归一到单位方差和零均值。


    pminp和maxp分别为P中的最小值和最大值。mint和maxt分别为T的最小值和最大值

    1.为什么进行数据的归一化处理?

    2.matlab里归一化的方法有哪些?


1.归一化处理的目的和意义

     

      答:归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在-1--+1之间是统计的坐标分布。归一化有同一、统一和合一的意思。无论是为了建模还是为了计算,首先基本度量单位要同一,神经网络是以样本在事件中的统计分别几率来进行训练(概率计算)和预测的,且sigmoid函数的取值是0到1之间的,网络最后一个节点的输出也是如此,所以经常要对样本的输出归一化处理。归一化是统一在0-1之间的统计概率分布,当所有样本的输入信号都为正值时,与第一隐含层神经元相连的权值只能同时增加或减小,从而导致学习速度很慢。另外在数据中常存在奇异样本数据,奇异样本数据存在所引起的网络训练时间增加,并可能引起网络无法收敛。为了避免出现这种情况及后面数据处理的方便,加快网络学习速度,可以对输入信号进行归一化,使得所有样本的输入信号其均值接近于0或与其均方差相比很小。


2.matlab里常见归一化的方法

第一种:在matlab里面,用于归一化的方法共有三种:

   

(1)线性函数的转换,表达式如下:

     y=(x-MinValue)/(MaxValue-MinValue) (归一到0 1 之间)

     y=0.1+(x-min)/(max-min)*(0.9-0.1)(归一到0.1-0.9之间)

     说明:x、y分别为转换前、后的值,MaxValue、MinValue分别为样本的最      大值和最小值。


(2)对数函数转换,表达式如下:

      y=log10(x)

      说明:以10为底的对数函数转换。


(3)反余切函数转换,表达式如下:

    y=atan(x)*2/PI


第二种:premnmx、tramnmx、postmnmx、mapminmax

    premnmx函数用于将网络的输入数据或输出数据进行归一化,归一化后的数据将分布在[-1,1]区间内。

    

    premnmx语句的语法格式是:[Pn,minp,maxp,Tn,mint,maxt]=premnmx(P,T),其中P,T分别为原始输入和输出数据。


    在训练网络时如果所用的是经过归一化的样本数据,那么以后使用网络时所用的新数据也应该和样本数据接受相同的预处理,这就要用到tramnmx函数:

    tramnmx语句的语法格式是:[PN]=tramnmx(P,minp,maxp)


    其中P和PN分别为变换前、后的输入数据,maxp和minp分别为premnmx函数找到的最大值和最小值。


    网络输出结果需要进行反归一化还原成原始的数据,常用的函数是:postmnmx   

    postmnmx语句的语法格式是:[PN] = postmnmx(P,minp,maxp)


    其中P和PN分别为变换前、后的输入数据,maxp和minp分别为premnmx函数找到的最大值和最小值。


    还有一个函数是mapminmax,该函数可以把矩阵的每一行归一到[-1 1]mapminmax语句的语法格式是:[y1,PS] = mapminmax(x1)


    其中x1 是需要归一的矩阵 y1是结果。


    当需要对另外一组数据做归一时,就可以用下面的方法做相同的归一了。

    

    y2 = mapminmax('apply',x2,PS)


    当需要把归一的数据还原时,可以用以下命令:


    x1_again = mapminmax('reverse',y1,PS)


第三种:prestd、poststd、trastd

    prestd归一到单位方差和零均值。


    pminp和maxp分别为P中的最小值和最大值。mint和maxt分别为T的最小值和最大值