R语言统计分析技术研究——岭回归技术的原理和应用

时间:2024-09-19 14:33:50

岭回归技术的原理和应用

作者马文敏

岭回归分析是一种专用于共线性分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息,降低精度为代价获得回归系数更为符合实际,更可靠的回归方法,对病态数据的耐受性远远强于最小二乘法。

R语言统计分析技术研究——岭回归技术的原理和应用

回归分析:他是确立两种或两种以上变量间相互依赖的定量关系的一种统计分析法。运用十分广泛,回归分析按照设计量的多少,分为一元回归和多元回归分析,按照因变量的多少,可分为简单回归分析和多重回归分析,按照自变量和因变量的多少类型可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和因变量,且两者关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或俩个以上的自变量,且自变量之间存在线性相关,则称为多重性回归分析

岭回归的原理:岭回归的原理较为复杂。根据高斯马尔科夫定理,多重相关性并不影响最小二乘估计量的无偏性和最小方差性,但是,虽然最小二乘法估计量在所有线性无偏估计量中是方差最小的,但是这个方差却不一定最小。而实际上可以找一个有偏估计量,这个估计量虽然有微笑的偏差,但他的精度却能够大大高于无偏的估计量。岭回归分析就是依据这个原理,通过在正规方程中引入有偏常数而求得回归估计量的,具体情况可以查阅资料。

对于有些矩阵,矩阵中某个元素的一个很小变动,会引起最后计算结果误差很大,这种矩阵称为病态矩阵。有些时候不正确的计算方法也会使一个正常的矩阵在运算中表现出病态。对于高斯消去法来说,如果主元上的元素很小,在计算时就会表现出病态的特征。

岭回归方程的平方值会稍低于普通回归分析,但回归技术的显著性往往明显高于普通回归,在存在共线性的问题和病态数据偏多的研究中有较大的利用价值

岭回归的应用:在家禽育植的应用:讨论了岭回归方法应用于混合线性模式方程组中估计家禽育植方法,其实质是将传统的混合线性模型方程组理解为一种广义岭回归估计,为确定遗传参数的估计提供一种途径,同时,以番鸭为例,考虑了一个性状和两个固定效应,采用广义岭回归对公番鸭育植进行了估计,并与最佳线性无偏预测法进行了比较,结果表明,广义岭回归方法和BLUP法估计的育种植及其排序极其相似,其相关系数和秩 相关系数分别达到了0.998和0.986,且采用广义岭回归法预测的误差率极低,表明在混合线性模型方程组中使用广义岭回归估计动物育植方法具有可行性,并可省去估计遗传参数的过程,使BLUP法在动物选育中的应用更具有实用性。

正向和反向相结合的卫星摄影数据模拟:卫星摄影数据仿真,通常采用正向模拟和反向模拟两种方法。正向模拟方法简单易行,无需替代计算,但地面点坐标在Y方向存在较大的差异,反向模拟可规避Y方向存在的差异问题,但必须基于已有的DEM数据,且DEM数据范围要与外方位元素范围基本一致,模拟数据受数据源条件制约。

参考文件

百度-----人大经济论坛

百度------道客巴巴

火狐浏览器