在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。
在实际经济问题中,一个变量往往受到多个变量的影响。例如,家庭消费支出,除了受家庭可支配收入的影响外,还受诸如家庭所有财富、物价水平、金融机构存款利息等多种因素的影响,表现在线性回归模型中的解释变量有多个。这样的模型被称为多元线性回归模型。
多元线性回归模型的一般表现形式为
Yi=β0+β1X1i+β2X2i+…+βkXki+μi i=1,2,…,n
其中 k为解释变量的数目,βj(j=1,2,…,k)称为回归系数(regression coefficient)。上式也被称为总体回归函数的随机表达式。它的非随机表达式为
E(Y∣X1i,X2i,…Xki,)=β0+β1X1i+β2X2i+…+βkXki
βj也被称为偏回归系数。
1.Matlab多元线性回归模型实现
(1)b=regress( Y, X ) 确定回归系数的点估计值
其中,Y为n*1的矩阵;X为(ones(n,1),x1,…,xm)的矩阵;
(2)[b, bint,r,rint,stats]=regress(Y,X,alpha) 求回归系数的点估计和区间估计,并检验回归模型
- b 回归系数
- bint 回归系数的区间估计
- r 残差
- rint 残差置信区间
- stats 用于检验回归模型的统计量,有四个数值:相关系数R2、F值、与F对应的概率p,误差方差。相关系数R2越接近1,说明回归方程越显著;F > F1-α(k,n-k-1)时拒绝H0,F越大,说明回归方程越显著;与F对应的概率p 时拒绝H0,回归模型成立。p值在0.01-0.05之间,越小越好。
(3)出残差以及其置信区间:rcoplot(r,rint);
实例1:(一元线性回归)
测得16名女子的身高和腿长如下表所示(单位:cm)
试研究这些数据之间的关系。
Matlab程序为:(输入如下命令)
结果显示:
因此我们可得y=-16.0730+0.7194x 成立
(残差分析)
接着输入
结果显示
(预测及作图)
接着输入
结果显示
实例2:(多元线性回归)
水泥凝固时放出的热量y与水泥中的四种化学成分x1,x2,x3,x4有关,今测得一组数据如下,试确定多元线性模型。
Matlab程序:(输入命令)
结果显示
因此,我们得到y=-62.4045+1.55x1+0.5102x2+0.1019x3-0.1441x4成立
(残差分析)
接着输入
结果显示
接着输入
预测结果
4.错误:Warning: R-square and the F statistic are not well-defined unless X has a column of ones.
Type "help regress" for more information.
没有常数项的意思!