第十三章多重回归实习指导(定)
本文关键词:回归方程,由笔耕文化传播整理发布。
第十三章 多重线性回归与相关
[教学要求]
了解: 多重共线性的概念及其对回归分析结果的影响;通径分析的基本过程及其应用。 熟悉:多重相关与回归分析的基本原理与方法。
掌握:掌握多重相关与回归分析结果的解释;相关、回归、简单相关、偏相关与复相关,简单回归、偏回归与全回归等概念。
[重点难点]
第一节 多重线性回归的概念及其统计描述
一、变量(Y)关于k个自变量(X1,X2,...,Xk)的多重线性回归的数学模型为:
Yi??0??1X1i??2X2i?...??kXki??i。实质是将每个Y的观测值用该模型在最小残 差平方和的原则下进行分解。
二、标准回归系数为将各个变量按Xi*?Xi?i变换后,再进行多重回归计算所得的 Si
回归系数。因为通过标准化过程消除了各个变量的计量单位不同对回归系数的影响, 所以各个标准回归系数的大小能直接反映该自变量对Y变量的回归效应的大小。
三、多重回归分析的前提条件完全与简单线性回归相同:线性、独立、正态和等方差,即 LINE。
第二节 多重线性回归的假设检验
一、 整体回归效应的假设检验(方差分析)的原假设为H0: ?1??2??3?...??k?0;其过程 是通过对Y的总变异进行分解,用回归均方与残差均方的比值构造F检验统计量,然后根 据相应的F分布决定是否拒绝原假设。
二、偏回归系数的t检验的的原假设为H0: βi=0,即第i个总体偏回归系数为零;其过程是 用第i个偏回归系数的估计bi与该偏回归系数的标准误之比值构造t统计量:
1
tbi?bi
Sbi
然后根据相应的t分布决定是否拒绝原假设。
第三节 复相关系数与偏相关系数
一、 确定系数、复相关系数与调整确定系数
1、复相关系数的平方称为确定系数(coefficient of determination)或决定系数,记为R 2,用以反映线性回归模型能在多大程度上解释反应变量Y的变异性。其定义为
R2?SSR SST
2其取值范围为0?R2?1。若确定系数R 的值接近于1,指示样本数据很好地拟合了所选
用的线性回归模型。R 2直接反映回归方程中所有自变量解释反应变量Y总变异的百分比。同时,R 2也可以解释为回归方程使反应变量Y的总变异减少的百分比。
2、复相关系数(multiple correlation coefficient) R, 定义为确定系数的平方根,即
R?SSR SST
3、调整的R 2(adjusted R-Square):当回归方程中包含有很多自变量,即使其中有一些自变量对解释反应变量变异的贡献极小,随着回归方程的自变量的增加,R 2值表现为
2只增不减。调整的R 2克服了这一缺点。调整的R 2记为Ra,定义为 k(1?R2) R?R? n?k?12
a2
二、偏相关系数和偏回归系数
1、偏相关系数(partial correlation coefficient):扣除其他变量的影响后,变量Y与X的相关的有无、方向与强弱程度,称为Y与X的偏相关系数。
2、偏回归系数( partial regression coefficient ):当方程中其他自变量保持常量时,自变量Xi变化一个计量单位,反应变量Y的平均值变化的单位数量。
2
3、简单相关系数的假设检验与简单回归系数的假设检验等价;多重回归的整体回归效应的假设检验与总体确定系数R 2=0的假设检验等价;偏相关系数的假设检验与偏回归系数的假设检验等价。
第四节 自变量筛选
一、 自变量筛选的标准与原则
1、自变量筛选的目的是确保回归方程包含所有对反应变量有较大影响的自变量,而把与反应变量关系不大或可有可无的自变量排除在方程之外,以提高回归参数的估计和预测的精度。
2、残差平方和(SSE)缩小与确定系数(R2)增大的自变量筛选原则是等价的;残差均方(MSE)缩小与调整确定系数(R
二、 变量筛选的常用方法
自变量筛选的方法很多,有前向选择、后向选择、逐步选择等。但以逐步选择(stepwise selection)的方法应用较多。在逐步选择过程中,把经F检验有意义的变量引入方程后,又对已在方程中的自变量进行一次关于剔除的F检验,保留有统计学意义的变量,而剔除无统计学意义的变量。反复进行引入、剔除过程,直到既没有变量被引入,也没有变量被剔除为止。
* 第五节 关于多重线性回归的应用
一、非同质资料的合并问题:
在用回归分析解释实际专业问题时,应考虑是否存在混杂变量干扰回归结果,即在该混杂变量的不同水平上的回归系数具有不同的特征;不要将这种非同质的资料合并拟合回归模型,应分组拟合回归模型。
二、多重共线性(multi-co-linearity)问题:
多重共线性是指自变量之间非独立或线性相关,即回归模型中的一个自变量近似为其它自变量的线性组合。多重共线性的存在将导致对回归参数?的最小二乘估计的性质变坏。表现为:①回归参数估计值的标准误差偏大,因此回归参数估计值变得十分不稳定,甚至符号改变;②当样本数据有略微改变或在模型中增加或删除某个自变量时,将使其它自变 3 2?)增大的自变量筛选的标准与原则也是等价的。
量的回归参数估计值发生较大变化,从而使回归参数估计值失去意义。
在实际应用多重线性回归过程中不难发现,自变量之间相互独立或线性无关的情况是很少见的,多重共线性现象难以避免,问题在于其多重共线性的强弱程度。许多统计学家认为,如果多重共线性在程度上较弱时,线性回归仍然不失为解决实际问题的有效工具。但当多重共线性较强时,将会导致一系列错误的结论。
三、通径分析(path analysis)
通径分析是一种在回归基础上拓展,用以处理具有较为复杂变量关系的统计学方法。根据具体的专业知识,建立变量间的直接联系图,构造并拟合通径分析模型,使之更为合理地解释变量间的数量关系。通径分析与一次性多重线性回归分析相比,能分离出各个变量对反应变量的直接效应与间接效应。
四、自变量间交互作用的回归模型
生物医学研究的问题常常涉及到自变量间乘积项对反应变量作用的情况,统计学为处理此类问题提供了方法,即拟合有交互作用项的回归模型。
[案例讨论参考答案]
案例13-1 (1)由相关分析结果可见:三个自变量(X1,X2,X3)与反应变量Y的相关系数很小(<0.23);而三个自变量间的相关系数很大(>0.49)。
(2)这些与简单回归情况相悖的结果是由于三个自变量的共线性。
[电脑实验程序及结果解释]
实验13-1 多重线性回归、逐步回归与全子集回归
程序13-1 例13-1数据的多重线性回归、逐步回归与全子集回归
02 INPUT x1-x4 y;
03 DATALINES;
04 1300 20.0 80 0.45 0.066
05 ……… 06 1436 28.0 68 2.00 0.099
07 ;
08 PROC REG CORR; 数据块结束; 调用REG过程进行回归分析,要求输出相关阵CORR; 定义并读入变量x1-x4和y; 标志数据块开始; 4
09 MODEL y=x1-x4 /PARTIAL STB; 指定回归模型,要求输出每个回归变量的偏回归
杠杆图PARTIAL和标准化回归系数STB; 10 PROC REG ;
11 MODEL y=x1-x4 /SELECTION=STEPWISE ;
12 PROC REG ;
13 MODEL y=x1-x4 /SELECTION=RSQUARE ;
14 RUN; 调用REG过程; 按指定模型进行逐步回归分析; 调用REG过程; 按指定模型进行定全子集回归分析; 运行程序;
运行结果:
Output窗口:
运行结果:
The REG Procedure
Correlation
(相关系数阵)
Variable x1 x2 x3 x4 y
x1 1.0000 -0.1412 0.3949 -0.5684 0.8080
x2 -0.1412 1.0000 -0.0728 0.3840 0.0172 x3 0.3949 -0.0728 1.0000 -0.1464 0.2785 x4 -0.5684 0.3840 -0.1464 1.0000 -0.6796 y 0.8080 0.0172 0.2785 -0.6796 1.0000
The REG Procedure
Model: MODEL1
Dependent Variable: y
Analysis of Variance
(回归模型的方差分析表)
Sum of Mean
Source DF Squares Square F Value Pr > F Model 4 0.06396 0.01599 17.59 <.0001 Error 19 0.01727 0.00090903
Corrected Total 23 0.08123
5
Root MSE(误差均方平方根) 0.03015 R-Square(R) 0.7874
Dependent Mean(反应变量均值) 0.08708 Adj R-Sq(调整R2) 0.7426
Coeff Var(反应变量变异系数) 34.62214
Parameter Estimates
(参数估计及有关统计量)
Parameter Standard Standardized Variable DF Estimate Error t Value Pr > |t| Estimate
(回归系数参数估计)(参数估计的标准误) (标准化偏回归系数) Intercept 1 -0.14166 0.06916 -2.05 0.0546 0 x1 1 0.00011619 0.00002748 4.23 0.0005 0.59249 x2 1 0.00449 0.00190 2.36 0.0289 0.27274 x3 1 -0.00000655 0.00069083 -0.01 0.9925 -0.00110 x4 1 -0.03468 0.01081 -3.21 0.0046 -0.44770 2
The REG Procedure
Model: MODEL1
Partial Regression Residual Plot
(偏回归残差散点图)
y y y
Intercept x1 x2
y y
6
x3 x4
逐步回归分析结果:
(逐步回归结果)
(变量x1进入模型)
Analysis of Variance
(模型方差分析)
7
The REG Procedure Model: MODEL1 Dependent Variable: y Stepwise Selection: Step 1 Variable x1 Entered: R-Square = 0.6529 and C(p) = 11.0195 Sum of Mean Source DF Squares Square F Value Pr > F Model 1 0.05303 0.05303 41.38 <.0001 Error 22 0.02820 0.00128 Corrected Total 23 0.08123 Parameter Standard Variable Estimate Error Type II SS F Value Pr > F Intercept -0.13529 0.03534 0.01879 14.66 0.0009 x1 0.00015845 0.00002463 0.05303 41.38 <.0001
Bounds on condition number: 1, 1
----------------------------------------------------------------------------------------------------- Stepwise Selection: Step 2
Variable x4 Entered: R-Square = 0.7246 and C(p) = 6.6117(变量x4进入模型)
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 2 0.05886 0.02943 27.62 <.0001
Error 21 0.02237 0.00107
Corrected Total 23 0.08123
Parameter Standard
Variable Estimate Error Type II SS F Value Pr > F
Intercept -0.05000 0.04867 0.00112 1.06 0.3160
x1 0.00012217 0.00002729 0.02134 20.03 0.0002
x4 -0.02522 0.01078 0.00582 5.47 0.0293
Bounds on condition number: 1.4772, 5.9088
----------------------------------------------------------------------------------------------------- Stepwise Selection: Step 3
Variable x2 Entered: R-Square = 0.7874 and C(p) = 3.0001(变量x2进入模型)
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 3 0.06396 0.02132 24.69 <.0001
Error 20 0.01727 0.00086358
8
Corrected Total 23 0.08123
Parameter Standard
Variable Estimate Error Type II SS F Value Pr > F
Intercept -0.14200 0.05790 0.00519 6.01 0.0235
x1 0.00011608 0.00002470 0.01907 22.08 0.0001
x2 0.00449 0.00185 0.00510 5.91 0.0246
x4 -0.03470 0.01046 0.00950 11.00 0.0034
Bounds on condition number: 1.7157, 13.18
----------------------------------------------------------------------------------------------------- All variables left in the model are significant at the 0.1500 level.
No other variable met the 0.1500 significance level for entry into the model.
(说明:进入模型的变量均在0.15的水平上有统计学意义)
Summary of Stepwise Selection
(逐步选择汇总)
Variable Variable Number Partial Model
Step Entered Removed Vars In R-Square R-Square C(p) F Value Pr > F
(入选变量)(剔除变量)(模型中变量个数) (偏R ) (模型R)
1 x1 1 0.6529 0.6529 11.0195 41.38 <.0001 2 x4 2 0.0717 0.7246 6.6117 5.47 0.0293 3 x2 3 0.0628 0.7874 3.0001 5.91 0.0246 22
全子集回归分析结果:
The REG Procedure
Model: MODEL1
Dependent Variable: y
R-Square Selection Method
(R选择法)
9 2
Number in
Model R-Square Variables in Model 1 0.6529 x1
1 0.4618 x4
1 0.0776 x3
1 0.0003 x2
------------------------------------------- 2 0.7246 x1 x4
2 0.6705 x1 x2
2 0.6548 x1 x3
2 0.5526 x2 x4
2 0.4946 x3 x4
2 0.0790 x2 x3
------------------------------------------- 3 0.7874 x1 x2 x4 3 0.7248 x1 x3 x4 3 0.6722 x1 x2 x3 3 0.5874 x2 x3 x4
-------------------------------------------
4 0.7874 x1 x2 x3 x4
实验13-2 具有交互项的回归模型
程序13-2 例13-6数据具有交互项的回归
02 INPUT x1 x2 y @@; 定义并连续读入变量x1、x2和y; 03 DATALINES; 标志数据块开始;
04 1 2 43 1 4 41 1 6 37 05 ………
06 4 7 32
07 ; 数据块结束;
10
08
09 PROC GLM ; MODEL y=x1 x2 x1*x2; 调用GLM过程; 指定具有交互项的多重线性回归模型; 10 RUN; 运行程序;
运行结果:
Output窗口:
The GLM Procedure
Dependent Variable: y
Sum of
Source DF Squares Mean Square F Value Pr > F Model 3 190.2598000 63.4199333 277.73 <.0001 Error 12 2.7402000 0.2283500
Corrected Total 15 193.0000000
R-Square Coeff Var Root MSE y Mean
0.985802 1.318234 0.477860 36.25000
Source DF Type I SS Mean Square F Value Pr > F x1 1 36.4500000 36.4500000 159.62 <.0001 x2 1 149.5269044 149.5269044 654.81 <.0001 x1*x2 1 4.2828956 4.2828956 18.76 0.0010
Source DF Type III SS Mean Square F Value Pr > F x1 1 19.95884020 19.95884020 87.40 <.0001 x2 1 47.84922385 47.84922385 209.54 <.0001 x1*x2 1 4.28289559 4.28289559 18.76 0.0010
Standard
Parameter Estimate Error t Value Pr > |t| Intercept 49.47549992 0.72648054 68.10 <.0001 x1 -2.53529995 0.27118284 -9.35 <.0001 11
x2 -1.94362693 0.13426906 -14.48 <.0001
x1*x2 0.22117616 0.05107050 4.33 0.0010
实验13-3 偏相关系数的计算
程序13-3 例13-1数据偏相关系数的计算
02 INPUT x1-x4 y; 03 DATALINES; 04 1300 20.0 80 0.45
05 ……… 06 1436 28.0 68 2.00
07 ;
08 PROC CORR;
09 10 VAR y x1; PARTIAL x2-x4; 定义并读入变量x1-x4和y; 标志数据块开始; 0.066 0.099 数据块结束; 调用CORR过程进行偏相关分析; 指定计算相关系数的变量y和x1; 指定要扣除其影响的变量x2-x4; 调用REG过程进行回归分析;
指定回归模型,要求输出各自变量偏相关系数的平方;
运行程序; 11 PROC REG; 12 MODEL y=x1-x4/PCORR2; 13 RUN;
运行结果:
Output窗口:
偏相关分析结果:
The CORR Procedure
3 Partial Variables: X2 X3 X4
2 Variables: Y X1
Simple Statistics
Variable N Mean Std Dev Sum Minimum Maximum X2 24 25.24583 3.60687 605.90000 20.00000 35.00000 X3 24 71.08333 9.97787 1706 57.00000 92.00000 X4 24 1.36375 0.76708 32.73000 0.40000 3.00000 Y 24 0.08708 0.05943 2.09000 0.00100 0.22200 X1 24 1404 303.05818 33684 786.00000 1844 12
Simple Statistics
Partial Partial
Variable Variance Std Dev
(偏方差) (偏标准差) X2
X3
X4
Y 0.00168 0.04094
X1 60174 245.30410
Pearson Partial Correlation Coefficients, N = 24
Prob > |r| under H0: Partial Rho=0
(偏相关系数阵)
Y X1
Y 1.00000 0.69620
0.0005
X1 0.69620 1.00000 0.0005
REG过程输出结果:
The REG Procedure
Model: MODEL1
Dependent Variable: Y
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F Model 4 0.06396 0.01599 17.59 <.0001 Error 19 0.01727 0.00090903
Corrected Total 23 0.08123
13
Root MSE 0.03015 R-Square 0.7874
Dependent Mean 0.08708 Adj R-Sq 0.7426
Coeff Var 34.62214
Parameter Estimates
Parameter Standard Squared Partial Variable DF Estimate Error t Value Pr > |t| Corr Type II
Intercept 1 -0.14166 0.06916 -2.05 0.0546 (偏相关系数平方) X1 1 0.00011619 0.00002748 4.23 0.0005 0.48470 X2 1 0.00449 0.00190 2.36 0.0289 0.22724 X3 1 -0.00000655 0.00069083 -0.01 0.9925 0.00000473 X4 1 -0.03468 0.01081 -3.21 0.0046 0.35135
实验13-4 自变量共线性对回归结果的影响
程序13-4 共线性自变量对回归结果的影响
02 INPUT x1 x2 x3; 定义并读入变量x1、x2和x3;
03 Y=10+2*x1+3*x2+1.5*x3+RANNOR(0); 从正态总体N(10+2X1+3X2+1.5X3 ,12)中随机抽取相应的Y; 04 OUTPUT; 05 CARDS;
06 1.1 1.1 1.7
07 1.4 1.5 1.5
08 1.7 1.8 2.8
09 1.7 1.7 1.7
10 1.8 1.9 1.9
11 1.8 1.8 1.8
12 1.9 1.8 3.8
13 2.0 2.1 2.1
14 2.3 2.4 1.4
15 2.4 2.5 1.5
写入实据集; 标志数据块开始; 14
16 ;
17 PROC REG CORR; 数据块结束; 调用REG过程进行回归分析,要求输出相关阵CORR; 18 MODEL y=x1 x2 x3; 指定回归模型; 19 RUN; 运行程序;
运行结果:
Output窗口:
The REG Procedure
Correlation
Variable x1 x2 x3 Y x1 1.0000 0.9860 -0.0163 0.8241 x2 0.9860 1.0000 -0.1140 0.7703 x3 -0.0163 -0.1140 1.0000 0.4700 Y 0.8241 0.7703 0.4700 1.0000
The REG Procedure
Model: MODEL1
Dependent Variable: Y
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F Model 3 43.31511 14.43837 21.34 0.0013 Error 6 4.05896 0.67649
Corrected Total 9 47.37407
Root MSE 0.82249 R-Square 0.9143
Dependent Mean 22.37411 Adj R-Sq 0.8715
Coeff Var 3.67609
Parameter Estimates
Parameter Standard
15
Variable DF Estimate Error t Value Pr > |t| Intercept 1 10.25225 1.56682 6.54 0.0006 x1 1 3.29160 5.25317 0.63 0.5540 x2 1 1.59999 4.96987 0.32 0.7584
x3 1 1.57825 0.45568 3.46 0.0134
分析:从相关系数阵可以观察到变量x1与x2之间具有较强的相关性(r=0.9860),而变量x3则与x1、x2独立。从回归分析的结果可以发现自变量x1与x2的回归系数估计值与原总体关系差别很大,而x2的回归系数估计值则相近。进一步重复该实验,可以观察到x1与x2的回归系数估计值变化很大,甚至发生符号的改变。
[思考与练习的参考答案]
k(1?R2)
1. R?R?=0.44-[12(1-0.44)]/[50-12-1]=0.2584
n?k?1
2a
2
2. 在多重回归分析中,将某一自变量的值都乘以10,该自变量的偏回归系数变为原偏回归系数数值的1/10倍,标准化偏回归系数不变。
3. X1、X2、X3、X4对Y的多重线性回归
检验回归方程整体意义的方差分析表
变异来源 回归模型 残差 总变异
自由度 4 12 16
SS 2950.6417 2106.7360 5057.3776
MS 737.6604 175.5613
F 4.20
P 0.0235
偏回归系数及其检验结果
变量 截距 X1 X2 X3 X4
自由度 1 1 1 1 1
回归系数 23.4237 0.4753 1.1930 -0.8136 0.6305
标准误 35.3449 0.7139 0.3979 0.5006 0.4309
t值 0.66 0.67 3.00 -1.63 1.46
P值 0.5200 0.5182 0.0111 0.1300 0.1691
标准偏回归系数 0 0.1696 1.0737 -0.3715 0.5603
可列出回归方程:
16
??23.4237?0.4753X?1.1930X?0.8136X?0.6305X Y1234
总体模型有意义,说明从整体上而言,用这四个自变量构成的回归方程解释因变量有统计学意义。但这四个变量中,只有变量X2的偏回归系数在0.05的概率水平下具有统计学意义。原则上应考虑回归方程的实际意义,建立不包含无统计学意义自变量的回归方程。
4.分别以简单线性、二次与三次多项式拟合的回归模型结果如下表所示:
拟合不同模型的结果
模型 简单线性
回归方程
??10.2359?0.0345x Y
MSE
F值 P值
R2
0.2607 4.20 0.0795 0.3751
??10.4197?0.0013二次函数 Yx2 0.2429 5.91 0.0453 0.4579
??10.4816?0.00006三次函数 Yx3 0.2279 7.68 0.0277 0.5230
可见,在以上的三种模型中,以三次多项式模型为优。 5. Y 关于X1、X2、X3、X4、X5、X6的线性回归:
检验回归方程整体意义的方差分析表
变异来源 回归模型 残差 总变异
自由度 6 4 10
SS 1047.0611 421.1207 1468.1818
MS 174.5102 105.2802
F 1.66
P 0.3252
偏回归系数及其检验结果
变量 截距 X1 X2 X3 X4 X5 X6
自由度 1 1 1 1 1 1 1
回归系数 18.30200 -3.51820 0.91368 1.22379 0.76802 -1.00394 1.14764
标准误 17.53866 3.22788 9.22769 1.38695 3.42170 2.34739 1.18261
t值 1.04 -1.09 0.10 0.88 0.22 -0.43 0.97
P值 0.3556 0.3370 0.9259 0.4274 0.8334 0.6909 0.3868
归系数 0 -1.13809 0.21688 0.65356 0.21740 -0.63994 1.09215
总体模型无统计学意义,说明从整体上而言,不能用这六个自变量构成的回归方程解释因变量。这六个变量的偏回归系数在0.05的概率水平下均与0无统计学差异。
17
通过相关分析,其结果如下表所示:
各变量的简单相关系数
Variable
X1
1.0000 0.8346 0.8401 0.8676 0.3246 0.5346 0.1568
X2
0.8346 1.0000 0.7400 0.8017 0.6580 0.4586 0.0047
X3
0.8401 0.7400 1.0000 0.7168 0.2065 0.4209 0.3413
X4
0.8676 0.8017 0.7168 1.0000 0.3747 0.6084 0.2971
X5
0.3246 0.6580 0.2065 0.3747 1.0000 0.6403 0.0491
X6
0.5346 0.4586 0.4209 0.6084 0.6403 1.0000 0.5808
X6
0.1568 0.0047 0.3413 0.2971 0.0491 0.5808 1.0000
X1 X2 X3 X4 X5 X6 X6
结果显示:(1)自变量中存在着较强的相关,说明存在自变量共线的情况;(2)除X6以外,其它自变量和因变量的相关都较弱。
此外,相对于变量数目而言,这个问题的样本量过小。
[补充练习题]
一、选择题
(一)A1型:每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。
1. 逐步回归分析中,若增加引入的自变量,则__________。
A.回归平方和与残差平方和均增大 B. 回归平方和与残差平方和均减少 C.总平方和与回归平方和均增大 D. 回归平方和增大,残差平方和减少 E. 总平方和与回归平方和均减少
2. 多重线性回归分析中,若对某一自变量的值乘以一个不为零的常数K, 则有__________。 A. 该偏回归系数值不变 B. 该偏回归系数值为原有偏回归系数值的1/K倍 C. 该偏回归系数值会改变,但无规律 D. 所有偏回归系数值均会改变 E. 所有偏回归系数值均不会改变
3. 多重线性回归分析中,若对某一自变量的值加上一个不为零的常数K,则有__________。 A. 截距和该偏回归系数值均不变 B.该偏回归系数值为原有偏回归系数值的K倍
18
C. 该偏回归系数值会改变,但无规律 D.截距改变,但所有偏回归系数值均不改变 E. 所有偏回归系数值均不会改变
4. 多重线性回归分析中,能直接反映自变量解释因变量变异数量的指标为 __________。
A. 复相关系数 B. 简单相关系数 C. 确定性系数
D. 偏回归系数 E. 偏相关系数
5. 多重线性回归分析中的共线性是指__________。
A. Y关于各个自变量的回归系数相同 B.Y关于各个自变量的回归系数与截距都相同
C. Y变量与各个自变量的相关系数相同 D.Y与自变量间有较高的复相关
E. 自变量间有较高的相关性
(二)A2型:每一道题以一个小案例出现,其下面都有A、B、C、D、E五个备选答案,,请从中选择一个最佳答案。
由具有X1、 X2 、X3三个变量的样本数据计算,获得这三个变量的简单相关系数如下:
变量
X1
X2
X3
1. 扣除X1的影响后,X2与X3的偏相关系数为__________。
A. 0.93941 B. 0.88403 C. 0.84897
D. 0.47749 E. 0.76472
2. 扣除X2的影响后,X1与X3的偏相关系数为_________。
A. 0.11551 B. 0.88403 C. 0.84897
D. 0.47749 E. 0.76472
19 X1 1.00000 0.84897 0.93941 X2 0.84897 1.00000 0.88403 X3 0.93941 0.88403 1.00000
3. 扣除X3的影响后,X1与X2的偏相关系数为_________。
A. 0.11551 B. 0.88403 C. 0.84897 D. 0.47749 E. 0.76472
(三)A3/A4型:以下提供若干案例,每个案例下设若干道题目。请根据题目所提供的信息,在每一道题下面的A、B、C、D、E五个备选答案中选择一个最佳答案。 (第1~3题共用题干)
为了探讨大学生肺活量与身高、体重的关系,获得下表数据:
身高 (cm) X1 135.1 139.9 163.6 156.2 167.8 165.5 155.1 149.4
1. 若将上表中以厘米为单位的身高数据替换为以米为计量单位,以肺活量为反应变量, 身高、体重为自变量,拟合所得的线性回归方程与原表数据所得的方程相比_________。 A. 截距与两个偏回归系数不会改变
B. 截距会改变,而两个偏回归系数不会改变
C. 截距与体重的偏回归系数不会改变,身高的偏回归系数改变 D. 截距与身高的偏回归系数不会改变,体重的偏回归系数改变 E. 截距不会改变,身高与体重的偏回归系数均会改变
2. 若将上表中以公斤为单位的体重数据替换为以市斤为计量单位,以肺活量为反应变量, 身高、体重为自变量,拟合所得的线性回归方程与原表数据所得的方程相比_________。
20
体重 (kg) X2 32.0 30.4 46.2 37.1 41.5 49.5 44.7 33.9
肺活量 (L)
Y 1.75 2.00 2.75 2.75 2.75 3.00 2.75 2.25
A. 截距与两个偏回归系数不会改变
B. 截距会改变,而两个偏回归系数不会改变
C. 截距与体重的偏回归系数不会改变,身高的偏回归系数改变
D. 截距与身高的偏回归系数不会改变,体重的偏回归系数改变
E. 截距不会改变,身高与体重的偏回归系数均会改变
3. 若将上表中以升为单位的肺活量数据替换为以毫升为计量单位,以肺活量为反应变量, 身高、体重为自变量,拟合所得的线性回归方程与原表数据所得的方程相比_________。
A. 截距与两个偏回归系数不会改变
B. 截距会改变,而两个偏回归系数不会改变
C. 截距与体重的偏回归系数不会改变,身高的偏回归系数改变
D. 截距与身高的偏回归系数不会改变,体重的偏回归系数改变
E. 截距、身高与体重的偏回归系数均会改变
(四)B1型:以下提供若干组题目,每组题目共用题目前列出的A、B、C、D、E五个备选答案。请从中选择一个与问题关系最密切的答案。某个备选答案可能被选择一次、多次或不被选择。
A. 截距不变,但变量Xi的偏回归系数是原偏回归系数的1/k倍
B. 截距不变,且每个偏回归系数为原偏回归系数的1/k倍
C. 截距改变,而各个偏回归系数不变
D. 截距和每个偏回归系数都扩大到原数值的k倍
E. 截距扩大到原数值的k倍,而各个偏回归系数不变
1. 自变量Xi的值扩大到原数值的k倍,会使线性回归方程的__________。
2. 自变量Xi的值加上非零的常数k ,会使线性回归方程的__________。
3. 反应变量Y的值扩大到原数值的k倍,会使线性回归方程的__________。
4. 所有自变量的值同时扩大到原数值的k倍,会使线性回归方程的__________。
5. 所有自变量和反应变量Y的值都同时扩大到原数值的k倍,会使线性回归方程的 __________。
21
二、是非题
1. 整体回归效应的假设检验在?水平下拒绝H0,表示引入回归方程中的每一个自变量都在?水平下有效地解释了因变量Y的变异。 ( )
2. 改变某一自变量的某一个数值,只会使该自变量的偏回归系数值改变。 ( )
3. 改变因变量Y的某一个数值,将会导致回归方程的所有偏回归系数值改变。 ( )
4. 在具有k个自变量的多重回归模型基础上,减少一个自变量,会导致回归平方和的减少。 ( )
5. 用同一样本数据,无论拟合的多重线性回归模型包含的自变量有多少,其总变异(SST)是不变的。 ( )
6. 若有X1 、X2、 X3三个变量的数据,X2、X3的偏相关系数(r2,31)是X3关于X1线性回归的残差与X2的简单相关系数。 ( )
7. 逐步回归选择变量的方法一般情况下与全回归法、前向性和后向性法所获得的结果相同。 ( )
8. 多重共线性是指Y关于各个自变量的回归直线呈重叠状态。 ( )
9. 在n 个样本含量的基础上增加一个观测数据后所得的线性回归方程与n个数据所得的回归方程相比,除截距相同外,各个偏回归系数均有改变。 ( )
[参考答案]
一、选择题
(一) 1.D 2.B 3.D 4.C 5.E
(二) 1.D 2.E 3.A
(三) 1.C 2.D 3.E
(四) 1. A 2.C 3.D 4.B 5. E
二、是非题
1.× 2.× 3. ? 4. ? 5. ?
6.? 7.× 8. × 9. ×
(叶鹰 董时富)
22
本文关键词:回归方程,由笔耕文化传播整理发布。
本文编号:239481
本文链接:https://www.wllwen.com/jingjilunwen/touziyanjiulunwen/239481.html