偏t正态数据下基于最小一乘的回归估计和变量选择
本文关键词:偏t正态数据下基于最小一乘的回归估计和变量选择
更多相关文章: 偏t正态数据 最小一乘估计 回归插补 线性回归模型 LAD-lasso
【摘要】:在现实生活中,我们收集到的实际数据,特别是某些数量经济和生物医学数据,非常频繁的存在异常值,而且这些数据经常不服从正态分布,而是服从具有一定偏度和尾部占更大比重的分布,这样一些数据的分布一般用偏t正态分布来刻画。于是,对偏t正态数据的统计分析具有重要的理论和实际意义。此外,在实际数据的收集过程中,很多抽样调查数据和实验数据都会受到无回答的干扰或是因为某种原因而丢失。因此,对缺失偏t正态数据的研究也是十分必要的。另一方面,对于呈现重尾分布或带有异常值的数据集,普通最小二乘或极大似然方法因其对异常值的敏感性估计效果可能不会理想,而最小一乘方法对异常值具有良好的耐抗性,并且统计分析结果不依赖于误差项的分布,稳健性比最小二乘和极大似然方法的稳健性好。基于此,论文的主要工作和获得的结果如下:第一:针对来自线性回归模型的有缺失的偏t正态数据,为减少数据中异常值对参数估计的影响,提高回归参数估计的稳健性及准确性,论文选取了回归插补方法处理缺失数据,并运用最小一乘方法估计回归参数,通过随机模拟方式,将论文给出的参数估计方法与极大似然估计方法对比,发现本文的方法是有效可行的。第二:在变量选择方面,为了进一步验证LAD方法的稳健性,对服从偏t正态分布的上证医药卫生指数,我们利用Wang等提出的LAD-lasso方法对其成分股进行了变量选择的实证分析研究,并与基于OLS的lasso方法进行对比,发现LAD-lasso方法在偏t正态分布下变量选择效果是理想的。
【关键词】:偏t正态数据 最小一乘估计 回归插补 线性回归模型 LAD-lasso
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:O212.1;F224;F832.51
【目录】:
- 中文摘要3-4
- 英文摘要4-7
- 1 绪论7-10
- 1.1 研究问题的意义及现状7-9
- 1.1.1 研究意义7
- 1.1.2 研究现状7-9
- 1.2 研究思路与研究内容9-10
- 2 预备知识10-15
- 2.1 最小一乘估计10-12
- 2.1.1 最小一乘回归模型10
- 2.1.2 最小一乘法的性质10
- 2.1.3 最小一乘估计的计算10-12
- 2.2 LAD-lasso方法12-15
- 2.2.1 LAD-lasso方法的提出12-13
- 2.2.2 LAD-lasso的理论性质13
- 2.2.3 调整参数的估计13-15
- 3 缺失偏t正态数据下基于最小一乘的线性回归系数估计15-26
- 3.1 偏t正态数据下线性回归模型15-16
- 3.2 缺失数据及处理16-20
- 3.2.1 缺失数据的产生机制16
- 3.2.2 缺失数据的处理方法16-20
- 3.3 缺失偏t正态数据的线性回归系数估计20-21
- 3.3.1 最小一乘估计20
- 3.3.2 极大似然估计20-21
- 3.4 Monte Carlo模拟21-24
- 3.4.1 完全数据下的回归系数估计模拟研究21-23
- 3.4.2 缺失数据下的回归系数估计模拟研究23-24
- 3.5 实例分析24-26
- 4 偏t正态数据下基于LAD-lasso方法的变量选择实证分析26-31
- 4.1 数据的选取26-27
- 4.2 LAD-lasso变量选择结果分析27-31
- 5 结论与展望31-32
- 5.1 总结31
- 5.2 展望31-32
- 致谢32-33
- 参考文献33-36
- 附录36
- 攻读硕士期间发表的相关论文36
【相似文献】
中国期刊全文数据库 前10条
1 杨丽霞;魏立力;;基于粗糙集方法的有序尺度变量选择[J];宁夏大学学报(自然科学版);2009年02期
2 赵宇;黄思明;;带有变量选择过程的分类模型误差分析[J];数学的实践与认识;2010年17期
3 樊亚莉;徐群芳;;稳健的变量选择方法及其应用[J];上海理工大学学报;2013年03期
4 陶靖轩;多元分析中的变量选择问题研究[J];中国计量学院学报;2001年01期
5 李树军,纪宏金;对应聚类分析与变量选择[J];地球物理学进展;2005年03期
6 陈黎明;赵永红;;转换函数未知时转换模型的变量选择[J];四川大学学报(自然科学版);2011年05期
7 刘民千,张润楚;超饱和设计的变量选择[J];南开大学学报(自然科学版);2000年03期
8 王进;;聚类分析中的距离与变量选择[J];山西财经大学学报;2007年S1期
9 张波;方国斌;;高维面板数据降维与变量选择方法研究[J];统计与信息论坛;2012年06期
10 高仁祥,张世英,刘豹;基于神经网络的变量选择方法[J];系统工程学报;1998年02期
中国重要会议论文全文数据库 前6条
1 张俊华;方伟武;;调查表分析中变量选择的一些方法(英文)[A];中国运筹学会第六届学术交流会论文集(下卷)[C];2000年
2 李洪东;梁逸曾;;高维数据变量选择新方法研究[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年
3 李慷;席裕庚;;复杂过程系统中操作变量选择与定位的方法研究[A];1993年控制理论及其应用年会论文集[C];1993年
4 云永欢;王为婷;梁逸曾;;迭代的保留有信息变量来筛选最佳变量子集的一种多元校正变量选择方法[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年
5 徐登;范伟;梁逸曾;;紫外光谱结合变量选择和偏最小二乘回归同时测定水中重金属镉、锌、钴[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年
6 梁逸曾;李洪东;许青松;曹东升;张志敏;;灰色化学建模与模型集群分析——兼论过拟合、稳健估计、变量选择与模型评价[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年
中国博士学位论文全文数据库 前10条
1 吕晶;几类半参数回归模型的稳健估计与变量选择[D];重庆大学;2015年
2 王康宁;几类高维复杂数据半参数模型的结构识别、变量选择及稳健估计[D];山东大学;2016年
3 王大荣;分散度量模型中的变量选择[D];北京工业大学;2009年
4 王明秋;高维数据下若干回归模型的变量选择问题研究[D];大连理工大学;2012年
5 刘吉彩;生存数据统计模型的变量选择方法[D];华东师范大学;2014年
6 樊亚莉;稳健变量选择方法的若干问题研究[D];复旦大学;2013年
7 唐凯临;变量选择和变换的新方法研究[D];同济大学;2008年
8 董莹;高维共线性统计模型的参数估计与变量选择[D];大连理工大学;2014年
9 叶飞;相对误差准则下的估计理论和变量选择方法的研究[D];清华大学;2013年
10 袁晶;贝叶斯方法在变量选择问题中的应用[D];山东大学;2013年
中国硕士学位论文全文数据库 前10条
1 潘玉婷;含多元非线性结构的高维Logistic模型的同时变量选择及半参数估计[D];中国科学技术大学;2016年
2 刘丹;Cox模型及变系数Cox模型中的变量选择问题研究[D];暨南大学;2016年
3 罗昊;基于自适应LASSO变量选择的Logistic信用评分模型研究[D];东南大学;2016年
4 王双宝;基于变量选择偏差的变量选择过程[D];电子科技大学;2016年
5 温征;纵向和生存数据联合模型的一个变量选择问题[D];云南师范大学;2016年
6 闫湛;混料试验设计变量选择的Cp方法研究[D];广州大学;2016年
7 黄亚慧;偏t正态数据下基于最小一乘的回归估计和变量选择[D];重庆大学;2016年
8 闫闯;多元回归模型中变量选择问题研究[D];黑龙江大学;2011年
9 康赞亮;计量经济学模型变量选择与设定的理论方法研究[D];清华大学;2009年
10 张丹;乘积模型的变量选择[D];河南大学;2014年
,本文编号:720726
本文链接:https://www.wllwen.com/jingjilunwen/hongguanjingjilunwen/720726.html