当前位置:主页 > 管理论文 > 统计学论文 >

稳健稀疏主成分回归的研究及应用

发布时间:2020-08-23 12:45
【摘要】:主成分回归是基于主成分分析提出的一种多元回归方法.它能够有效避免模型中的多重共线性,准确建立因变量与自变量之间的内在联系,故而具有广泛的应用面和不凡的现实意义.然而,异常值的出现极易使得传统主成分回归系数的准确度降低,并且随着数据维度和规模的增大,其难以快速找到真正对主成分产生影响的变量.从而,提高主成分回归的稳健性和稀疏性是很有理论意义和应用价值的.本文基于稳健稀疏主成分分析和稳健主成分回归提出稳健稀疏主成分回归的方法,通过蒙特卡洛数值模拟和实例分析显示出该方法的实用性.它能够帮助我们减轻异常值的干扰;在不破坏主成分优良性质的前提下,挖掘影响因变量最主要的因素,建立稳健的回归模型;力求提高主成分的解释功能,进而为解决实际问题提供有力支撑.本文的研究思路可归纳为三个部分:第一部分分别介绍了稀疏主成分分析、稳健主成分分析和稳健回归的基本原理及算法,并通过蒙特卡洛数值模拟将其与传统方法进行比较,体现出它们在稀疏和稳健方面的优越性;第二部分简述了稳健稀疏主成分分析和稳健主成分回归的基本思想,通过数值模拟展示了方法的有效性,并且将二者有机结合,形成了稳健稀疏主成分回归法;第三部分以”我国铁路客运量的因素分析”为案例,将稳健稀疏主成分回归法应用其上,先是利用稳健稀疏主成分分析对影响因素进行聚类,以此增强主成分的可解释性,而后运用稳健主成分回归建立稳健的回归模型.数值模拟方面,本文比较了传统主成分分析法与稀疏主成分分析法,结果显示稀疏主成分分析法能够有效识别原始数据的生成机制;比较了传统主成分分析法与稳健主成分分析法,结果显示稳健主成分分析法能够有效抵抗自变量中异常点的不良影响;比较了OLS估计、M估计、LMS估计和LTS估计,结果显示OLS估计对于异常点及其敏感,M估计仅在抵抗回归异常值时表现良好,而LMS估计和LTS估计则对于所有类型的异常值均有良好的稳健性.实例分析方面,聚类和回归结果均符合现实意义,说明稳健稀疏主成分回归法可切实提高主成分的解释性,得到稳健的回归模型,对于实际问题的解决极为有效.本文的创新点在于,同时从稀疏性和稳健性两方面入手,对于传统主成分回归进行优化,形成了稳健稀疏主成分回归的方法;详尽描述了该方法的来源及各基本方法的原理和算法,并且对于每种基本方法进行了数值模拟,显示出其有效性;尝试将稳健稀疏主成分回归法运用到现实案例当中,为解决因素分析问题提供了一种新的建模方法.
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:C81
【图文】:

对比图,异常点,诊断图,数据集


逦12逡逑Score邋distance邋(4邋LV)逡逑图3.2邋ROBPCA的异常点诊断图逡逑对比图3.1和图3.2可知,ROBPCA准确地识别出了异常点和112,并将其判逡逑定为不良PCA杠杆点.而传统PCA对异常点出现了邋”掩盖"现象.为避免数据逡逑生成的随机性,将模拟重复200次,分别基于无异常值的数据集逡逑/邋=邋1,2,邋—邋,12}和有异常值的数据集{^,邋/邋=逦对这200次模拟所得逡逑的特征值求均值.结果如下表:逡逑-33邋-逡逑

对比图,异常点,诊断图,对比图


逦3.5逡逑Score邋distance邋{4邋LV)逡逑图3.1传统PCA的异常点诊断图逡逑ROBPCA逡逑12.邋P邋I逦i逦i逦i逦i逦i逦i逦:逡逑0邋12逡逑10邋-逦-逡逑m逦0邋11逡逑o逦8逦-逦-逡逑c逡逑ra逡逑%逡逑乇逡逑6逦_逦_逡逑仁逡逑o逡逑g)逡逑£逦4逦-逦-逡逑0逡逑2逦-逦-逡逑0。◎邋00邋4逡逑0逦-逦-逡逑逦[逦:逦|逦i逦]逦j逦j逦逡逑0逦2逦4逦6逦8逦10逦12逡逑Score邋distance邋(4邋LV)逡逑图3.2邋ROBPCA的异常点诊断图逡逑对比图3.1和图3.2可知,ROBPCA准确地识别出了异常点和112,并将其判逡逑定为不良PCA杠杆点.而传统PCA对异常点出现了邋”掩盖"现象.为避免数据逡逑生成的随机性,将模拟重复200次,分别基于无异常值的数据集逡逑/邋=邋1,2,邋—邋,12}和有异常值的数据集{^,邋/邋=逦对这200次模拟所得逡逑的特征值求均值.结果如下表:逡逑-33邋-逡逑

对比图,诊断图,异常点


逦3.5逡逑Score邋distance邋{4邋LV)逡逑图3.1传统PCA的异常点诊断图逡逑ROBPCA逡逑12.邋P邋I逦i逦i逦i逦i逦i逦i逦:逡逑0邋12逡逑10邋-逦-逡逑m逦0邋11逡逑o逦8逦-逦-逡逑c逡逑ra逡逑%逡逑乇逡逑6逦_逦_逡逑仁逡逑o逡逑g)逡逑£逦4逦-逦-逡逑0逡逑2逦-逦-逡逑0。◎邋00邋4逡逑0逦-逦-逡逑逦[逦:逦|逦i逦]逦j逦j逦逡逑0逦2逦4逦6逦8逦10逦12逡逑Score邋distance邋(4邋LV)逡逑图3.2邋ROBPCA的异常点诊断图逡逑对比图3.1和图3.2可知,ROBPCA准确地识别出了异常点和112,并将其判逡逑定为不良PCA杠杆点.而传统PCA对异常点出现了邋”掩盖"现象.为避免数据逡逑生成的随机性,将模拟重复200次,分别基于无异常值的数据集逡逑/邋=邋1,2,邋—邋,12}和有异常值的数据集{^,邋/邋=逦对这200次模拟所得逡逑的特征值求均值.结果如下表:逡逑-33邋-逡逑

【相似文献】

相关期刊论文 前10条

1 刘伟新;郭东星;;稳健主成分回归及其医学应用[J];中国卫生统计;2011年01期

2 卢二坡;张焕明;;基于稳健主成分回归的统计数据可靠性评估方法[J];统计研究;2011年08期

3 郭东星;刘伟新;;主成分回归中异常点的稳健诊断[J];中国卫生统计;2008年01期

4 沈菊红;;预测农民收入的主成分回归模型[J];安徽农业科学;2008年24期

5 汪晓银;刘大集;祁春节;;我国蔬菜总产的主成分回归模型的构建及预测[J];农业系统科学与综合研究;2006年02期

6 王传华;;主成分回归在全国畜产品管理决策中的应用[J];预测;1989年03期

7 赵海涵;张晓磊;;云南省旅游收入影响因素分析及产业对策研究——基于主成分回归模型[J];学术探索;2018年03期

8 胡虎肇;;基于主成分回归模型的福建省农民增收因素分析[J];台湾农业探索;2010年02期

9 丁亮;赵玉;李维;;湖北省农民增收的宏观经济因素分析——基于主成分回归模型的分析[J];乡镇经济;2007年11期

10 吴曰想 ,张莉苹;上市公司经营业绩的主成分回归实证研究[J];财会月刊;2004年12期

相关会议论文 前10条

1 俞慧强;戈早川;周彤;;主成分回归在分光光度法同时检测多种物质中的应用[A];面向21世纪的科技进步与社会经济发展(下册)[C];1999年

2 王兵;张贤;;基于改进的主成分回归模型的碳排放预测研究[A];中国人口·资源与环境2014年专刊——2014中国可持续发展论坛[C];2014年

3 蒋圣楠;韩东海;孙明;;基于可见/近红外光谱分析技术的小型西瓜生长期的判别研究[A];中国农业工程学会2011年学术年会论文集[C];2011年

4 吴尧;张广智;卢溜;;利用偏最小二乘回归方法进行储层厚度预测[A];2017中国地球科学联合学术年会论文集(三十二)——专题61:工程地球物理技术进展与应用、专题62:油藏地球物理[C];2017年

5 梁逸曾;李洪东;;化学建模中几个重要问题的点滴思考[A];中国化学会第28届学术年会第14分会场摘要集[C];2012年

6 黄娑;王庚;;南通市经济增长和可持续发展问题研究[A];江苏省现场统计研究会第11次学术年会论文集[C];2008年

7 刘颖;彭赓;吕本富;;基于主成分回归的省级政府网站访问量影响因素分析[A];第四届(2009)中国管理学年会——信息管理分会场论文集[C];2009年

8 谢代梁;王保良;黄志尧;李海青;金春晖;鲍立曾;;主成分回归在中药过程软测量中的应用研究[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年

9 李德萍;吴结晶;郭丽娜;;青岛奥运期间(8月份)天气气候分析[A];中国气象学会2006年年会“大气成分与气候、环境变化”分会场论文集[C];2006年

10 侯震梅;周勇;;新疆R&D投入的特征分析[A];21世纪数量经济学(第13卷)[C];2012年

相关博士学位论文 前1条

1 谭善勇;中国城市化的经济增长效应研究[D];首都经济贸易大学;2013年

相关硕士学位论文 前10条

1 刘峥;香肠储藏期亚硝酸盐变化高光谱检测方法研究[D];河南科技大学;2019年

2 王向征;基于MCMC主成分回归的广西GDP增长因素研究[D];广西师范大学;2019年

3 葛海琴;基于稀疏主成分和主成分回归的我国就业问题研究[D];上海交通大学;2017年

4 成可;稳健稀疏主成分回归的研究及应用[D];山东大学;2019年

5 刘子沛;QFII持股偏好及影响因素分析[D];上海外国语大学;2019年

6 沈逍宇;基于主成分回归模型的海外工程项目成本预测研究[D];南昌大学;2019年

7 万婷;基于SOM-PCR模型的房价影响因素研究[D];华中科技大学;2017年

8 姜扬;聚类和主成分回归在经济指标数据中的应用研究[D];吉林大学;2010年

9 程娴;基于稳健主成分回归的润滑油产量预测模型[D];大连理工大学;2017年

10 韩丽香;稳健主成分回归方法在GDP数据可靠性评估中的应用[D];兰州商学院;2013年



本文编号:2801542

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2801542.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户da535***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com