基于Lasso的我国股票价格影响因素分析
本文关键词:基于Lasso的我国股票价格影响因素分析
更多相关文章: 上证综指月收益率 多元线性模型 逐步回归 Lasso
【摘要】:自改革开放以来,我国的经济取得快速发展,我国的国内成产总值(GDP)从1990年的18,774.00(亿元)增长到2014年的634,043.40(亿元)。与此同时,我国证券市场也已经得到了较全面的成长与完善,对社会经济发展做出了不可轻忽的贡献。虽然世界上从建立股票到至今已有接近四百年的历史,中国证券市场起步相对甚晚,但成长速度及规模不容小觑。首先,从成交情况看,据中国证监会统计,2013年中国股票成交金额累计468,728.60(亿元),2014年较上年增长58.71%,而2015年截至12月底则累计达到2,550,538.30(亿元),较2014年增长超过200%。其次,就交易活跃度来看,单上海证券交易所而言,2015年的总成交量达1,024,856,267.14(万股),且2015年的日最高成交量达到8,607,174.87(万股)。如此可以这样说,证券中的股票市场行情可以用来反映我国宏观国民经济运行的“晴雨表”,于现代市场经济而言具有不容轻视的作用。而对于中国而言,一个股票市场发起晚,只有20多年股票历史的国家,我国股票市场仍存在诸多变数。2014年12月和2015年一月,市场几乎是在剧烈震荡中度过的,2015年注定是中国股市从疯牛到股灾难忘的一年。从牛市起步到疯牛的形成,再到股灾爆发流动性完全丧失,出现有6天跌1000点、2个月跌3000点的怪象,这一切仅在半年多时间内完成,如梦亦如幻。证券中的股票市场行情是可以反映我国宏观国民经济运行的“晴雨表”,所以研究股票市场价格具有十分重要的意义。本文旨在研究上证综指的风险因素。特别,针对我国国民经济以及股市情况,初步挑出了28个待选因子,这些因子涵盖了体现物价指数、经济景气指数、货币政策、利率政策、财政政策、对外贸易外汇以及体现股市本身交易活动情况的交易量和影响我国乃至世界的道琼斯工业平均指数。多元线性回归模型在研究金融证券股票市场有很好的实用价值,可用于识别及解释多个风险因素对结果变量的影响。在建立多元线性回归模型前,为了详尽地诠释因变量,我们往往事先尽可能多地搜集影响因子,不论是纵向影响还是横向影响,不论直接影响的还是间接影响的,我们都希望加入到模型中,以更好地解释因变量如何受这些因子影响。当因子太多时,一方面,这些因子可能存在多重线性关系,传统的最小二乘回归方法不适用;另一方面,因子太多不利于我们对模型的解释。这时候,岭回归(ridge regression)通过采用L_2惩罚对模型的回归系数进行压缩以解决多重共线性问题,得到的模型具有较好的稳定性。但是岭回归终不能将回归系数压缩至0,不能进行变量选择,导致其模型较难解释。但是我们希望从备选因子中挑选出对因变量有显著影响的少量因子,这时候,我们通常采用变量选择方法。传统的变量选择方法包括向前逐步回归(forward regression)、向后逐步回归(backward regression)和结合二者的逐步回归(stepwise regression),这些方法多是基于一些信息量准则,包括AIC和BIC。这些信息准则是一个组合优化问题,当维数很高时,将会出现NP-hard的问题,即计算时间将会随着维数的增加呈现指数的增长,并且这些方法统计性质不清楚。最近,Tibshirani提出的Lasso方法1通过对系数进行L 1判罚,能将某些极小的系数直接压缩至0,自动达到了变量选择的目的,并且同时估计了显著变量的回归系数,同时完成了选择及估计,因此计算极为简单。最近的很多研究(FanLi2001以及FanPeng2004)显示Lasso方法有相合及渐近正态性。本文结合多元回归模型及Lasso方法识别并估计上证综指的风险因素。特别,本文选取了从2010.01月到2015.12月的上证综指及28个风险因素的月度数据。首先,我们对上证综指数据进行对数变换,以减少其异方差,此外用对数变换后的数据进行建模有更好的解释。其次,我们对数据进行了单位根检验——ADF检验,以考察变量的平稳性。接着,为了探究被解释变量与解释变量的长期均衡关系,本文对因变量和自变量进行了EG协整检验,发现均有协整关系。然后我们继续考查了被解释变量和解释变量之间的格兰杰因果关系,最终结果表明平稳后的解释变量均是上证综指月收益率的格兰杰原因。最后,我们利用标准化的数据进行Lasso建模。为比较,本文的第四部分也给出了基于AIC准则的三种逐步回归方法估计,得到了各个方法下的模型结果并进行了对比。比对显示两种方法均选出了上证综指月成交量增长率、消费者满意度指数同比增量、财政收入增长率以及道琼斯指数月收益率,且对上证综指月收益率显著性影响程度排名前两位的均是上证综指月成交量增长率与道琼斯指数月收益率,这与成交量和收益率是股市市场最重要的两个指标的事实无可厚非。比对结果还显示Lasso方法得到了更好的模型,具体表现在:1. Lasso结果有更好的解释性,Lasso选出的是5个变量,而逐步回归选出了8个变量,并且在汇率方面,逐步回归选出的是港元方面汇率,而Lasso选出的则是最具有代表性的美元方面汇率;2.相对于逐步回归分析方法,Lasso结果有更小的预测误差,拟合效果更优。本文研究显示上证综指月成交量增长率、消费者满意度指数同比增量、美元期末汇率增量、财政收入增长率以及道琼斯指数月收益率5个变量对上海综合指数月收益率有显著影响。
【学位授予单位】:西南财经大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:F832.51
【相似文献】
中国期刊全文数据库 前10条
1 王红;童恒庆;魏平;;进出口贸易额预测的逐步回归建模研究[J];统计与决策;2006年02期
2 徐然然;;企业债券系统性风险的实证研究[J];东方企业文化;2011年04期
3 闻捷;;基于逐步回归的江苏外商直接投资影响分析[J];商场现代化;2006年22期
4 苏博;刘鲁;方锋锋;;基于逐步回归的中国粮食价格预警研究[J];企业经济;2006年01期
5 刘明;王仁曾;;基于t检验的逐步回归的改进[J];统计与决策;2012年06期
6 彭赓;苏亚军;李娜;;失业率预测研究——基于网络搜索数据及改进的逐步回归模型[J];现代管理科学;2013年12期
7 孙桂丽;;多元回归分析在教育预测研究中的运用[J];经济研究导刊;2008年06期
8 王卫平;霍世刚;周宇;;哈密市城市居民生活质量综合评价[J];当代经济;2011年07期
9 杨宝华;;巨灾影响上市企业价值的时间路径及成因分析[J];重庆大学学报(社会科学版);2011年04期
10 杨静;姜会明;;长春市农民收入的影响因素分析[J];农业经济;2014年02期
中国重要会议论文全文数据库 前2条
1 朱阳;丛培盛;朱仲良;;逐步回归中函数形式对于模型的影响[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年
2 潘松;魏民祥;;某型航空无人飞行器用发动机模型辨识的研究[A];第二十七届中国控制会议论文集[C];2008年
中国硕士学位论文全文数据库 前3条
1 张兴凤;基于Lasso的我国股票价格影响因素分析[D];西南财经大学;2016年
2 廖慧敏;数据缺失及相关因素对逐步回归变量筛选的影响[D];复旦大学;2011年
3 高照;基于逐步回归的新马海峡航行风险模型研究[D];大连海事大学;2013年
,本文编号:1157813
本文链接:https://www.wllwen.com/jingjilunwen/jinrongzhengquanlunwen/1157813.html