线性模型中的变量选择及股票市场实证研究
本文关键词:线性模型中的变量选择及股票市场实证研究
更多相关文章: 线性回归模型 变量选择 Lasso方法 R语言 上证50指数
【摘要】:线性回归分析是各种多元统计分析方法当中应用最为广泛的一种方法,目的是为了研究多个变量间相互依赖的关系。而建立回归模型的过程中,有一个非常重要的问题,就是如何从众多的解释变量中选取对响应变量影响最大的变量,即变量选择问题。变量选择在现代统计学中的地位越来越重要,其中,于1996年Tibshirani提出来的“Lasso”方法受到了学者们的追捧。随着计算机技术的不断发展,现阶段,“Lasso”方法已经被用到各类模型中来解决变量选择问题。本文主要是将“Lasso”方法运用到回归模型,并利用股票市场来进行实证研究。首先,本文从多元回归分析入题,简单介绍了线性回归模型中有偏估计的发展、线性模型中常用的变量选择方法。其次,本文对“Lasso”方法进行了详细的解释,主要介绍了“Lasso”的定义、Lars算法以及”Lasso”的相关方法等等。最后,本文选取上证50指数的5分钟分时数据作为因变量,组成上证50指数的50支股票的相同时间段的5分钟分时收盘价作为自变量进行实证研究。为了体现“Lasso”方法的压缩与选择功能,本文还选择了逐步回归方法作为对比,通过对上证50指数和组成其指数的50只成分股建立回归模型,然后采用“Lasso”方法和Lars算法,运用R软件中Lars程序包对模型进行求解。最后成功选取出了19支对上证50指数影响较大的成分股,通过进一步的拟合分析,发现模型效果是很好的。本文最后还在模型中引入权重,以使用更多的自变量信息,发现引入权重后选择的股票只数并未改变,只是每只股票的系数发生了变化,拟合发现加入权重后效果更好,拟合值与真实值的走势更加接近。可以作为投资者预测股市动态的一部分参考。以达到本文运用变量选择方法研究股市行情的目的。
【关键词】:线性回归模型 变量选择 Lasso方法 R语言 上证50指数
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:F832.51;F224
【目录】:
- 中文摘要3-4
- 英文摘要4-7
- 1 引言7-13
- 1.1 线性模型中有偏估计模型发展概述7-8
- 1.2 线性回归模型中变量选择方法综述8-9
- 1.3 LASSO方法的研究概述9-10
- 1.4 我国的股票市场及上证50指10-12
- 1.4.1 我国的股票市场概述10-12
- 1.4.2 上证50指数简要介绍12
- 1.5 本文的内容框架及主要研究工作12-13
- 2 Lasso方法的介绍13-23
- 2.1 Lasso方法的定义13-14
- 2.2 参数t的估计14-16
- 2.2.1 交叉验证准则14-15
- 2.2.2 广义交叉验证准则15
- 2.2.3 AIC准则15-16
- 2.2.4 BIC准则16
- 2.3 Lasso问题的求解16-19
- 2.3.1 Lasso算法17-18
- 2.3.2 Lars算法18-19
- 2.4 Lasso相关方法的介绍19-23
- 2.4.1 SCAD19-20
- 2.4.2 弹性约束估计Elastic net20-21
- 2.4.3 Adaptive Lasso21-23
- 3 基于变量选择方法的股市实证研究23-40
- 3.1 数据介绍及简要分析23-27
- 3.1.1 数据介绍和简单分析23-25
- 3.1.2 影响上证50的一些外在因素25-27
- 3.2 建立回归模型27-28
- 3.3 结果展示及分析28-37
- 3.3.1 逐步回归28-29
- 3.3.2 LASSO方法29-32
- 3.3.3 结果分析32-36
- 3.3.4 拟合36-37
- 3.4 方法改进37-40
- 4 结论和展望40-41
- 致谢41-42
- 参考文献42-45
- 附录45-59
- A. 程序45-57
- B. 数据57-59
【相似文献】
中国期刊全文数据库 前10条
1 高仁祥,张世英,刘豹;基于神经网络的变量选择方法[J];系统工程学报;1998年02期
2 杨璐,高自友;用神经网络进行变量选择[J];北方交通大学学报;1999年03期
3 赵进文;模型构建中变量选择的影响分析[J];东北财经大学学报;2002年06期
4 李扬;朱建锋;谢邦昌;;变量选择方法及其在健康食品市场研究中的应用探究[J];统计与信息论坛;2013年10期
5 周伟,王建军,李继锐;基于人工神经网络的影响高速公路社会效益量化的变量选择方法[J];西安公路交通大学学报;2000年03期
6 齐晓丽;梁慧超;冯彦妍;;回归模型构建中变量选择的研究[J];河北工业大学学报;2009年06期
7 邓金兰;王彬寰;樊仕利;;变系数模型的变量选择及在股票数据中的应用[J];四川大学学报(自然科学版);2009年06期
8 胡心瀚;叶五一;缪柏其;;上市公司信用风险分析模型中的变量选择[J];数理统计与管理;2012年06期
9 杨金英;;变系数模型的快速变量选择方法[J];统计与决策;2012年05期
10 汪建均;马义中;;结合GLM与因子效应原则的贝叶斯变量选择方法[J];系统工程理论与实践;2013年08期
中国重要会议论文全文数据库 前6条
1 张俊华;方伟武;;调查表分析中变量选择的一些方法(英文)[A];中国运筹学会第六届学术交流会论文集(下卷)[C];2000年
2 李洪东;梁逸曾;;高维数据变量选择新方法研究[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年
3 李慷;席裕庚;;复杂过程系统中操作变量选择与定位的方法研究[A];1993年控制理论及其应用年会论文集[C];1993年
4 云永欢;王为婷;梁逸曾;;迭代的保留有信息变量来筛选最佳变量子集的一种多元校正变量选择方法[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年
5 徐登;范伟;梁逸曾;;紫外光谱结合变量选择和偏最小二乘回归同时测定水中重金属镉、锌、钴[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年
6 梁逸曾;李洪东;许青松;曹东升;张志敏;;灰色化学建模与模型集群分析——兼论过拟合、稳健估计、变量选择与模型评价[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年
中国博士学位论文全文数据库 前10条
1 王大荣;分散度量模型中的变量选择[D];北京工业大学;2009年
2 王明秋;高维数据下若干回归模型的变量选择问题研究[D];大连理工大学;2012年
3 刘吉彩;生存数据统计模型的变量选择方法[D];华东师范大学;2014年
4 樊亚莉;稳健变量选择方法的若干问题研究[D];复旦大学;2013年
5 唐凯临;变量选择和变换的新方法研究[D];同济大学;2008年
6 董莹;高维共线性统计模型的参数估计与变量选择[D];大连理工大学;2014年
7 叶飞;相对误差准则下的估计理论和变量选择方法的研究[D];清华大学;2013年
8 袁晶;贝叶斯方法在变量选择问题中的应用[D];山东大学;2013年
9 王树云;基于Bayes方法和图限制下正规化方法的变量选择问题及其在基因组数据中的应用[D];山东大学;2010年
10 姬永刚;分位数回归中的贝叶斯变量选择[D];东北师范大学;2012年
中国硕士学位论文全文数据库 前10条
1 赵冬琦;基于变量选择的股指期货对股票市场影响的实证研究[D];兰州大学;2015年
2 程勇;多水平模型的变量选择在农户人均收入数据中的应用[D];云南财经大学;2015年
3 邓秋玲;SCAD和ADS方法在比例风险模型中的应用[D];广西大学;2015年
4 韦新星;几种变量选择方法在Cox模型中的应用[D];广西大学;2015年
5 王唯;部分线性模型的变量选择问题研究[D];湘潭大学;2015年
6 徐国盛;若干模型的分位数变量选择[D];浙江财经大学;2016年
7 郭雪梅;部分线性模型中差分估计与SCAD的比较及带有异常点的非负变量选择[D];重庆大学;2015年
8 王艳;复共线性及异方差线性模型中的参数估计与变量选择[D];重庆大学;2015年
9 杨成敏;广义线性模型中的参数估计及变量选择方法研究[D];重庆大学;2015年
10 钟冬梅;线性模型中的变量选择及股票市场实证研究[D];重庆大学;2015年
,本文编号:817852
本文链接:https://www.wllwen.com/guanlilunwen/zhqtouz/817852.html