当前位置:主页 > 经济论文 > 股票论文 >

基于数据挖掘技术的A股股价涨跌预测模型研究

发布时间:2020-06-18 16:25
【摘要】:随着中国经济的发展与进步,中国证券市场受到越来越多人的关注,股票已经成为广大投资者进行投资的重要途径。影响股票涨跌的因素很多,其收益若能成功预测,可以有效规避股票投资风险以及消除盲目投资的弊端。本文从构建选股因子指标池出发,接着运用随机森林算法和递归特征消除算法从因子指标池中筛选出合适的因子指标构成指标体系;再根据相应公式计算出股票收益,并将其分为两种状态(涨、跌),将选股研究简化为二分类问题;接着使用样本数据对SVM模型以及BP神经网络模型进行调参处理,挑选出最合适的弱分器,最后分别将SVM模型和BP神经网络模型与AdaBoost模型结合,构造出SVM_AdaBoost模型和BP_AdaBoost模型对股票盈亏进行预测,帮助解决股票投资选择问题。本文首先介绍了A股市场的背景知识,概述了国内外已有的部分研究方法,分析了现有的几种股票预测模型;接着介绍了随机森林算法、递归特征消除算法、SVM模型、AdaBoost模型以及BP神经网络的相关知识;随后对因子池中的五个方面的因子进行了相关阐述。实证环节中选取了A股作为实证研究对象,首先验证了随机森林算法和递归特征消除算法在特征挑选上的可行性,接着分别验证了RBFSVM在不同核函数下的预测表现以及BP神经网络的表现情况,实证表明除了sigmoid-SVM算法表现较差之外,其他分类器均具有不错的性能。然而单一的SVM和BP神经网络模型表现不稳定,为改善这种情况,本文引入AdaBoost算法,构造了SVM_AdaBoost模型和BP_AdaBoost模型。混合模型具备了两方面模型的优势:混合模型可以减少SVM选择核参数的复杂度以及BP神经网络学习率和隐藏层节点选择的问题,而SVM核参数的多样性和BP神经网络的结构特性、学习率以及初始权值导致的多种解使得SVM模型和BP神经网络模型能够训练出多种弱分类器;最后通过AdaBoost能够结合多个分类器和关注错分类样本的特性构造出强分类器,用于对股票收益进行预测。实证结果表明,SVM_AdaBoost模型和BP_AdaBoost模型均比原有的SVM模型以及BP神经网络模型在预测精度上有了一定程度的提升,其中SVM_AdaBoost模型表现最优秀。但是上述模型均存在不稳定的现象,所以还需要针对这一问题进行进一步研究,使得SVM_Ada Boost模型和BP_AdaBoost模型在进行股票涨跌预测时获得更好的效果。
【学位授予单位】:杭州电子科技大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F832.51
【图文】:

技术路线图,算法,模拟预测,选择指标


图 1.1 技术路线图1.3.2 主要创新点第一、应用数据挖掘中的递归特征消除算法和随机森林算法筛选出最相关的因子指标,作为股票投资选择指标体系。第二、基于 SVM 算法和 BP 神经网络算法进行模拟预测,并且用 AdaBoost算法进行改进,构造 SVM-AdaBoost 算法和 Bp-AdaBoost 算法进行模拟预测,择优用于实践。

示意图,支持向量机,示意图,最大化


于 1995 年首先提出的,它是建立在统计学习理论的 VC 理论和结构最小原理的在基础之上,通过对寻找对特定训练样本的学习精度和无错误地识别任意样本的能力之间的最佳折中,以求获得最好的推广能力。支持向量机在解决非线性、小样本及高维模式识别中表现出许多特有的优势,并且在很大程度上解决了维数灾难、过度学习、非线性等问题,在回归估计领域、函数拟合领域、风向预算领域以及模式识别等领域都有很好的建树,是当下最为重要的机器学习理论之一。2.1.1 间隔与支持向量支持向量机根据训练样本的不同包含了由简到繁多个模型。对于训练数据而言,如果线性可分,可以采用硬间隔最大化,即硬间隔支持向量机;如果近似线性可分,可以采用软间隔最大化,即软间隔支持向量机;如果非线性可分,可以使用软间隔最大化与核技巧,即非线性支持向量机。支 持 向 量 机 的 核 心 思 想 是 : 对 于 给 定 的 训 练 集 ( ) ( ) ( ) ,其中 ,在样本空间中找到一个划分超平面,将不同类别的样本区分开。一般情况下,若训练集线性可分,则理论上存在无穷多个划分超平面将训练集正确分割,如图 2.1 所示。

【相似文献】

相关期刊论文 前10条

1 蒋焰;丁晓青;;基于多步校正的改进AdaBoost算法[J];清华大学学报(自然科学版)网络.预览;2008年10期

2 李军;闫佳佳;;基于KELM-AdaBoost方法的短期风电功率预测(英文)[J];控制工程;2019年03期

3 王伦;;Adaboost-SVM多因子选股模型[J];经济研究导刊;2019年10期

4 叶晓波;秦海菲;吕永林;;一种改进的Adaboost-BP算法在手写数字识别中的研究[J];大理大学学报;2019年06期

5 严智;张鹏;谢川;张钰林;李保军;;一种快速AdaBoost.RT集成算法时间序列预测研究[J];电子测量与仪器学报;2019年06期

6 李闻;王显博;;基于Adaboost算法的人脸检测的研究[J];中外企业家;2019年26期

7 李伟;严珂;陆慧娟;叶敏超;;基于Adaboost.RT算法的隧道沉降时间序列预测研究[J];中国计量大学学报;2019年03期

8 王玲娣;徐华;;AdaBoost的多样性分析及改进[J];计算机应用;2018年03期

9 杜瑞超;华继学;翟夕阳;李志鹏;;基于改进Real AdaBoost算法的软件可靠性预测[J];空军工程大学学报(自然科学版);2018年01期

10 王玲娣;徐华;;一种基于聚类和AdaBoost的自适应集成算法[J];吉林大学学报(理学版);2018年04期

相关会议论文 前10条

1 蔡念;金丰;阮恭勤;潘晴;许少秋;;基于AdaBoost算法的图像复原方法[A];第十五届全国图象图形学学术会议论文集[C];2010年

2 ;Using Skin Color and HAD-AdaBoost Algorithm for Face Detection in Color Images[A];Information Technology and Computer Science—Proceedings of 2012 National Conference on Information Technology and Computer Science[C];2012年

3 Wen Feng;;A Novel Lips Detection Method Combined Adaboost Algorithm and Camshift Algorithm[A];2012年计算机应用与系统建模国际会议论文集[C];2012年

4 陆文聪;钮冰;金雨欢;;基于AdaBoost算法的亚细胞位置预测[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年

5 陈宏伟;刘建伟;费向东;;一种半监督环境下的Adaboost算法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年

6 唐晓丹;苗振江;;基于AdaBoost和粒子滤波的目标跟踪[A];第十四届全国图象图形学学术会议论文集[C];2008年

7 于淼;李乃民;王宽全;贾丹兵;闫子飞;;基于AdaBoost的中医舌诊分类算法研究[A];第二次全国中西医结合诊断学术研讨会论文集[C];2008年

8 李晶;陈媛媛;;基于AdaBoost的车牌字符识别模型研究[A];2008中国仪器仪表与测控技术进展大会论文集(Ⅰ)[C];2008年

9 张超;苗振江;;基于AdaBoost的面部信息感知[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年

10 郭翌;汪源源;;基于Adaboost算法的颈动脉粥样硬化判别方法[A];中国仪器仪表学会第十一届青年学术会议论文集[C];2009年

相关重要报纸文章 前1条

1 张阳;5G时代,AI能走多远?[N];人民邮电;2019年

相关博士学位论文 前10条

1 刘冲;模拟电路故障诊断AdaBoost集成学习方法研究[D];大连海事大学;2011年

2 Ebenezer Owusu;[D];江苏大学;2014年

3 习文星;移动背景下视觉的行人检测、识别与跟踪技术研究[D];中国科学院研究生院(上海技术物理研究所);2015年

4 卢金娜;基于优化算法的径向基神经网络模型的改进及应用[D];中北大学;2015年

5 卢岩;交通监控中的运动人体目标检测与跟踪[D];中国科学院研究生院(长春光学精密机械与物理研究所);2011年

6 王小明;可变光照下人脸检测与识别研究[D];华东师范大学;2010年

7 孙元;多媒体语义检索关键问题研究[D];吉林大学;2010年

8 王颖;成熟microRNA识别及其功能预测方法研究[D];哈尔滨工程大学;2016年

9 吴暾华;面向中医面诊诊断信息提取的若干关键技术研究[D];厦门大学;2008年

10 高常鑫;基于上下文的目标检测与识别方法研究[D];华中科技大学;2010年

相关硕士学位论文 前10条

1 王珊珊;基于AdaBoost和ELM的语音情感识别研究[D];天津师范大学;2019年

2 郑伟华;基于MCP惩罚的AdaBoost集成剪枝技术的研究[D];江西财经大学;2019年

3 王成龙;基于AdaBoost算法的车载CAN总线报文异常检测[D];湖南师范大学;2019年

4 王强;基于AdaBoost回归树的电网基建投资模型研究[D];电子科技大学;2019年

5 赵云红;基于Adaboost改进的BP神经网络地表沉陷预测研究[D];西安科技大学;2019年

6 陈天昕;基于AdaBoost与SVM集成算法的高炉炉温状态解析[D];江西财经大学;2019年

7 李淑;人眼特征检测的疲劳驾驶算法研究[D];长江大学;2019年

8 周靖;基于机器学习的《红楼梦》作者问题研究[D];云南大学;2018年

9 刘树灿;基于BP_Adaboost算法的轨面状态识别研究[D];湖南工业大学;2019年

10 邓颀;人脸检测技术的研究与实现[D];杭州电子科技大学;2016年



本文编号:2719524

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/jinrongzhengquanlunwen/2719524.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户74481***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com