基于LSSVM-Markov组合模型的股价预测研究
发布时间:2021-08-16 20:36
预测问题一直以来都是学者们研究的重点,随着人工智能的迅速发展,越来越多的学者将机器学习运用到预测研究中,并尝试改进优化算法以提高预测精度。其中SVM(支持向量机)作为机器学习的代表,能较好的解决非线性和高维数等问题,在预测方面具有较大的优势。LSSVM(最小二乘支持向量机)是一种基于SVM的改进算法,将二次规划问题转化为线性求解,大大简化了SVM的求解过程,加快了求解速度。Markov(马尔科夫)模型是一种简单有效的模型,其表现为将来的状态只与现在的状态有关,而与过去的状态无关,对于随机动态非线性的数据有较好的预测能力。LSSVM模型和Markov模型都被广泛的运用到经济金融的预测当中,但单个模型在预测中都存在着预测精度低的问题。而将合适的不同预测模型进行组合优化,是提高模型预测精度的一种有效方法。因此本文为了提高单一模型——LSSVM模型和Markov模型的预测精度,以预测上证综合指数价格为背景,提出了LSSVM-Markov组合模型。首先优化LSSVM模型,其次为了减小模型的预测误差,利用Markov模型对LSSVM模型的预测误差值进行修正。本文的主要研究内容如下:(1)对LSSV...
【文章来源】:江西财经大学江西省
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
线性可分的SVM模型
2LSSVM与Markov模型13的二次规划来实现:11111max(),2..0,1,,,0.nnniijijijiijiniiiyyxxstCiny======(2.11)当训练集为非线性时,如图所示,给定的样本11(x,y),22(x,y),…,,)ii(xy,nxR,无法找到线性分类超平面。如果在原始空间中的最优分类面得不到较为满意的分类结果,则可以将非线性变换转化到某个高维空间变成线性问题,再来求解最优分类面,如图2.2所示。此过程可能比较复杂,不太容易实现,因此可以通过引入核函数来解决这个问题。图2.2二维空间非线性映射到三维空间线性可分所以对于线性不可分的问题,解决思路就是将样本集通过核函数映射到高维数据空间,使得样本集在高维数据空间的像是线性可分的。如果将样本点通过非线性映射到高维特征空间中,在此空间中存在着最优的超平面。超平面进行运算时,只能在空间中进行点积计算,但是如果存在这样一个函数,让高维空间中的内积运算使用输入空间中的函数实现,我们也可以不用确定变换的过程中函数的具体形式是什么。基于此,需要引入合适的核函数,这样可以与高维空间中的内积进行对应,从而完成复杂的运算过程。所以核函数可以将非线性分类转化成线性分类问题。减少了运算难度,加快了求解过程。则目标函数式(2.5)可以转化为:1111()(,)2nnniijijijiijTyyKxx====,(2.12)
基于LSSVM-Markov组合模型的股价预测研究24(2)数据预处理为了提高数据的质量,减少数据之间的数量级差异,使模型的预测效果更好,本文首先对数据进行预处理即归一化处理。(3)核函数选择通过介绍模型常用的几类核函数,如线性、多项和高斯核函数等,通过分析对比选取最优的核函数。(4)参数寻优利用网格搜索法和粒子群法算法进行参数寻优,对比确定最优参数。(5)预测结果及模型评价得到最优参数,建立预测模型,将最优参数的模型样本测试得到预测结果,并对结果及模型进行分析评价。3.2数据来源及数据处理3.2.1数据来源本文从雅虎财经网2在线提取最能反映中国股票市场整体变动情况的上证指数(000001)从2018年1月2日到2019年8月1日,总共383个交易日。每个交易日内上证指数的五个指标的具体数据,包括开盘价、最高价、最低价、成交量和收盘价。股票趋势图如下图所示,从图中可以看出股票的数据波动幅度大具有一定的随机性,且股票是非线性的,每天、每周和每年的数据呈一定的规律在变化,在不稳定变化中又具有一定的重复性,受不同因素的影响股票的变化趋势十分的复杂,也具有一定的不稳定性。图3.2上证指数股票数据图2雅虎财经网:https://finance.yahoo.com/
【参考文献】:
期刊论文
[1]背景值优化的灰色马尔科夫模型在铁路客流预测中的应用[J]. 马彩雯,王晓明. 大连交通大学学报. 2019(01)
[2]利用马尔科夫和灰色模型预测高校师资队伍[J]. 王韦霞. 安庆师范大学学报(自然科学版). 2018(04)
[3]一种基于Opinosis图和马尔科夫随机游走模型的多文本情感摘要框架[J]. 康世泽,马宏,黄瑞阳. 电子学报. 2017(12)
[4]基于粒子群优化的最小二乘支持向量机税收预测模型研究[J]. 张淑娟,邓秀勤,刘波. 计算机科学. 2017(S1)
[5]基于网格搜索算法的PCNN模型参数自适应[J]. 李瀚,杨晓峰,邓红霞,常莎,李海芳. 计算机工程与设计. 2017(01)
[6]基于布谷鸟算法优化BP神经网络模型的股价预测[J]. 孙晨,李阳,李晓戈,于娇艳. 计算机应用与软件. 2016(02)
[7]基于改进GA参数优化的SVR股价预测模型[J]. 孙秋韵,刘金清,刘引,吴庆祥. 计算机系统应用. 2015(09)
[8]基于参数优化的最小二乘支持向量机HEV阀控铅酸蓄电池SOC预测[J]. 王琪,孙玉坤,黄永红. 中南大学学报(自然科学版). 2015(01)
[9]基于黑洞算法的LSSVM的参数优化[J]. 王通,高宪文,蒋子健. 东北大学学报(自然科学版). 2014(02)
[10]基于粒子群优化偏最小二乘支持向量机的我国税收收入预测研究[J]. 侯利强,杨善林,王晓佳. 中国管理科学. 2013(S1)
博士论文
[1]鲁棒最小二乘支持向量机研究与应用[D]. 刘京礼.中国科学技术大学 2010
[2]企业财务困境的预测方法研究[D]. 徐晓燕.中国科学技术大学 2006
硕士论文
[1]沪深300股指预测[D]. 李冰.暨南大学 2018
[2]基于最小二乘支持向量机和马尔科夫模型的混合模型研究[D]. 程丽娟.兰州交通大学 2018
[3]基于最小二乘支持向量机方法的统计优化预测模型[D]. 沈会.武汉理工大学 2018
[4]马尔科夫链问题算法研究[D]. 唐小勇.电子科技大学 2015
[5]基于最小二乘—马尔科夫链模型的产品回收预测研究[D]. 王磊.河北科技大学 2013
[6]时间序列ARCH模型在金融领域的研究[D]. 孙星.苏州大学 2013
[7]基于最小二乘支持向量机的时态数据预测研究及应用[D]. 吴琳.东北财经大学 2011
[8]基于k-means聚类马氏链的中国股市实证分析[D]. 孙永发.华南理工大学 2011
本文编号:3346349
【文章来源】:江西财经大学江西省
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
线性可分的SVM模型
2LSSVM与Markov模型13的二次规划来实现:11111max(),2..0,1,,,0.nnniijijijiijiniiiyyxxstCiny======(2.11)当训练集为非线性时,如图所示,给定的样本11(x,y),22(x,y),…,,)ii(xy,nxR,无法找到线性分类超平面。如果在原始空间中的最优分类面得不到较为满意的分类结果,则可以将非线性变换转化到某个高维空间变成线性问题,再来求解最优分类面,如图2.2所示。此过程可能比较复杂,不太容易实现,因此可以通过引入核函数来解决这个问题。图2.2二维空间非线性映射到三维空间线性可分所以对于线性不可分的问题,解决思路就是将样本集通过核函数映射到高维数据空间,使得样本集在高维数据空间的像是线性可分的。如果将样本点通过非线性映射到高维特征空间中,在此空间中存在着最优的超平面。超平面进行运算时,只能在空间中进行点积计算,但是如果存在这样一个函数,让高维空间中的内积运算使用输入空间中的函数实现,我们也可以不用确定变换的过程中函数的具体形式是什么。基于此,需要引入合适的核函数,这样可以与高维空间中的内积进行对应,从而完成复杂的运算过程。所以核函数可以将非线性分类转化成线性分类问题。减少了运算难度,加快了求解过程。则目标函数式(2.5)可以转化为:1111()(,)2nnniijijijiijTyyKxx====,(2.12)
基于LSSVM-Markov组合模型的股价预测研究24(2)数据预处理为了提高数据的质量,减少数据之间的数量级差异,使模型的预测效果更好,本文首先对数据进行预处理即归一化处理。(3)核函数选择通过介绍模型常用的几类核函数,如线性、多项和高斯核函数等,通过分析对比选取最优的核函数。(4)参数寻优利用网格搜索法和粒子群法算法进行参数寻优,对比确定最优参数。(5)预测结果及模型评价得到最优参数,建立预测模型,将最优参数的模型样本测试得到预测结果,并对结果及模型进行分析评价。3.2数据来源及数据处理3.2.1数据来源本文从雅虎财经网2在线提取最能反映中国股票市场整体变动情况的上证指数(000001)从2018年1月2日到2019年8月1日,总共383个交易日。每个交易日内上证指数的五个指标的具体数据,包括开盘价、最高价、最低价、成交量和收盘价。股票趋势图如下图所示,从图中可以看出股票的数据波动幅度大具有一定的随机性,且股票是非线性的,每天、每周和每年的数据呈一定的规律在变化,在不稳定变化中又具有一定的重复性,受不同因素的影响股票的变化趋势十分的复杂,也具有一定的不稳定性。图3.2上证指数股票数据图2雅虎财经网:https://finance.yahoo.com/
【参考文献】:
期刊论文
[1]背景值优化的灰色马尔科夫模型在铁路客流预测中的应用[J]. 马彩雯,王晓明. 大连交通大学学报. 2019(01)
[2]利用马尔科夫和灰色模型预测高校师资队伍[J]. 王韦霞. 安庆师范大学学报(自然科学版). 2018(04)
[3]一种基于Opinosis图和马尔科夫随机游走模型的多文本情感摘要框架[J]. 康世泽,马宏,黄瑞阳. 电子学报. 2017(12)
[4]基于粒子群优化的最小二乘支持向量机税收预测模型研究[J]. 张淑娟,邓秀勤,刘波. 计算机科学. 2017(S1)
[5]基于网格搜索算法的PCNN模型参数自适应[J]. 李瀚,杨晓峰,邓红霞,常莎,李海芳. 计算机工程与设计. 2017(01)
[6]基于布谷鸟算法优化BP神经网络模型的股价预测[J]. 孙晨,李阳,李晓戈,于娇艳. 计算机应用与软件. 2016(02)
[7]基于改进GA参数优化的SVR股价预测模型[J]. 孙秋韵,刘金清,刘引,吴庆祥. 计算机系统应用. 2015(09)
[8]基于参数优化的最小二乘支持向量机HEV阀控铅酸蓄电池SOC预测[J]. 王琪,孙玉坤,黄永红. 中南大学学报(自然科学版). 2015(01)
[9]基于黑洞算法的LSSVM的参数优化[J]. 王通,高宪文,蒋子健. 东北大学学报(自然科学版). 2014(02)
[10]基于粒子群优化偏最小二乘支持向量机的我国税收收入预测研究[J]. 侯利强,杨善林,王晓佳. 中国管理科学. 2013(S1)
博士论文
[1]鲁棒最小二乘支持向量机研究与应用[D]. 刘京礼.中国科学技术大学 2010
[2]企业财务困境的预测方法研究[D]. 徐晓燕.中国科学技术大学 2006
硕士论文
[1]沪深300股指预测[D]. 李冰.暨南大学 2018
[2]基于最小二乘支持向量机和马尔科夫模型的混合模型研究[D]. 程丽娟.兰州交通大学 2018
[3]基于最小二乘支持向量机方法的统计优化预测模型[D]. 沈会.武汉理工大学 2018
[4]马尔科夫链问题算法研究[D]. 唐小勇.电子科技大学 2015
[5]基于最小二乘—马尔科夫链模型的产品回收预测研究[D]. 王磊.河北科技大学 2013
[6]时间序列ARCH模型在金融领域的研究[D]. 孙星.苏州大学 2013
[7]基于最小二乘支持向量机的时态数据预测研究及应用[D]. 吴琳.东北财经大学 2011
[8]基于k-means聚类马氏链的中国股市实证分析[D]. 孙永发.华南理工大学 2011
本文编号:3346349
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3346349.html