当前位置:主页 > 管理论文 > 信贷论文 >

基于核主成分分析和支持向量回归对每日和每分钟股票价格的预测

发布时间:2022-01-09 18:17
  随着改革开放的发展,中国的股票市场逐渐被世界主要经济体认可,国内股市吸引了越来越多的境外投资者。股票价格预测系统的目的是为金融市场的经营者提供异常收益,并成为风险管理工具的基础。大数据时代的来临,计算机信息技术和金融工程联系日益密切,在股票交易机制的发展中,使用机器学习算法的计算密集型系统越来越普遍。国内外许多学者运用统计学习方法,在科学理论的支撑下建立股票价格预测模型,并且已经应用于股市的价格和涨跌趋势预测。本文在支持向量回归(SVR)的基础上,引入非线性技术的降维方法组合成集成学习模型,对中国股市指数进行预测,该课题具有一定的研究意义和应用前景。本文以上海证券交易所的股指数作为课题研究对象,把SVR模型理论应用在股票市场不同频率价格的预测。首先,基于股票价格预测问题选取每日数据和每分钟数据进行模型参数选择,构建了非线性的支持向量回归预测模型,并对转换后的收盘价格进行预测。在训练模型之前,根据国内外研究文献,选取合适的TA技术指标作为模型输入变量。考虑到不同的数据特征变量组合在模型预测时会表现出不同的预测结果,为了进一步防止特征变量陷入“高维诅咒”的陷阱,引入非线性技术的核主成分分析... 

【文章来源】:兰州大学甘肃省 211工程院校 985工程院校 教育部直属院校

【文章页数】:54 页

【学位级别】:硕士

【部分图文】:

基于核主成分分析和支持向量回归对每日和每分钟股票价格的预测


线性数据和非线性数据的区别

数据部分,股票,样本


兰州大学硕士学术论文基于核主成分分析和支持向量回归对每日和每分钟股票价格的预测23指数移动平均线通过对近期价格添加更大的权重来减少滞后,这个权重取决于移动平均线的周期数(N)。通过以上特征指标的讨论,我们给出确定的数据集S,包括输入变量和输出变量两个部分。=111111,11,21,3…1,222222,12,22,32,3,1,2,3…,12其中在上述矩阵S中,N代表样本容量,M代表指标个数,数据集S的部分具体值如图3.1所示。图3.1每日股票数据部分样本展示3.4股票数据集的标准化股票数据的时序性和复杂性让它的真实数据集出现很多离群值,对于一个m维的样本来说,取值范围不同产生了不同的分量,大数量个数的样本分量对模型产生相对较大的影响,而小分量对模型的影响因素普遍较小,小数就会被大数所“淹没”,进而失去了存在意义,严重时会导致信息丢失;另一方面在模型输入过程中,个别数据值因为过大或过小,会导致计算后的数据因为越界从而失去信息。通常我们在解决大小值问题会进行数据标准化处理,常用的有“归一化”、“统计标准化”、“对数标准化”等。经过标准化处理后可以将原数据集转换到统一区间,让各个指标值处以同一量级别上。在本研究中选取归一化标准化处理[52],就是最大最小标准化方法,它是通过把搜集的数据进行最大最小值线性变化,将数据映射到区间[1,1]中,有公式(49)给出具体表达式:′=2()1,(49)其中x表示原数据值,′表示标准化后的值。

过程图,参数优化,过程,参数


兰州大学硕士学术论文基于核主成分分析和支持向量回归对每日和每分钟股票价格的预测26优参数组合(,′,,,),共有6144种组合需要测试。表4.1的内容是KPCA-SVR模型参数优化的算法过程,图4.2表示的是参数组合优化的具体过程,其中=1,2,,。表4.1KPCA-SVR模型优化参数算法输入:股票数据集输出:最优参数组(,′,,,)执行:⒈股票数据集预处理:筛癣归一化、划分训练集和测试集,生成新的数据集和;⒉定义参数组:引入核主成分KPCA参数(,′),非线性支持向量回归SVR参数(,,),其中n的个数为K,其余参数取值个数是T;⒊生成=××××种参数组组合;⒋在训练集上把M组参数组带入KPCA-SVR模型在网格搜索的基础上进行10折交叉验证训练;⒌生成(1,2,3,,);⒍输出最小N对应参数组(,′,,,)。图4.2参数优化过程4.3模型的评价指标不管何种模型对股票的预测总会出现误差,预测值并不是实际值,预测值与真实值之间的误差大小就是评价预测方法有效与否的决定性指标,预测值越接近真实值,预测方法效果越好。为了评估模型预测的优劣性,提出以均方误差(MSE)、均方根误差(RMSE)和平均绝对误差(MAE)用于评估模型方法的性能,其中采用十折交叉验证的均方误差(MSE)值来评估模型的参数误差,而均方根误差

【参考文献】:
期刊论文
[1]金融发展、政府作用与经济增长——基于经济水平的视角[J]. 潘林伟,吴娅玲.  金融与经济. 2017(08)
[2]多重马氏链模型在股市预测中的应用[J]. 费时龙,任洪光.  德州学院学报. 2016(04)
[3]论我国证券市场发展的现状、问题及对策[J]. 杨荣蕾.  环球市场信息导报. 2016(26)
[4]基于SVR的股市预测与择时研究[J]. 张鹏.  重庆文理学院学报(社会科学版). 2016(02)
[5]基于C4.5决策树的股票数据挖掘[J]. 王领,胡扬.  计算机与现代化. 2015(10)
[6]引入趋势因子的BP模型在股市预测中应用[J]. 孙海波,王丽敏,韩旭明.  统计与决策. 2015(19)
[7]基于误差校正的GARCH股票价格预测模型[J]. 于志军,杨善林.  中国管理科学. 2013(S1)
[8]时间序列模型和神经网络模型在股票预测中的分析[J]. 刘海玥,白艳萍.  数学的实践与认识. 2011(04)
[9]ARMA模型参数估计算法改进及在股票预测中的应用[J]. 何永沛.  重庆工学院学报(自然科学版). 2009(02)
[10]社会主义市场经济与股票市场[J]. 温桂芳.  财经问题研究. 1993(04)

博士论文
[1]基于支持向量机的金融时间序列分析预测算法研究[D]. 鲍漪澜.大连海事大学 2013

硕士论文
[1]基于支持向量回归机模型的价格预测[D]. 马雪姣.郑州大学 2018
[2]基于BP神经网络和GARCH模型的中国银行股票价格预测实证分析[D]. 林楠.兰州大学 2014
[3]基于支持向量机的股市预测研究[D]. 金得宝.浙江大学 2010



本文编号:3579210

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/bankxd/3579210.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1d055***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com