当前位置:主页 > 科技论文 > 数学论文 >

基于支持向量机和K近邻算法的股票价格预测

发布时间:2022-01-22 04:18
  本文利用支持向量机(support vector machine,SVM)和K近邻(K-nearest neighbor,KNN)相结合的算法研究证券价格的预测问题。这里选取两种途径研究,首先基于技术分析建立预测模型,选取证券的交易数据和技术指标,包括收盘价、成交量、最高价、移动平均(MA)等,利用支持向量机对其进行涨跌趋势预测,根据涨跌趋势结合K近邻算法对股票1天,7天和30天的收盘价、开盘价、最高价和最低价进行预测并构造价格预测区间,得出技术分析预测模型的平均绝对误差(MAE)为0.043,均方根误差(RMSE)为0.05。特别的是,建立技术分析模型后,选取20家股票公司根据价格区间和收盘价设定两种不同的投资策略,进行为期一个月的模拟投资得到收益0.06和0.09;其次基于财务数据建立综合预测模型,选取十家公司的交易数据和财务指标,包括收盘价、成交量、净资产收益、利润和每股收益率等,利用支持向量机对其进行涨跌趋势进行预测,根据涨跌趋势结合K近邻算法预测收盘价,得出综合分析预测模型的平均绝对误差的平均值为0.16,均方根误差为0.21。同样,综合分析中选取10家股票公司根据预测的涨跌... 

【文章来源】:郑州大学河南省 211工程院校

【文章页数】:64 页

【学位级别】:硕士

【部分图文】:

基于支持向量机和K近邻算法的股票价格预测


推导流程

线性可分,超平面


第一章预备知识图1推导流程定义1.3.1(线性可分)一般情况下的分类学习是可以根据训练样本D从而在样本空间计算得出一个相对合适的划分超平面,这样做可以将不同类别的样本集分开。如图二所示图2线性可分直观看上去,能将训练样本分开的划分超平面有很多,但我们所要寻找的最优的超平面是与两类不同类别的训练样本距离相等的分类超平面,即图三中黑色的线条,最优的划分超平面对局部扰动的“容忍”性最好,因此其分类的准确率最高。其他的超平面在对距离离得比较近的样本点分类时易出现错误。而红色超平面的影响最小,也就是11

支持向量,拉格朗日乘子法,知识图,最优超平面


第一章预备知识图3支持向量和间隔关于间隔的计算:由:1(WTX+b=1)yi=+11(WTX+b=1)yi=1(1.7)推出:WTX+=1bWTX=1b(1.8)故有:γ=(x+x)WT||W||=1b+1+b||W||=2||W||(1.9)这里,正负样本之间的间隔已经计算出来,通过计算最大的间隔,便可以找到最优超平面:maxw,b2||W||s.t.yi(WTxi+b)≥+1(1.10)为了使得2||W||最大化,我们选择将||W||最小化,并且为了减少计算量,可以根据(1.11)进行转化:minw,b12||W||2s.t.yi(WTxi+b)≥+1(1.11)由公式表达可知我们将其变为了凸二次规划的问题,选择拉格朗日乘子法对凸二次规划的对偶问题求解。L(w,b,α)=12||W||2+m∑i=1αi(1yi(WTxi+b))(1.12)13

【参考文献】:
期刊论文
[1]中国上市公司股票价格与财务指标相关性实证分析[J]. 梅世强,王天阳.  大连海事大学学报(社会科学版). 2014(06)
[2]基于支持向量机的股票投资价值分类模型研究[J]. 李云飞,惠晓峰.  中国软科学. 2008(01)
[3]基于人工神经网络方法的上市公司股价预测[J]. 杨成,程晓玲,殷旅江.  统计与决策. 2005(24)
[4]利用财务指标预测股票价格及财务风险预警[J]. 国琳,杨宝臣.  科学技术与工程. 2005(23)
[5]财务分析师盈利预测的投资价值:来自深沪A股市场的证据[J]. 吴东辉,薛祖云.  会计研究. 2005(08)
[6]SVM-KNN分类器——一种提高SVM分类精度的新方法[J]. 李蓉,叶世伟,史忠植.  电子学报. 2002(05)
[7]净资产倍率、市盈率与公司的成长性——来自中国股市的经验证据[J]. 宋剑峰.  经济研究. 2000(08)

硕士论文
[1]基于Piotroski方法和ARIMA-SVR模型的股票投资策略研究[D]. 余天伦.华南理工大学 2016



本文编号:3601536

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/3601536.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户172d0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com