当前位置:主页 > 经济论文 > 微观经济论文 >

基于循环神经网络及百度指数预测A股市场波动率

发布时间:2020-10-17 20:33
   近年来随着人工智能上升为国家战略,人工智能技术在各领域的应用发展迅速,在金融领域股价变化趋势的预测一直是热点问题,能有效预测股价的走势也有着较大的经济与社会价值。目前人们在股价预测问题中应用人工智能技术时市场内的数据一般选用股票指标数据,构造多个因子,市场外的数据选用文本数据利用自然语言处理技术对股票时间序列进行分析预测。本文主要基于循环神经网络模型,将百度指数数据分析平台的数据视为市场外的投资者情绪,即环境变量,结合部分市场内数据,采用较有代表性的沪深300指数日波动率作为目标预测值进行预测。在本文的研究工作中理论部分主要介绍了传统机器学习方法和循环神经网络模型的相关理论基础,实证部分首先根据与沪深300指数波动率相关的市场内的数据和利用爬虫技术获取的百度指数数据基于嵌入法(Embedded)做特征选择,剔除部分市场外的无效信息,之后利用互信息(MI)度量选用最佳的观测窗口大小和标准化方案,接着在模型构建过程中利用Dropout技术有效防止了过拟合问题,并对模型参数进行调试优化,重新划分了训练集、验证集和测试集,最后与常用机器学习方法XGBoost算法的预测结果对比分析。本文最后的实证结果对比表明LSTM模型对沪深300指数波动率预测效果较理想,损失函数的最优解在合理范围,且循环神经网络LSTM模型预测效果稍微优于XGBoost模型预测结果,也就是说,机器学习算法在股价预测问题的表现具有一定的实用价值,为后续的研究工作拓展思路。
【学位单位】:山东大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:F832.51;TP183
【部分图文】:

结构图,决策树,特征选择,自根


成成分是有向边与节点,节点分内部节点,叶节点。内部节点表示样本的某个特??征(feature),叶节点表示样本所属的某个类。决策树的特点便是模型的树结构,??如下图3-1。??广、特怔或属性.??'?<内雜节点)??〇??/\?國类(叶节点)??_?:???A??图3-1决策树结构图??决策树也属于监督学习算法,自根部向下逐步生成,在每一步做特征选择,??选取当前层最优的特征作为节点,对训练数据做分割。一般在决策树学习过程中??选用信息增益作为特征选择的度量。在生成一颗决策树后通常我们会对其进行剪??枝,以防止过拟合问题,容易过拟合也是决策树的缺点之一。其优点是回归问题??与分类问题都能处理,且直观易懂,高效,能处理高维数据。??11??

全连接,神经网络,模型,参数数


高效的网络结构来大量减少神经网络的参数数量。而卷积神经网络便可以达??到这个目的。最初的卷积神经网络模型LeNet-5模型由Yann?LeCun教授提出。??下图3-3为LeNet-5卷积神经网络基本结构。??12??

状态图,循环神经网络,时间序列,状态


神经元是动态变化的,也就是说,隐藏神经元不是完全由前一层决定,还被更早??的层中的隐藏神经元影响,这也是为什么循环神经网络模型能够充分挖掘时序数??据的信息的原因。下图3-5为RNN示意图。??(Z)?c^)??[°?J?????NrV?Infold?^TV?Jv?Jv??(")■?i?M->?hW?V-W?^??、赠,?vy?v?_????f?*?j?(汐-*)丨?*w)?G??图3-5循环神经网络原理??代表在时间序列#时循环神经网络模型的隐藏状态。由;rW和砂共??同决定。#)表示在时间序列〖时训练数据的输入。对于任意时刻“神经元的隐??藏状态妒可由,和矽?表示如下:??h{t)?=?a(zw)?=?cr{Ux{t)?+?Wh[t ̄l)?+?b)?(3.9)??值得一提的是,<rU)通常是非线性激活函数,其中参数U,W,偏置项b是由??隐藏层的神经元共享的,是根据不断输入的新的数据在更新的,也就是说,参数??受最近输入的数据影响更大,更早的数据影响越来越小,同时也大大减少了模型??的参数数量。??简化后的RNN单元结构图3-6如下。??14??
【相似文献】

相关期刊论文 前10条

1 肖书畅;;基于百度指数对投资者关注度测量指标的研究[J];现代经济信息;2018年02期

2 王永斌;;谁在关注社会主义核心价值观——基于百度指数的大数据分析[J];马克思主义研究;2018年02期

3 柏正健;方华;;基于百度指数的投资者关注度对股票市场表现的影响[J];电子商务;2018年12期

4 田冰;胡俞越;;投资者关注对沪深300股指期货、现货收益率的影响——基于百度指数的实证分析[J];中国证券期货;2019年02期

5 邱泸谊;李华;;基于百度指数的社会舆情研究[J];科技风;2018年33期

6 立夏;;生鲜电商:或成下一个电商时代的“门票”[J];农经;2017年03期

7 李云鹏;;旅游场景驱动的大数据应用[J];旅游学刊;2017年09期

8 陈洪;刘燊;赵晓;;网络关注度视域下的“校园贷”问题研究——基于百度指数数据平台[J];山西能源学院学报;2018年06期

9 柯山;潘辉;吕梁;;基于百度指数关注行为倾向的乡村振兴规划实践——以福建省古田县金翼之家为例[J];东南园艺;2019年01期

10 顾敏华;姚建香;汤玲;;特定关键词的百度指数与流感病毒活动相关性分析[J];职业与健康;2019年08期


相关硕士学位论文 前10条

1 胡倩倩;基于百度指数的海南旅游量预测[D];吉林大学;2019年

2 徐杨;投资者关注度对煤炭上市公司市场表现的影响研究[D];西安科技大学;2019年

3 马欢;基于百度指数和BP神经网络的汽车销量预测模型研究[D];武汉理工大学;2018年

4 问晓萌;互联网大数据对A股影响的实证分析[D];天津大学;2018年

5 李树阳;基于循环神经网络及百度指数预测A股市场波动率[D];山东大学;2019年

6 蔡巧;基于百度指数手足口病发病预测模型的比较研究[D];广东药科大学;2018年

7 孙益林;基于百度指数的异位妊娠患病情况的大数据分析[D];苏州大学;2018年

8 徐天成;中国网络语言中的日源借词的计量研究[D];北京外国语大学;2018年

9 刘晨阳;基于百度指数的汽车销量预测研究[D];湖北大学;2018年

10 张淯洋;投资者关注度与小盘股市场表现[D];华东政法大学;2018年



本文编号:2845287

资料下载
论文发表

本文链接:https://www.wllwen.com/weiguanjingjilunwen/2845287.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b478f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com