面向股价预测的神经网络新闻与量价综合建模研究
发布时间:2020-04-23 17:15
【摘要】:股票价格预测在商业和金融领域具有重要的意义。近年来,在金融领域使用人工智能技术进行数据分析和预测已经成为一个炙手可热的方向。在股票价格预测这个方向,传统的方法是分析股票历史量价数据,随着大数据时代的来临,越来越多的人考虑利用新闻资讯作为股票价格预测的依据。本文通过对股票相关的在线新闻和股票历史量价数据进行综合建模,来预测股票的价格走势。主要研究内容包括:(1)利用word2vec工具将新闻中词汇转变成词向量,使用基于循环神经网络和卷积神经网络的层级式神经网络对新闻正文进行语义建模,并且引入新闻标题信息以及Attention机制来赋予新闻文本序列不同的关注度,确保模型能够从新闻中捕捉到与股价走势变化更相关的信息;(2)利用特征工程中的方法,从股票历史量价数据中提取特征,经过归一化后使用多层神经网络进行量价建模,与建模新闻的结果进行融合,共同进行股票价格预测;(3)设计了一个股票模拟买卖系统,依据股市总体表现构建了牛市,熊市,平稳期三个测试集,依据预测模型预测出股票的置信度,通过模拟盘进行股票买卖,计算出投资获得的收益,来评估预测模型的性能表现。我们最终得到的预测模型能够利用股票相关新闻和历史量价数据,每天对股票给出一个置信度,依据置信度来指导证券投资者的交易行为,帮助他们提高投资股市的收益。
【图文】:
集上计算收益时,我们不会做去大盘操作,原因有三点:(帮助模型区分股票,以便于训练。预测时的输出的数值是作大盘走势(2)实际进行投资操作时,我们在买入股票时无。(3)计算收益时,股价实际涨的股票就会有正收益,下跌要考虑去大盘后的数值。数据集的划分过各种预处理操作,最终我们得到了约 330,000 条股票相关6 年 1 月至 2017 年 4 月。因为股票投资的具体收益受到投表现的影响,特别是后者,股市的总体表现往往直接决定了负。先通过大盘指数对由 2006 年 1 月至 2017 年 4 月这段时期观察。图 2-1 为这段时间每个交易日收盘时的沪深 300 大盘
根据不同时期中国 A 股证券市场的总体表现划分了训练集,牛市集以及平稳期测试集。如表 2-1 所示:表 2-1 数据集划分以及包含新闻和交易日数目时间跨度 包含新闻量 包含训练集 2006.01.03~2014.06.02 209656 市测试集 2014.06.03~2015.06.08 62124 市测试集 2015.06.09~2016.01.28 20383 期测试集 2016.01.29~2017.04.12 61124 2 显示了牛市测试集时期,即 2014.06 至 2015.06 这段时期的大时期,股市大盘指数前期较为平稳,自中期以后处于快速爬升状你采用何种买卖策略,,投资的收益都不会太低。这个时期特别适是稳赚不赔。如果我们的模型表现激进,这个时期的收益可能就果比较保守,在保持不会出现负收益时情况,投资回报可能会
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F830.91;TP183
本文编号:2637960
【图文】:
集上计算收益时,我们不会做去大盘操作,原因有三点:(帮助模型区分股票,以便于训练。预测时的输出的数值是作大盘走势(2)实际进行投资操作时,我们在买入股票时无。(3)计算收益时,股价实际涨的股票就会有正收益,下跌要考虑去大盘后的数值。数据集的划分过各种预处理操作,最终我们得到了约 330,000 条股票相关6 年 1 月至 2017 年 4 月。因为股票投资的具体收益受到投表现的影响,特别是后者,股市的总体表现往往直接决定了负。先通过大盘指数对由 2006 年 1 月至 2017 年 4 月这段时期观察。图 2-1 为这段时间每个交易日收盘时的沪深 300 大盘
根据不同时期中国 A 股证券市场的总体表现划分了训练集,牛市集以及平稳期测试集。如表 2-1 所示:表 2-1 数据集划分以及包含新闻和交易日数目时间跨度 包含新闻量 包含训练集 2006.01.03~2014.06.02 209656 市测试集 2014.06.03~2015.06.08 62124 市测试集 2015.06.09~2016.01.28 20383 期测试集 2016.01.29~2017.04.12 61124 2 显示了牛市测试集时期,即 2014.06 至 2015.06 这段时期的大时期,股市大盘指数前期较为平稳,自中期以后处于快速爬升状你采用何种买卖策略,,投资的收益都不会太低。这个时期特别适是稳赚不赔。如果我们的模型表现激进,这个时期的收益可能就果比较保守,在保持不会出现负收益时情况,投资回报可能会
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F830.91;TP183
【参考文献】
相关期刊论文 前1条
1 蒋艳霞;柯大钢;解青芳;;基于数据挖掘技术的股票收益预测研究[J];经济与管理研究;2007年06期
本文编号:2637960
本文链接:https://www.wllwen.com/jingjilunwen/jinrongzhengquanlunwen/2637960.html