当前位置:主页 > 管理论文 > 证券论文 >

引入新闻短文本的个股走势预测模型

发布时间:2021-11-21 09:01
  【目的】结合深度学习,分析股市数值数据和财经新闻,提高股票涨跌预测准确率。【方法】建立基于事件的新闻分类模型,使用多输入的循环神经网络建立基于新闻事件、资金流向和公司财务的个股走势预测模型,提升股票预测准确率。【结果】引入新闻文本后模型预测准确率进一步提升,其中,采矿业准确率达到76.22%,医药制造业准确率达到77.36%。【局限】未验证新闻标题与新闻文章对股价影响程度的差异,且新闻事件的分类是基于一年内的新闻数据集进行人工划分,数据集不具备完整性和代表性。【结论】引入新闻事件作为股票预测模型的特征之一,能够提升预测的准确率。 

【文章来源】:数据分析与知识发现. 2019,3(05)北大核心CSSCICSCD

【文章页数】:8 页

【部分图文】:

引入新闻短文本的个股走势预测模型


引入新闻事件的股价涨跌预测模型流程

示意图,新闻事件,分类器,示意图


12数据分析与知识发现专题图1引入新闻事件的股价涨跌预测模型流程(1)编写爬虫程序获取新浪财经数据(个股新闻数据、个股资金流向数据等);(2)对财务数据和文本数据进行预处理;(3)按照事件分类对新闻短文本进行类别划分,借助深度学习提取事件类别;(4)以14天为时间窗口,在引入个股资金流向、市盈率、市净率、流通市值等财务数据的基础上引入新闻事件类别进行深度学习二分类问题建模,预测个股走势。3.1基于事件的新闻短文本分类模型(1)划分个股新闻事件类别。为降低情感等主观因素的影响,本文选取客观的财经事件,定义了80种金融事件类别,如表1所示(鉴于篇幅限制,只列出部分内容)。表1事件类别表事件类别名称事件类型投融资类投建、中标、发行债券、发行股票、发行可转债、质押、投资、募资股权类挂牌、上市、首次公开发行股票、借壳、举牌、收购并购、资产重组、回购、减持、增持交易事件类停牌、复牌、摘帽、退市、异常交易、资金流入、资金流出、股价倒挂、股价创新高、股价创新低(2)建立新闻事件分类器。本文基于CNN-RNN模型搭建事件分类器[9-10],如图2所示。第一层将词语转成300维词向量;第二层利用三个大小分别为3、4、5的卷积核以标题为单位对词语同时进行卷积;第三层将卷积的结果拼接成一维向量后,利用LSTM单元(长短时记忆)进行学习;最后一层为全连接层,输出预测类别。为了检验分类器的准确性,将获取的新闻标题,随机按8:2的比例划分训练集和检验集用于新闻标题事件分类器训练。新闻标题事件分类器的性能如

新闻,预测模型,输入数据,示例


总第29期2019年第5期DataAnalysisandKnowledgeDiscovery13表2事件类别分类器召回率统计表(部分)高召回率示例低召回率示例事件类别召回率F1值事件类别召回率F1值证监会处罚1.001.00交易所关注0.200.33证监会核准1.000.98交易所处罚0.330.50评级涨超1.001.00传闻0.330.50质押1.001.00借壳0.330.50资产冻结1.000.97停牌0.500.64资产重组1.000.95入围0.500.67资金流入1.001.00公告速递0.560.673.2引入新闻事件的个股走势预测模型本文将个股涨跌预测问题转化为不同涨跌幅阈值下的二分类问题:当股价涨跌幅小于阈值时,判定为负样本,即股价下跌;反之,则判定为正样本,即股价上涨。个股走势预测模型的输入数据结构如图3所示。其中,将财务数据进行归一化处理;右边部分的80种事件类型与股票代码和日期相对应,表示对应日期下,某一股票在对应新闻事件下的数量统计。图3引入新闻的Single-inputLSTM预测模型的输入数据示例通过新闻事件分类器对每支股票每天出现的新闻标题进行事件分类,得到对应的新闻事件(一条新闻对应一个事件);通过统计当天所有新闻事件出现的次数,得到新闻事件频数统计矩阵。由于一支股票一天内可能出现多条新闻,且新闻与新闻间可能存在相关性(如交易事件类中的“资金流出”可能与股权类中的“减持”有关),并非完全相互独立。因此本文选择出现概率最高的事件进行加和作为统计结果,而非将新闻与新闻间的事件概率相乘作为统计结果。(1)Single-inputLSTM预测模型。选取第t–14天至第t–1天的新闻文本数据和公司财务数据,合并作为一个样本数据,输入LSTM循环神经网络[11-12]中,进行时间序列分析,最后输出对第t天的股价涨跌预测结果,如图4和图5所示。图4LSTM结构示意图

【参考文献】:
期刊论文
[1]财经新闻与股市预测——基于数据挖掘技术的实证分析[J]. 孔翔宇,毕秀春,张曙光.  数理统计与管理. 2016(02)
[2]行业因素对我国股票价格波动率的影响研究[J]. 张建波,李振.  山东大学学报(哲学社会科学版). 2014(01)



本文编号:3509196

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/zhqtouz/3509196.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0ab11***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com