股票信息挖掘与LSTM预测
发布时间:2021-03-29 08:19
由于受到经济环境、政治政策、市场新闻等多种因素的影响,使得预测股票动态变得极具挑战性。研究了5种常用的预测股价变动的预测方法,通过逐步增加模型的输入维度进行预测分析。首先,建立5种优化的预测模型——基于时间序列的自回归平均模型(ARMA)、灰色预测模型(GM(1,1))、BP神经网络模型(BPNN)、基于改进网格寻优算法的支持向量回归(SVR)模型、基于Tensorflow的长短时记忆神经网络模型(LSTM),研究单一维度的模型输入,即,将各股票的收盘价作为这5种模型的输入。通过实验验证,发现基于LSTM的效果明显优于其他传统机器学习算法。然后,增加模型的输入维度进行研究,即,将影响股价的13个指标作为LSTM模型的输入来预测股价,所得的模型在训练集上的均方误差为0.1438。最后,进一步增加模型的输入维度,即,通过新闻数据挖掘提取14个特征,再结合13个股价指标,以这27个维度特征作为LSTM模型的输入来预测股价,所得的模型在训练集上的均方误差为0.1045。通过实验验证得出,所采用的输入27个维度的方法,比输入13个维度在预测问题上表现得更稳健。
【文章来源】:集美大学学报(自然科学版). 2020,25(05)
【文章页数】:7 页
【部分图文】:
数据平稳处理结果
以均方误差作为所建立的LSTM模型的评价指标。实验结果(见图3)表明,在训练集上预测的均方误差为0.1438,股价的预测值和真实值走势较吻合,且评价指标数值较接近于0。由此可见,本研究所建立的LSTM模型性能较好。图3 训练集股价预测值与真实值对比图(13维)
训练集股价预测值与真实值对比图(13维)
【参考文献】:
期刊论文
[1]奏响构建开放型世界经济主旋律 国务委员兼外交部长王毅谈第二届“一带一路”国际合作高峰论坛的意义[J]. 本刊综合报道. 中国科技产业. 2019(05)
[2]基于属性识别的驾驶员安全特性评价[J]. 唐秋生,李娜,程鹏. 交通科技与经济. 2016(05)
本文编号:3107246
【文章来源】:集美大学学报(自然科学版). 2020,25(05)
【文章页数】:7 页
【部分图文】:
数据平稳处理结果
以均方误差作为所建立的LSTM模型的评价指标。实验结果(见图3)表明,在训练集上预测的均方误差为0.1438,股价的预测值和真实值走势较吻合,且评价指标数值较接近于0。由此可见,本研究所建立的LSTM模型性能较好。图3 训练集股价预测值与真实值对比图(13维)
训练集股价预测值与真实值对比图(13维)
【参考文献】:
期刊论文
[1]奏响构建开放型世界经济主旋律 国务委员兼外交部长王毅谈第二届“一带一路”国际合作高峰论坛的意义[J]. 本刊综合报道. 中国科技产业. 2019(05)
[2]基于属性识别的驾驶员安全特性评价[J]. 唐秋生,李娜,程鹏. 交通科技与经济. 2016(05)
本文编号:3107246
本文链接:https://www.wllwen.com/jingjilunwen/huobiyinxinglunwen/3107246.html