基于百度指数和随机森林的上证综指预测
发布时间:2021-01-08 14:41
股市走势预测是金融学、统计学、机器学习等多学科交叉研究的热点学术问题。股市走势并不完全由自身内在规律决定,也会受到投资者的关注度的影响。本文研究了投资者关注与上海证券综合指数之间的波动效应,提出了一种基于百度指数并结合随机森林模型的上证指数走势预测方法。基于已有的初始搜索关键词词库在百度指数网站获取相应的关键词的百度指数,通过时差相关分析法筛选出具有预测意义的关键词,将筛选后的关键词的百度指数数据和上证指数的相关属性数据作为预测模型的输入数据,通过随机森林建立预测模型并实现对上证指数的预测。对比实验证明引入百度指数后的预测模型比传统的预测模型具有更高的准确率。
【文章来源】:软件. 2020,41(06)
【文章页数】:7 页
【部分图文】:
整体预测流程
本次实验的预测结果与实际值对比图
图2 本次实验的预测结果与实际值对比图横坐标是从1到60的自然数,代表从2018年5月3号到2018年7月27号的日期,纵坐标表示大盘指数收盘值,蓝色的散点为模型预测结果,黄色的散点为实际值。图2为包含搜索指数数据的实验结果,图3为不包含百度指数数据的实验结果。由图可知,在加入百度指数后预测值走势与真实值的走势更为接近,比如在横坐标为50的数据附近,真实值是一直呈下跌趋势,加入百度指数后的预测值呈相同趋势,但是没有百度指数的预测值走势不稳定。从RMSE和MAPE指标来看,加入百度指数的实验结果都比不加百度指数的实验结果低,也就是具有更高的准确率。总的来说,实际的上证指数的收盘值在某些时候有较大波动,这些波动会影响RMSE和MAPE指标,但是从实验的数据集来看上证指数的涨跌幅,有98%的数据的涨跌幅在5%以内,也就是基本波动不会超过5%,本实验使用百度指数的数据来预测的收盘值和真实值的误差百分比都在5%以内,表明预测值具有一定可靠性和准确性。
【参考文献】:
期刊论文
[1]基于文本挖掘和百度指数的投资者情绪指数研究[J]. 孟雪井,孟祥兰,胡杨洋. 宏观经济研究. 2016(01)
博士论文
[1]随机森林算法优化研究[D]. 曹正凤.首都经济贸易大学 2014
硕士论文
[1]基于百度指数的投资者关注度对于股票市场表现的影响[D]. 缪杰.厦门大学 2014
[2]关注度对股票收益率的影响—中国证券市场的实证研究[D]. 王京晶.上海交通大学 2012
[3]基于搜索关键词关注度的中国股票市场波动研究[D]. 孙文存.哈尔滨工业大学 2012
本文编号:2964779
【文章来源】:软件. 2020,41(06)
【文章页数】:7 页
【部分图文】:
整体预测流程
本次实验的预测结果与实际值对比图
图2 本次实验的预测结果与实际值对比图横坐标是从1到60的自然数,代表从2018年5月3号到2018年7月27号的日期,纵坐标表示大盘指数收盘值,蓝色的散点为模型预测结果,黄色的散点为实际值。图2为包含搜索指数数据的实验结果,图3为不包含百度指数数据的实验结果。由图可知,在加入百度指数后预测值走势与真实值的走势更为接近,比如在横坐标为50的数据附近,真实值是一直呈下跌趋势,加入百度指数后的预测值呈相同趋势,但是没有百度指数的预测值走势不稳定。从RMSE和MAPE指标来看,加入百度指数的实验结果都比不加百度指数的实验结果低,也就是具有更高的准确率。总的来说,实际的上证指数的收盘值在某些时候有较大波动,这些波动会影响RMSE和MAPE指标,但是从实验的数据集来看上证指数的涨跌幅,有98%的数据的涨跌幅在5%以内,也就是基本波动不会超过5%,本实验使用百度指数的数据来预测的收盘值和真实值的误差百分比都在5%以内,表明预测值具有一定可靠性和准确性。
【参考文献】:
期刊论文
[1]基于文本挖掘和百度指数的投资者情绪指数研究[J]. 孟雪井,孟祥兰,胡杨洋. 宏观经济研究. 2016(01)
博士论文
[1]随机森林算法优化研究[D]. 曹正凤.首都经济贸易大学 2014
硕士论文
[1]基于百度指数的投资者关注度对于股票市场表现的影响[D]. 缪杰.厦门大学 2014
[2]关注度对股票收益率的影响—中国证券市场的实证研究[D]. 王京晶.上海交通大学 2012
[3]基于搜索关键词关注度的中国股票市场波动研究[D]. 孙文存.哈尔滨工业大学 2012
本文编号:2964779
本文链接:https://www.wllwen.com/guanlilunwen/zhqtouz/2964779.html
最近更新
教材专著