基于金融文本情感的股票波动预测
发布时间:2020-12-06 10:16
股票市场的情绪可以在一定程度上反映投资者的行为并影响其投资决策。市场新闻作为一种非结构性数据,能够体现并引导市场的大环境情绪,与股票价格一同成为至关重要的市场参考数据,能够为投资者的投资决策提供有效帮助。文中提出了一种可以准确、快速地建立针对海量新闻数据的多维情绪特征向量化方法,利用支持向量机(Support Victor Machine,SVM)模型来预测金融新闻对股票市场的影响,并通过bootstrap来减轻过拟合问题。在沪深股指上进行实验的结果表明,相比于传统模型,所提方法能够将预测准确度提高约8%,并在3个月的回测实验中获得了6.52%的超额收益,证明了其有效性。
【文章来源】:计算机科学. 2020年05期 第79-83页 北大核心
【文章页数】:5 页
【部分图文】:
不同惩罚因子C对预测准确率的影响(消极预测)
同样地,特征词数量会影响预测的准确率以及模型训练速度,过多的特征词会影响模型训练以及分类的速度,并增加数据的噪声;过少的特征词会降低分类准确度。图4、图5显示了不同数量的特征词对预测结果的影响。图5 不同特征词数量下预测精度的比较(消极)
图4 不同特征词数量下预测精度的比较(积极)可以看到,特征词数量在100~400时预测精度不断增加,在400~800时预测精度并没有显著增长,并且随着特征词数量的增加,模型的训练时间以及对验证文本的处理时间显著增加。因此,结合训练结果的准确率和模型训练速度,本文将特征词数量定为600,超参C的值为10。
【参考文献】:
期刊论文
[1]基于词频统计规律的文本数据预处理方法[J]. 池云仙,赵书良,罗燕,高琳,赵骏鹏,李超. 计算机科学. 2017(10)
[2]基于SVM的主题爬虫技术研究[J]. 李璐,张国印,李正文. 计算机科学. 2015(02)
本文编号:2901209
【文章来源】:计算机科学. 2020年05期 第79-83页 北大核心
【文章页数】:5 页
【部分图文】:
不同惩罚因子C对预测准确率的影响(消极预测)
同样地,特征词数量会影响预测的准确率以及模型训练速度,过多的特征词会影响模型训练以及分类的速度,并增加数据的噪声;过少的特征词会降低分类准确度。图4、图5显示了不同数量的特征词对预测结果的影响。图5 不同特征词数量下预测精度的比较(消极)
图4 不同特征词数量下预测精度的比较(积极)可以看到,特征词数量在100~400时预测精度不断增加,在400~800时预测精度并没有显著增长,并且随着特征词数量的增加,模型的训练时间以及对验证文本的处理时间显著增加。因此,结合训练结果的准确率和模型训练速度,本文将特征词数量定为600,超参C的值为10。
【参考文献】:
期刊论文
[1]基于词频统计规律的文本数据预处理方法[J]. 池云仙,赵书良,罗燕,高琳,赵骏鹏,李超. 计算机科学. 2017(10)
[2]基于SVM的主题爬虫技术研究[J]. 李璐,张国印,李正文. 计算机科学. 2015(02)
本文编号:2901209
本文链接:https://www.wllwen.com/jingjilunwen/jinrongzhengquanlunwen/2901209.html