基于互联网投资者情绪的股票时间序列分析与预测
发布时间:2020-12-11 16:49
建立在有效市场假说基础之上的传统金融理论认为金融资产价格充分反映了所有可得的信息。而行为金融学则强调投资者行为中的非理性成分,认为除了股票的基本价值,反映投资者预期的投资者情绪也会对股票价格产生重要影响。因此从投资主体出发,在行为金融理论的基础上研究股票市场的波动,不失为一种有效的方式。而网络媒体的发展为情绪的度量提供了直接来源,从股票评论中获取投资者的看法与预期成为金融分析的重要手段。非结构化的股票评论对投资者情绪的提取造成了一定挑战,为解决这部分问题,本文运用词向量技术和关联规则方法构建并扩展了情感词典,利用情感分类算法对评论蕴含的股票市场预期进行了判断,并以此为基础构建了投资者情绪指数。进一步地,本文借助构建的情绪指数探索网络情绪与股票市场之间的关系,相关分析与因果检验的结果都表明该情绪指数对股票收益具有一定的预测性。最后,相较于已有的股票预测方法,本文尝试从两个方向提高股票价格时间序列预测的准确度。一方面,依赖于提取的舆情数据的投资者情绪,本文将情绪作为外部特征融入预测模型。另一方面,本文从时间序列模型本身入手,结合神经网络和计量模型的优势构造NARX-GARCH模型,充分挖掘...
【文章来源】:浙江工业大学浙江省
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
股吧爬取页面图
图 4.2 序列的自相关图与偏自相关图表 4.5 不同 p 和 q 的标准化 BICq=0 q=1 q=2 q=3 q=4P=0 NA 5.4140 5.5318 5.7964 6.2371P=1 4.9931 5.0132 5.0291 5.0500 5.0696P=2 5.0238 4.9730 4.9896 4.9996 5.0139P=3 4.9573 4.9782 4.9942 5.0172 5.0365P=4 4.9142 4.9035 4.8990 5.0289 4.9428Rt的 ARMAX(4,2)模型的参数估计如表 5 所示。对于股票收益率而言,AR(4数在 1%的显著性水平下拒绝原假设,MA(2)的系数在 5%的显著性水平下拒假设,并且自相关检验表明已不具有自相关性,说明 ARMAX(4,2)模型具有
文设置 NARX 神经网络的输入层节点数为 2,隐含层数为 1,10,滞后期为 2。具体结构如下图所示:图 4.3 NARX 网络结构上述经过训练的 NARX 神经网络进行预测,得到预测值和对测误差的效果图如下所示。
【参考文献】:
期刊论文
[1]中国股票网络论坛的信息含量分析[J]. 段江娇,刘红忠,曾剑平. 金融研究. 2017(10)
[2]基于微博的投资者情绪对股票市场影响研究[J]. 张信东,原东良. 情报杂志. 2017(08)
[3]大数据时代基于文本信息的信用风险管理研究[J]. 陈艺云. 金融理论与实践. 2017(04)
[4]大规模情感词典的构建及其在情感分类中的应用[J]. 赵妍妍,秦兵,石秋慧,刘挺. 中文信息学报. 2017(02)
[5]大数据背景下投资者行为研究的趋势分析:基于“内涵-思路-方法”的三重视角[J]. 李倩,吴昊. 中央财经大学学报. 2017(02)
[6]基于Word2Vec的情感词典自动构建与优化[J]. 杨小平,张中夏,王良,张永俊,马奇凤,吴佳楠,张悦. 计算机科学. 2017(01)
[7]基于投资者情绪的股票价格及成交量预测研究[J]. 陈晓红,彭宛露,田美玉. 系统科学与数学. 2016(12)
[8]金融市场文本情绪研究进展[J]. 唐国豪,姜富伟,张定胜. 经济学动态. 2016(11)
[9]基于近邻互信息的SVM-GARCH股票价格预测模型研究[J]. 张贵生,张信东. 中国管理科学. 2016(09)
[10]基于word2vec的互联网商品评论情感倾向研究[J]. 黄仁,张卫. 计算机科学. 2016(S1)
博士论文
[1]数据驱动的金融时间序列预测模型研究[D]. 张贵生.山西大学 2016
硕士论文
[1]基于海量文本挖掘的证券市场情绪监控及预测[D]. 印如意.电子科技大学 2018
[2]基于互联网数据挖掘的投资者情绪与股市收益统计研究[D]. 鲁晓鹏.西南财经大学 2016
[3]微博内容挖掘与金融时间序列关联性研究[D]. 周广.北京邮电大学 2016
[4]大众网络情绪与中国股市的相关性探究[D]. 赖凯声.南开大学 2013
[5]基于中文社会媒体分析的股票行为预测[D]. 袁多利.合肥工业大学 2013
[6]基于关联规则和图排序的句子情感倾向性研究[D]. 宋艳雪.大连理工大学 2011
本文编号:2910883
【文章来源】:浙江工业大学浙江省
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
股吧爬取页面图
图 4.2 序列的自相关图与偏自相关图表 4.5 不同 p 和 q 的标准化 BICq=0 q=1 q=2 q=3 q=4P=0 NA 5.4140 5.5318 5.7964 6.2371P=1 4.9931 5.0132 5.0291 5.0500 5.0696P=2 5.0238 4.9730 4.9896 4.9996 5.0139P=3 4.9573 4.9782 4.9942 5.0172 5.0365P=4 4.9142 4.9035 4.8990 5.0289 4.9428Rt的 ARMAX(4,2)模型的参数估计如表 5 所示。对于股票收益率而言,AR(4数在 1%的显著性水平下拒绝原假设,MA(2)的系数在 5%的显著性水平下拒假设,并且自相关检验表明已不具有自相关性,说明 ARMAX(4,2)模型具有
文设置 NARX 神经网络的输入层节点数为 2,隐含层数为 1,10,滞后期为 2。具体结构如下图所示:图 4.3 NARX 网络结构上述经过训练的 NARX 神经网络进行预测,得到预测值和对测误差的效果图如下所示。
【参考文献】:
期刊论文
[1]中国股票网络论坛的信息含量分析[J]. 段江娇,刘红忠,曾剑平. 金融研究. 2017(10)
[2]基于微博的投资者情绪对股票市场影响研究[J]. 张信东,原东良. 情报杂志. 2017(08)
[3]大数据时代基于文本信息的信用风险管理研究[J]. 陈艺云. 金融理论与实践. 2017(04)
[4]大规模情感词典的构建及其在情感分类中的应用[J]. 赵妍妍,秦兵,石秋慧,刘挺. 中文信息学报. 2017(02)
[5]大数据背景下投资者行为研究的趋势分析:基于“内涵-思路-方法”的三重视角[J]. 李倩,吴昊. 中央财经大学学报. 2017(02)
[6]基于Word2Vec的情感词典自动构建与优化[J]. 杨小平,张中夏,王良,张永俊,马奇凤,吴佳楠,张悦. 计算机科学. 2017(01)
[7]基于投资者情绪的股票价格及成交量预测研究[J]. 陈晓红,彭宛露,田美玉. 系统科学与数学. 2016(12)
[8]金融市场文本情绪研究进展[J]. 唐国豪,姜富伟,张定胜. 经济学动态. 2016(11)
[9]基于近邻互信息的SVM-GARCH股票价格预测模型研究[J]. 张贵生,张信东. 中国管理科学. 2016(09)
[10]基于word2vec的互联网商品评论情感倾向研究[J]. 黄仁,张卫. 计算机科学. 2016(S1)
博士论文
[1]数据驱动的金融时间序列预测模型研究[D]. 张贵生.山西大学 2016
硕士论文
[1]基于海量文本挖掘的证券市场情绪监控及预测[D]. 印如意.电子科技大学 2018
[2]基于互联网数据挖掘的投资者情绪与股市收益统计研究[D]. 鲁晓鹏.西南财经大学 2016
[3]微博内容挖掘与金融时间序列关联性研究[D]. 周广.北京邮电大学 2016
[4]大众网络情绪与中国股市的相关性探究[D]. 赖凯声.南开大学 2013
[5]基于中文社会媒体分析的股票行为预测[D]. 袁多利.合肥工业大学 2013
[6]基于关联规则和图排序的句子情感倾向性研究[D]. 宋艳雪.大连理工大学 2011
本文编号:2910883
本文链接:https://www.wllwen.com/jingjilunwen/jingjiguanlilunwen/2910883.html