投资者情绪对股票市场的预测研究 ——基于情感因子的时变概率密度函数方法
发布时间:2021-09-29 23:44
股票市场是金融市场的一个非常重要的组成部分,其能够反映国家的经济运行情况,常常被称作经济的“晴雨表”、“风向标”。能够正确预测股市的走势和趋势对于政府和投资者都是一件具有重大意义的事。股市的走势会受到非常多方面因素的影响,现代金融市场金融学者们很少考虑行为因素、心理因素等对投资者的决策产生影响。但是事实上投资者在做出决策的时候会受到各种各样的因素影响,行为金融学提出,非理性的股市投资者的心理和行为将会影响股票市场态势,使股票价格脱离了其本身的价值。国内外诸多学者对股指预测均有所研究,但是基于行为金融的股票大盘分析相对来说比较少。在大数据时代的大背景下,本文利用爬虫技术采集了网络上的财经评论信息,用这些文本信息和大盘指数数据对投资者的财经评论行为展开分析。本文首先利用文本处理技术对财经评论信息进行处理,研究了投资者的财经评论行为并进行假设验证,证明了数据的有效性。然后本文利用情感分类技术研究了财经评论的投资者情感倾向,对金融数据进行了文本分类并进行了情感分析、对投资者情绪进行量化以及更进一步的利用情感极性分析作为特征辅助预测股票市场未来趋势。本文使用了时变概率密度函数模型作为基础模型来预...
【文章来源】:浙江工商大学浙江省
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
图3-3爬虫所取的网络文本字段示例??经过爬虫系统的爬取,得到了?110余万评论文本数据,时间覆盖到2012年??
通过观察股票大盘数据,我们对上证指数的收盘价和股票收益率作描述性统??计如下:??首先,我们分析了上证指数的收盘价折线图,如图4-1:??5500.00-??{\??"[??|?3500.00-?/?丨??2500.00-??1500.00-??s ̄ ̄’T?-?1? ̄ ̄ ̄? ̄ ̄?1?1?)?I?1??I?:??2015/01.05?2015/06/03?2015/11)02?2016幻3/29?2016/08,'*22?2017,^1^19?2017;06/22??date??图4-1上证指数大盘波动图??如上图4-1所示,可以看出,2015年股票市场经历了大涨大跌,股市震荡非??常强烈,并从2016年开始处于缓慢上升状态,直到现在也没有太大的波动,基??35??
本上是围绕着3300点上下波动。??为了更好的了解股票大盘的价格分布,我们对上证指数的收盘价做了以下频??率直方图,如图4-2:??125H?_??隱?醜=?3322.12??^?=?472.802??N?=?630??1。叫??f?7sj??50-j??。—r?—??2500.00?3000.00?3SQ0.00?4000,Q0?4500.00?5000.00??指数??图4_2上证指数频率直方图??从图中可以看出,上证指数收盘价的均值为3322.12,标准偏差为472.802。??且可以看出有可能不服从正态分布,上证指数收盘价很有可能为不平稳序列。??一般来说,我们在对时间序列模型进行回归预测时,要求时间序列数据是平??稳的,而本文使用的时变概率密度函数模型有同样的要求,通过对本文的上证指??数收盘价时间序列数据的观察,收盘价序列有可能存在不稳定性,所以对序列数??据做平稳性检验,检验结果如下表4-2:???表4-2数据差分前的平稳性检验结果???显著性水平?ADF值?临界值?结论??1%?-2.112656?-3.440197?不平稳??5%?-2.112656?-2.865776?不平稳??10%?-2.112656?-2.569083?不平稳??可以看到
【参考文献】:
期刊论文
[1]基于微博的投资者情绪对股票市场影响研究[J]. 张信东,原东良. 情报杂志. 2017(08)
[2]基于改进的支持向量机的股票预测方法[J]. 郝知远. 江苏科技大学学报(自然科学版). 2017(03)
[3]基于灰度预测与马尔柯夫过程的股票价格预测模型[J]. 卢嘉澍,孙坤,廉洁,李灿. 现代商业. 2017(17)
[4]投资者情绪与股市泡沫[J]. 李晓丹. 中国商论. 2017(08)
[5]基于微博信息的股票交易预测研究[J]. 胡婧,叶建木. 财政监督. 2017(05)
[6]统计模型在中文文本挖掘中的应用[J]. 王健,张俊妮. 数理统计与管理. 2017(04)
[7]基于投资者情绪的股票价格及成交量预测研究[J]. 陈晓红,彭宛露,田美玉. 系统科学与数学. 2016(12)
[8]基于百度指数的投资者关注度与股票市场表现的实证分析[J]. 陈植元,米雁翔,厉洋军,郑君君. 统计与决策. 2016(23)
[9]基于文本信息的股票指数预测[J]. 董理,王中卿,熊德意. 北京大学学报(自然科学版). 2017(02)
[10]中国股票市场国际联动性研究——基于网络分析方法[J]. 李岸,粟亚亚,乔海曙. 数量经济技术经济研究. 2016(08)
博士论文
[1]文本挖掘中若干关键问题的研究[D]. 胡佳妮.北京邮电大学 2008
硕士论文
[1]基于文本情感分析的股价预测研究与实现[D]. 戴成骏.重庆大学 2016
[2]人民币汇率预测研究[D]. 罗贤兴.浙江工商大学 2015
[3]基于情感分析的股票预测模型研究[D]. 宋敏晶.哈尔滨工业大学 2013
本文编号:3414683
【文章来源】:浙江工商大学浙江省
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
图3-3爬虫所取的网络文本字段示例??经过爬虫系统的爬取,得到了?110余万评论文本数据,时间覆盖到2012年??
通过观察股票大盘数据,我们对上证指数的收盘价和股票收益率作描述性统??计如下:??首先,我们分析了上证指数的收盘价折线图,如图4-1:??5500.00-??{\??"[??|?3500.00-?/?丨??2500.00-??1500.00-??s ̄ ̄’T?-?1? ̄ ̄ ̄? ̄ ̄?1?1?)?I?1??I?:??2015/01.05?2015/06/03?2015/11)02?2016幻3/29?2016/08,'*22?2017,^1^19?2017;06/22??date??图4-1上证指数大盘波动图??如上图4-1所示,可以看出,2015年股票市场经历了大涨大跌,股市震荡非??常强烈,并从2016年开始处于缓慢上升状态,直到现在也没有太大的波动,基??35??
本上是围绕着3300点上下波动。??为了更好的了解股票大盘的价格分布,我们对上证指数的收盘价做了以下频??率直方图,如图4-2:??125H?_??隱?醜=?3322.12??^?=?472.802??N?=?630??1。叫??f?7sj??50-j??。—r?—??2500.00?3000.00?3SQ0.00?4000,Q0?4500.00?5000.00??指数??图4_2上证指数频率直方图??从图中可以看出,上证指数收盘价的均值为3322.12,标准偏差为472.802。??且可以看出有可能不服从正态分布,上证指数收盘价很有可能为不平稳序列。??一般来说,我们在对时间序列模型进行回归预测时,要求时间序列数据是平??稳的,而本文使用的时变概率密度函数模型有同样的要求,通过对本文的上证指??数收盘价时间序列数据的观察,收盘价序列有可能存在不稳定性,所以对序列数??据做平稳性检验,检验结果如下表4-2:???表4-2数据差分前的平稳性检验结果???显著性水平?ADF值?临界值?结论??1%?-2.112656?-3.440197?不平稳??5%?-2.112656?-2.865776?不平稳??10%?-2.112656?-2.569083?不平稳??可以看到
【参考文献】:
期刊论文
[1]基于微博的投资者情绪对股票市场影响研究[J]. 张信东,原东良. 情报杂志. 2017(08)
[2]基于改进的支持向量机的股票预测方法[J]. 郝知远. 江苏科技大学学报(自然科学版). 2017(03)
[3]基于灰度预测与马尔柯夫过程的股票价格预测模型[J]. 卢嘉澍,孙坤,廉洁,李灿. 现代商业. 2017(17)
[4]投资者情绪与股市泡沫[J]. 李晓丹. 中国商论. 2017(08)
[5]基于微博信息的股票交易预测研究[J]. 胡婧,叶建木. 财政监督. 2017(05)
[6]统计模型在中文文本挖掘中的应用[J]. 王健,张俊妮. 数理统计与管理. 2017(04)
[7]基于投资者情绪的股票价格及成交量预测研究[J]. 陈晓红,彭宛露,田美玉. 系统科学与数学. 2016(12)
[8]基于百度指数的投资者关注度与股票市场表现的实证分析[J]. 陈植元,米雁翔,厉洋军,郑君君. 统计与决策. 2016(23)
[9]基于文本信息的股票指数预测[J]. 董理,王中卿,熊德意. 北京大学学报(自然科学版). 2017(02)
[10]中国股票市场国际联动性研究——基于网络分析方法[J]. 李岸,粟亚亚,乔海曙. 数量经济技术经济研究. 2016(08)
博士论文
[1]文本挖掘中若干关键问题的研究[D]. 胡佳妮.北京邮电大学 2008
硕士论文
[1]基于文本情感分析的股价预测研究与实现[D]. 戴成骏.重庆大学 2016
[2]人民币汇率预测研究[D]. 罗贤兴.浙江工商大学 2015
[3]基于情感分析的股票预测模型研究[D]. 宋敏晶.哈尔滨工业大学 2013
本文编号:3414683
本文链接:https://www.wllwen.com/jingjilunwen/jinrongzhengquanlunwen/3414683.html