当前位置:主页 > 管理论文 > 信贷论文 >

基于大数据的投资者情绪指数构建及其应用研究

发布时间:2021-11-12 09:43
  传统金融学认为投资者是“理性人”,当市场出现波动价格偏离价值时会立即纠正这种偏误,而上世纪七十年代末以来,金融市场出现了许多有悖传统金融理论的异象。对此,行为金融学基于心理学等视角研究了投资者在参与市场过程中的心理特征与决策行为,并形成了较为完整的理论体系。行为金融学的一个重要研究内容为投资者情绪,其中投资者情绪的量化是相关研究的基础与重点。大数据时代前,学者们主要是选取一些如成交量、换手率等能够反映股票市场总体发展状况的指标作为情绪的代理变量,这类变量无法全面反映投资者情绪变化,且只能从客观上反映投资者情绪。大数据时代的到来,互联网数据的大量、全面、实时、真实等特点为投资者情绪指数的编制提供了更全面的数据基础,同时随着机器学习等技术的不断成熟,原先因为技术限制而无法获取和利用的数据逐渐被学者们纳入到可以研究的范围内,因此,基于大数据构建投资者情绪指数是一种相对客观且准确的情绪度量方法。本文主要研究了投资者情绪指数的构建及其与我国股市的影响关系。关于投资者情绪指数构建方面,首先基于大数据视角下投资者情绪的界定,选取了能反映投资者情感倾向的“用户评论内容”与能反映投资者关注度的“用户发帖... 

【文章来源】:河南大学河南省

【文章页数】:83 页

【学位级别】:硕士

【部分图文】:

基于大数据的投资者情绪指数构建及其应用研究


研究思路图

流程图,流程图,模型,机器学习


相关理论分析与方法16基于机器学习分类法的分类效果更加依赖样本数据量。该方法有以下优点:1、学习能力强,机器学习方法不分析文字表面的意思,其通过创建学习内容的抽象表征,这些泛化的结果被称为向量,机器学习可以用向量对数据进行分类,且能够用最新的训练样本学习新出现的词语语义变化。2、机器学习分类方法更加精确,且模型的训练集样本量越多,模型分类效果越好,故为了达到更加精准的效果,可以简单地通过增加训练样本量从而不断提高准确度。2.4.2指数编制中主要涉及的机器学习算法(1)LSTM算法LSTM(LongShortTermMemory)也称长短期记忆网络模型。LSTM主要由记忆细胞(Cell)与门构成,其中记忆细胞直接在整个链条上进行,其状态类似于传送带,只存在一些少量的线性交互,不会影响到在上面流传的信息。LSTM主要运用三个“门”结构来增加或删除“细胞状态”的信息,其中门结构包括输出门、输入门、遗忘门三种,通过控制流传的信息的增加与去除,实现记忆细胞的保持不变与信息更新。LSTM流程图见下图2-1。图2-1LSTM模型流程图遗忘门的功能是决定从上一层的“细胞状态”中丢弃哪些信息,主要通过一定的遗忘概率来判断是否需要遗忘上一层的细胞隐藏状态,其表达式为:1,tttfffwhxb(2-1)其中:为激活函数,其通过输出一个[0,1]之间的概率值决定多少变量可以通过,1表示“允许所有变量通过”,0表示“不允许任何变量通过”fw为记忆单元遗忘上一层细胞状态的概率,tx为当前时刻的输入值,t1h为上一时刻的输出值,0,1tf,

网站,金融界,雪球,财经


基于大数据的投资者情绪指数的测度28网易等大型互联网门户旗下设立的股吧。本文选择股吧主要参考两大标准,一是专业性,二是代表性。从专业性角度考虑,本文选择从专业的财经网站中选龋从代表性角度考虑,本文参考了几个网站在Alexa(alexa.com)网站上的排名,Alexa是一个专业提供网站流量信息的网站。在Alexa网站获取到和讯网(hexun.com)、雪球网(xueqiu.com)、金融界(jrj.com.cn)、东方财富网(eastmoney.com)、同花顺(10jqka.com.cn)几个网站访问量的竞争性分析。见下图4-1。图4-1财经网站在Alexa上的访问量排名从上图可知,在网站访问量指标方面,相比于金融界、同花顺、和讯网以及雪球网,东方财富网的访问量更高。且东方财富网股吧的阅读量、发帖量等数据也较高,影响力较大,故选取东方财富网股吧论坛作为文本数据的来源。4.1.2指数编制数据的获取为了获取东方财富网股吧的文本数据,本文通过分析该网站的网页结构,基于Python语言中的requests、beautifulsoup4、pandas、multiprocessing等外部库设计构建了适用东方财富网上证指数股吧的多进程爬虫框架。东方财富网存在很强的反爬措施。为了防止股吧网站禁止真实IP的访问使得数据获取失败,首先在爬虫框架下添加了代理IP池来伪装真实的IP地址。然后在request的请求中添加了user-agent、cookie、refere等浏览器信息,从而将爬虫程序伪装成正常的浏览器访问,来降低遭到股吧网站禁止访问的风险,进一步提高爬虫程序的稳定性。具体爬虫框架思路如下:选取requests库作为请求器,requests库在程序访问中更接近正常URL访问过程,是一个专门用来处理HTTP请求的第三方库。调用requests

【参考文献】:
期刊论文
[1]投资者情绪与股票横截面收益——基于微博数据的实证研究[J]. 原东良.  金融与经济. 2018(07)
[2]基于股吧信息的投资者情绪与极端收益的可预测性研究[J]. 金秀,姜尚伟,苑莹.  管理评论. 2018(07)
[3]大数据情绪指数与经济学研究:现状、问题与展望[J]. 黄燕芬,张超.  教学与研究. 2018(05)
[4]基于股评的投资者情绪对股票市场的影响[J]. 部慧,解峥,李佳鸿,吴俊杰.  管理科学学报. 2018(04)
[5]情绪指数与市场收益:纳入中国波指(iVX)的分析[J]. 许海川,周炜星.  管理科学学报. 2018(01)
[6]我国股市投资者情绪指数构建及其影响研究[J]. 易洪波,蔡玉叶,董大勇.  价格理论与实践. 2017(10)
[7]中国股票网络论坛的信息含量分析[J]. 段江娇,刘红忠,曾剑平.  金融研究. 2017(10)
[8]本地偏好、投资者情绪与股票收益率:来自网络论坛的经验证据[J]. 杨晓兰,沈翰彬,祝宇.  金融研究. 2016(12)
[9]我国股票市场投资者情绪SENT指数的构建——基于上证A股公司的面板数据[J]. 马若微,张娜.  中央财经大学学报. 2015(07)
[10]投资者情绪对中国IPO首日收益率影响的实证分析[J]. 蒋先玲,张斯琪.  经济问题. 2015(06)

博士论文
[1]基于情绪的投资者行为研究[D]. 薛斐.复旦大学 2005

硕士论文
[1]基于微博文本挖掘的投资者情绪与股票市场表现研究[D]. 张伟.山东大学 2015



本文编号:3490657

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/bankxd/3490657.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1b51a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com