投资者日度情绪、超额收益率与市场流动性——基于DCC-GARCH模型的时变相关性研究
发布时间:2020-12-19 02:37
随着互联网科技的发展,利用数据挖掘手段不仅可以构建投资者高频情绪指标,也有助于深入研究投资者情绪与股票市场运行之间的内在联动性。选取2009—2018年共2 198个交易日样本,运用爬虫软件挖掘股票市场大盘评述的网络数据,采用自然语言处理技术进行文本分析,构建了投资者情绪日度指标,利用DCC-GARCH模型研究了投资者情绪、市场超额收益率和市场流动性之间的时变相关关系。实证结果发现:投资者情绪与市场超额收益率和流动性间存在时变相关性,动态条件相关系数总体为正;投资者情绪与市场超额收益率和流动性间的动态条件相关系数具有长期记忆性,并且会受到宏观经济变量的影响;相比于牛市,熊市环境中股票市场的运行对投资者情绪的变动更为敏感;相对于月度数据,更高频的日度指标在刻画情绪与股票市场的相关程度时,能捕捉到即时、准确的信息。这些结论对于深入理解投资者情绪与股票收益和流动性的联动机理有一定意义。
【文章来源】:北京理工大学学报(社会科学版). 2019年05期 北大核心CSSCI
【文章页数】:13 页
【部分图文】:
“大盘评述”数据处理流程市场运行数据来源Python自然语言处理
?(Hownet)情感词典和台湾大学简体中文情感极性词典(NTSUSD)作为基础情感词典语料库。将SnowNLP中的positive(negative)词典、知网(Hownet)和NTSUSD的正(负)面评价词语、正(负)面情感词语词典的积极与消极词汇分别消重后进行组合,由此获得训练数据。接着,对这些数据集中加以训练,并利用词库匹配法对所有样本数据逐条进行量化处理,获得取值区间为[0,1]情绪值。由于部分文本内容中没有情感词汇,这会导致少量分类结果中含有情绪值为0.5的中性类别的量化结果,针对中性类别的内容,利用Python编写程序,安装jieba并在Python中导入NLTK资料库,对这些内容进行分词后,跟踪统计排名前1000的单词和双词,把单词和双词一起作为特征,重新构建训练需要的数据格式,为积极文本赋予“pos”,为消极文本赋予“neg”,形成一个新字典,再次利用SnowNLP将这些原始信息重新进行划分。本文最终获得94726个乐观文本和47044个悲观文本。图2展示了“大盘评述”文本内容的获取和处理流程。3.市场运行数据来源实证分析中涉及的市场超额收益率、市场流动性数据、宏观经济变量数据均来源于万德(WIND)金融数据库,为确保数据的准确性,对这些市场交易数据又通过瑞思金融数据库以及国家统计局网站进行了分批核实。(二)变量指标设计1.投资者情绪投资者情绪是本文核心解释变量,借鉴杨晓兰等[15]148的思路,基于量化得到的当日乐观/悲观帖子数构建投资者日度情绪指数,所得情绪值介于(0,0.5]
。(二)协整检验与滚动回归1.E-G两步法采用E-G两步法对投资者情绪与其他两个变量分别进行全样本的协整检验,以验证各变量间是否有长期稳定的均衡关系。第一步,对各变量进行标准化处理以消除变量差异的影响,再将市场超额收益率和股票流动性对投资者情绪按照方程yt=c+βxt进行OLS回归,结果如式(9)和式(10)所示,其中括号内的为t统计量r=0.2851***sentiment(9)(13.9368)illiq=-0.1419***sentiment(10)(-6.7191)图3上证指数投资者情绪1.20.80.40.0-0.4-0.8-1.2上证指数投资者情绪2009201020112012201320142015201620172018年份上证指数超额收益率2009201020112012201320142015201620172018年份6420-2-4-6-8-10图4上证指数股票超额收益率表1变量描述性统计结果表2变量平稳性和自相关性检验结果变量均值最大值最小值标准差偏度峰度J-B投资者情绪0.0011.099-1.1570.177-0.0227.0081471.560市场超额收益率-0.6655.271-9.3921.462-0.7557.7982317.076市场非流动性0.0010.0090.0000.0012.47513.17911732.790变量ADFPP(C,T,K)平稳性Q(5)Q(10)Q2(5)Q2(10)投资者情绪-26.480(0.000)-40.381(0.000)(100)平稳222.670(0.000)256.770(0.000)20.186(0.001)26.692(0.002)市场超额收益率-44.768(0.000)-44.750(0.000)(100)平稳11.180(0.048)26.182(0.003)524.060(0.000)763.220(0.000)市场非流动性-6.429(0.000)-57.467(0.000)(100)平稳778.420(0.000)1
【参考文献】:
期刊论文
[1]新闻话语方式对股价的影响——基于财经媒体类型的视角[J]. 钟惠波,沈依琴,曾奕萌. 北京理工大学学报(社会科学版). 2018(03)
[2]中国股票网络论坛的信息含量分析[J]. 段江娇,刘红忠,曾剑平. 金融研究. 2017(10)
[3]投资者情绪对股票流动性影响效应与机理研究[J]. 尹海员. 厦门大学学报(哲学社会科学版). 2017(04)
[4]网络消费者信心指数和经济增长的动态相关性研究[J]. 刘伟江,李映桥. 财贸研究. 2017(05)
[5]本地偏好、投资者情绪与股票收益率:来自网络论坛的经验证据[J]. 杨晓兰,沈翰彬,祝宇. 金融研究. 2016(12)
[6]投资者行为如何影响股票市场流动性?——基于投资者情绪、信息认知和卖空约束的分析[J]. 刘晓星,张旭,顾笑贤,姚登宝. 管理科学学报. 2016(10)
[7]网络论坛信息挖掘与投资者情绪测度——基于多元GARCH-BEKK模型分析[J]. 易洪波,欧云. 管理现代化. 2016(05)
[8]基于文本挖掘和百度指数的投资者情绪指数研究[J]. 孟雪井,孟祥兰,胡杨洋. 宏观经济研究. 2016(01)
[9]投资者情绪对股价的影响——基于AH股交叉上市股票的实证分析[J]. 陆静,周媛. 中国管理科学. 2015(11)
[10]投资者情绪影响下资本资产定价的区制性[J]. 谢军,杨春鹏. 系统工程. 2015(01)
本文编号:2925089
【文章来源】:北京理工大学学报(社会科学版). 2019年05期 北大核心CSSCI
【文章页数】:13 页
【部分图文】:
“大盘评述”数据处理流程市场运行数据来源Python自然语言处理
?(Hownet)情感词典和台湾大学简体中文情感极性词典(NTSUSD)作为基础情感词典语料库。将SnowNLP中的positive(negative)词典、知网(Hownet)和NTSUSD的正(负)面评价词语、正(负)面情感词语词典的积极与消极词汇分别消重后进行组合,由此获得训练数据。接着,对这些数据集中加以训练,并利用词库匹配法对所有样本数据逐条进行量化处理,获得取值区间为[0,1]情绪值。由于部分文本内容中没有情感词汇,这会导致少量分类结果中含有情绪值为0.5的中性类别的量化结果,针对中性类别的内容,利用Python编写程序,安装jieba并在Python中导入NLTK资料库,对这些内容进行分词后,跟踪统计排名前1000的单词和双词,把单词和双词一起作为特征,重新构建训练需要的数据格式,为积极文本赋予“pos”,为消极文本赋予“neg”,形成一个新字典,再次利用SnowNLP将这些原始信息重新进行划分。本文最终获得94726个乐观文本和47044个悲观文本。图2展示了“大盘评述”文本内容的获取和处理流程。3.市场运行数据来源实证分析中涉及的市场超额收益率、市场流动性数据、宏观经济变量数据均来源于万德(WIND)金融数据库,为确保数据的准确性,对这些市场交易数据又通过瑞思金融数据库以及国家统计局网站进行了分批核实。(二)变量指标设计1.投资者情绪投资者情绪是本文核心解释变量,借鉴杨晓兰等[15]148的思路,基于量化得到的当日乐观/悲观帖子数构建投资者日度情绪指数,所得情绪值介于(0,0.5]
。(二)协整检验与滚动回归1.E-G两步法采用E-G两步法对投资者情绪与其他两个变量分别进行全样本的协整检验,以验证各变量间是否有长期稳定的均衡关系。第一步,对各变量进行标准化处理以消除变量差异的影响,再将市场超额收益率和股票流动性对投资者情绪按照方程yt=c+βxt进行OLS回归,结果如式(9)和式(10)所示,其中括号内的为t统计量r=0.2851***sentiment(9)(13.9368)illiq=-0.1419***sentiment(10)(-6.7191)图3上证指数投资者情绪1.20.80.40.0-0.4-0.8-1.2上证指数投资者情绪2009201020112012201320142015201620172018年份上证指数超额收益率2009201020112012201320142015201620172018年份6420-2-4-6-8-10图4上证指数股票超额收益率表1变量描述性统计结果表2变量平稳性和自相关性检验结果变量均值最大值最小值标准差偏度峰度J-B投资者情绪0.0011.099-1.1570.177-0.0227.0081471.560市场超额收益率-0.6655.271-9.3921.462-0.7557.7982317.076市场非流动性0.0010.0090.0000.0012.47513.17911732.790变量ADFPP(C,T,K)平稳性Q(5)Q(10)Q2(5)Q2(10)投资者情绪-26.480(0.000)-40.381(0.000)(100)平稳222.670(0.000)256.770(0.000)20.186(0.001)26.692(0.002)市场超额收益率-44.768(0.000)-44.750(0.000)(100)平稳11.180(0.048)26.182(0.003)524.060(0.000)763.220(0.000)市场非流动性-6.429(0.000)-57.467(0.000)(100)平稳778.420(0.000)1
【参考文献】:
期刊论文
[1]新闻话语方式对股价的影响——基于财经媒体类型的视角[J]. 钟惠波,沈依琴,曾奕萌. 北京理工大学学报(社会科学版). 2018(03)
[2]中国股票网络论坛的信息含量分析[J]. 段江娇,刘红忠,曾剑平. 金融研究. 2017(10)
[3]投资者情绪对股票流动性影响效应与机理研究[J]. 尹海员. 厦门大学学报(哲学社会科学版). 2017(04)
[4]网络消费者信心指数和经济增长的动态相关性研究[J]. 刘伟江,李映桥. 财贸研究. 2017(05)
[5]本地偏好、投资者情绪与股票收益率:来自网络论坛的经验证据[J]. 杨晓兰,沈翰彬,祝宇. 金融研究. 2016(12)
[6]投资者行为如何影响股票市场流动性?——基于投资者情绪、信息认知和卖空约束的分析[J]. 刘晓星,张旭,顾笑贤,姚登宝. 管理科学学报. 2016(10)
[7]网络论坛信息挖掘与投资者情绪测度——基于多元GARCH-BEKK模型分析[J]. 易洪波,欧云. 管理现代化. 2016(05)
[8]基于文本挖掘和百度指数的投资者情绪指数研究[J]. 孟雪井,孟祥兰,胡杨洋. 宏观经济研究. 2016(01)
[9]投资者情绪对股价的影响——基于AH股交叉上市股票的实证分析[J]. 陆静,周媛. 中国管理科学. 2015(11)
[10]投资者情绪影响下资本资产定价的区制性[J]. 谢军,杨春鹏. 系统工程. 2015(01)
本文编号:2925089
本文链接:https://www.wllwen.com/guanlilunwen/zhqtouz/2925089.html
最近更新
教材专著