基于文本挖掘的投资者情绪对中国股市影响研究
发布时间:2021-08-28 02:41
2009年提出的CICSI综合投资者情绪指数是现阶段度量中国股市投资者情绪的常用指数,该指数借鉴了2006年Baker和Wurgler提出的BW综合情绪指数的构建方法,选择了六个适用于中国股市的情绪指标(封闭式基金折价、上月交易量、IPO个数、IPO首日收益、上月新增投资者开户数、投资者信心指数),运用主成分分析法以及后续的处理编制而成。2009年CICSI指数提出时,由于中国网络上的股票社区参与人数较少,用户活跃程度较低,文本挖掘技术尚未普及,因此并未将网络媒体上投资者的评论等文本数据纳入到研究范围内。近年来,随着线上股票社区不断发展壮大,文本挖掘以及情感分析技术的不断完善,国内外众多研究者开始从线上股票论坛评论中提取投资者情绪的代理变量。在此背景下,本文认为投资者在线上股票论坛的言论是其投资情绪的表现,将其加入CICSI指数可以弥补原指数在网络投资舆情方面的信息缺失。因此,本文基于日均游客访问量、发帖量及数据可获取性等综合因素,选择东方财富股吧作为线上股票社区的数据来源,运用文本挖掘技术提取了2014年1月1日到2018年12月31日沪深300成分股股吧帖子,并应用情感词典等情感分...
【文章来源】:南开大学天津市 211工程院校 985工程院校 教育部直属院校
【文章页数】:43 页
【学位级别】:硕士
【部分图文】:
投资舆情指标(IS)与投资者情绪指数(CICSI)的折线图
图 2 综合投资者情绪指数与时间的散点图和二次回归曲线从上图可以看出,在 2014 年 1 月到 2018 年 12 月共 60 个月份的时间区间内,本节构建的综合投资者情绪指数(ISX)总体上呈现先升后降的趋势,可以根据指标值的趋势和数值大小分为四个阶段。第一阶段在 2014 年 4 月到 2015 年6 月,期间指标值呈现持续上升趋势,意味着投资者情绪由悲观转为乐观;第二阶段在 2015 年 6 月到 2015 年 10 月指标值急速下降;第三阶段为 2015 年 10 月到 2017 年 6 月,在这一阶段,ISX 虽然偶有震荡,在 2015 年 12 月达到这一阶段最高值,但总体持续稳定在 0 和 1 之间,意味着投资者情绪在这一阶段保持稳定;第四阶段为 2017 年 7 月到 2018 年 12 月,在这一阶段指标值呈现着持续下降趋势,投资者情绪逐渐低迷。
图 3 上证指数与时间的散点图和二次回归曲线上图是上证指数在 2014 年 1 月到 2018 年 12 月时期同期的表现,2014 年 6月前,指数一直在 2000 点左右徘徊;2014 年 7 月到 2015 年 5 月,受到新国九条、沪港通、IPO 重启等改革措施影响,央行降息、投资者信心高涨等多重因素刺激,上证指数迅速上攻,尽管偶有震荡起伏,但日成交金额屡破万亿大关,更是在 2015 年 5 月最高值冲破 5000 点大关;随着股灾降临,上证指数在 2015 年6 月开始持续剧烈下跌,于 2016 年 2 月跌至 2600 点附近;从 2016 年 3 月到 2017年底上证指数呈现缓慢上升状态;2018 年全年则呈现持续下跌状态。 将综合投资者情绪指数(ISX)与上证指数在 2014 年 1 月到 2018 年 12 月同期表现进行对比可以发现,总体趋势上 ISX 与上证指数都呈现先升后降趋势,ISX 在 2014 年 4 月到 2015 年 6 月的持续上涨对应着上证指数在 2014 年 7 月到2015 年 5 月的一波大行情,体现出这一阶段股市持续上涨投资者的乐观情绪;而 2015 年 6 月到 2015 年 10 月综合投资者情绪指数的急剧下跌也对应地反映于2015 年 5 月开始的股灾,表示股灾导致投资者情绪迅速的由乐观转为悲观;2015
本文编号:3367621
【文章来源】:南开大学天津市 211工程院校 985工程院校 教育部直属院校
【文章页数】:43 页
【学位级别】:硕士
【部分图文】:
投资舆情指标(IS)与投资者情绪指数(CICSI)的折线图
图 2 综合投资者情绪指数与时间的散点图和二次回归曲线从上图可以看出,在 2014 年 1 月到 2018 年 12 月共 60 个月份的时间区间内,本节构建的综合投资者情绪指数(ISX)总体上呈现先升后降的趋势,可以根据指标值的趋势和数值大小分为四个阶段。第一阶段在 2014 年 4 月到 2015 年6 月,期间指标值呈现持续上升趋势,意味着投资者情绪由悲观转为乐观;第二阶段在 2015 年 6 月到 2015 年 10 月指标值急速下降;第三阶段为 2015 年 10 月到 2017 年 6 月,在这一阶段,ISX 虽然偶有震荡,在 2015 年 12 月达到这一阶段最高值,但总体持续稳定在 0 和 1 之间,意味着投资者情绪在这一阶段保持稳定;第四阶段为 2017 年 7 月到 2018 年 12 月,在这一阶段指标值呈现着持续下降趋势,投资者情绪逐渐低迷。
图 3 上证指数与时间的散点图和二次回归曲线上图是上证指数在 2014 年 1 月到 2018 年 12 月时期同期的表现,2014 年 6月前,指数一直在 2000 点左右徘徊;2014 年 7 月到 2015 年 5 月,受到新国九条、沪港通、IPO 重启等改革措施影响,央行降息、投资者信心高涨等多重因素刺激,上证指数迅速上攻,尽管偶有震荡起伏,但日成交金额屡破万亿大关,更是在 2015 年 5 月最高值冲破 5000 点大关;随着股灾降临,上证指数在 2015 年6 月开始持续剧烈下跌,于 2016 年 2 月跌至 2600 点附近;从 2016 年 3 月到 2017年底上证指数呈现缓慢上升状态;2018 年全年则呈现持续下跌状态。 将综合投资者情绪指数(ISX)与上证指数在 2014 年 1 月到 2018 年 12 月同期表现进行对比可以发现,总体趋势上 ISX 与上证指数都呈现先升后降趋势,ISX 在 2014 年 4 月到 2015 年 6 月的持续上涨对应着上证指数在 2014 年 7 月到2015 年 5 月的一波大行情,体现出这一阶段股市持续上涨投资者的乐观情绪;而 2015 年 6 月到 2015 年 10 月综合投资者情绪指数的急剧下跌也对应地反映于2015 年 5 月开始的股灾,表示股灾导致投资者情绪迅速的由乐观转为悲观;2015
本文编号:3367621
本文链接:https://www.wllwen.com/jingjilunwen/jinrongzhengquanlunwen/3367621.html