网络社交媒体中投资者情绪对股票市场的影响研究
【学位单位】:上海交通大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:F832.51
【部分图文】:
图 1-1 技术路线Fig.1-1 Research Idea1.4 论文结构本文主要分为六个部分,各章节的内容安排如下所示:第一章:绪论。本章主要介绍论文的研究背景、研究目的和意义、研究方法、技术路线和论文结构等。第二章:理论分析及文献综述。通过阅读国内外文献,了解行为金融学理论对股票市场的解释,并了解各时期学者们对于投资者情绪的衡量方式,梳理并总结前人的研究成果和经验,为本文打下扎实的理论基础。第三章:数据来源选择和收集。通过对比不同网站股票论坛的数据质量和可操作性,选择合适的数据来源,并利用 Python 爬虫程序,对互联网数据进行抓取和存储,便于后续分析。第四章:文本情感分析及投资者情绪指数的构建。运用不同的文本分析技术,对下载的数据进行深入挖掘和提炼,并对比不同情感分类技术的准确性,从而构
图 2-1 基于机器学习的情感分类方法步骤1 Steps of sentiment analysis based on Machine Lear金融学理论角度出发,解释了投资者情绪。其次,梳理了国内外学者对于投资者情波动的实证研究结果,指出传统视角下的、收集成本高及存在滞后性的缺陷。而随率先开始尝试从海量 Web2.0 数据中挖掘有多都是基于英语语言文本及欧美发达证券构与英语存在较大差异,且中国证券市场关领域的研究相对还比较匮乏。目前国内媒体角度来研究投资者情绪方面已经做出相同,文本情感分析方法相对较为粗糙,此得出结论也无法统一,说服力不强。结前人的经验和不足基础上,尝试通过网
图 4-1 基于情感词典的情感分析算法逻辑Fig.4-1 steps of sentiment analysis based on sentiment dictionary示了本文基于情感词典法的股评情感分类效果:表 4-1 基于情感词典的情感分类效果评估Precision Recall F-measure乐观 73.6% 75.5% 74.5%悲观 77.1% 74.2% 75.6%发现,在所有乐观情绪的帖子中,有 75.5%的帖子被算法法标注为乐观的帖子中,准确率达到 73.6%;同样,在所有 74.2%的帖子被算法识别了出来,而被算法标注为悲观的 77.7%。可以看出,在我们扩充了基本情感词典之后,情前学者的研究结论要提高了不少。考虑到这一方法操作简类有效性也达到了可以接受的水平。在下一节中我们将着算法,即目前学术界研究较为热门的机器学习分类算法,分类准确性。
【参考文献】
相关期刊论文 前10条
1 程琬芸;林杰;;社交媒体的投资者涨跌情绪与证券市场指数[J];管理科学;2013年05期
2 周胜臣;施询之;瞿文婷;石英子;孙韵辰;;基于微博搜索和SVM的股市时间序列预测研究[J];计算机与现代化;2013年04期
3 林振兴;;网络讨论、投资者情绪与IPO抑价[J];山西财经大学学报;2011年02期
4 池丽旭;庄新田;;中国证券市场的投资者情绪研究[J];管理科学;2010年03期
5 易志高;茅宁;;中国股市投资者情绪测量研究:CICSI的构建[J];金融研究;2009年11期
6 张强;杨淑娥;;中国股市横截面收益特征与投资者情绪的实证研究[J];系统工程;2008年07期
7 张强;杨淑娥;杨红;;中国股市投资者情绪与股票收益的实证研究[J];系统工程;2007年07期
8 伍燕然;韩立岩;;不完全理性、投资者情绪与封闭式基金之谜[J];经济研究;2007年03期
9 徐琳宏;林鸿飞;杨志豪;;基于语义理解的文本倾向性识别机制[J];中文信息学报;2007年01期
10 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[J];中文信息学报;2006年01期
相关硕士学位论文 前3条
1 宋敏晶;基于情感分析的股票预测模型研究[D];哈尔滨工业大学;2013年
2 林炳灿;基于投资者情绪的网络舆论对股票价格影响的统计研究[D];西南财经大学;2013年
3 李玉梅;基于互联网评论的股票市场趋势预测[D];哈尔滨工业大学;2012年
本文编号:2821638
本文链接:https://www.wllwen.com/jingjilunwen/jinrongzhengquanlunwen/2821638.html