基于文本情感分析的股价预测研究与实现
本文关键词:基于文本情感分析的股价预测研究与实现,由笔耕文化传播整理发布。
【摘要】:股票正在成为中国居民资产配置的一个重要方向。但是股票价格的波动瞬息万变,如果不能准确预测股价走势,把握合适的买卖时机,不但无法保障收益,还会承担巨大风险。目前的股票分析主要依靠炒股软件的技术指标,基于经验人工判断。这种方式主要存在两个问题。第一,技术指标种类繁多,每种指标的适用范围不同,而且单一指标的预测效果较差,通常需要结合不同的指标综合判断。这对于投资者来说有较大的学习成本。第二,技术指标本身是通过价格、成交量等反映在股市本身的客观事实演变而来,无法反映投资者的主观态度和情绪。为了解决以上问题,本文对股价的预测问题进行研究,通过预测模型,为投资者提供“买入”、“持有”、“卖出”三种投资信号,帮助投资者进行决策。本文工作主要依照以下两个方面展开。(1)基于技术指标的股价预测。首先,对股价预测的目标进行定义,确定买入、持有、卖出的阈值,将这三类结果作为预测输出。其次,对MACD、RSI、KDJ等技术指标进行量化,作为预测输入。最后,通过实验对比,选择表现最优的参数,构造出一个基于BP神经网络的股价预测模型。(2)加入了投资者情绪指标的股价预测。首先,通过网络爬虫,对“股吧”中的股评信息进行抓取。其次,构造了专门针对金融领域的词典,利用N-GRAM新词发现算法构建分词词典,利用PMI算法扩展情感词典。然后,对比了情感词词典、朴素贝叶斯两种情感分类算法,构造出一个性能最优的情感分类器。最后,利用构建的情感分类器对股评信息进行情感分类,计算投资者情绪指标,并将其作为输入加入到股价预测模型。本文探索性地将投资者情绪指标作为变量引入股价预测的模型中,实验结果表明,投资者情绪指标对于预测股价的走势具有指导意义,能够在一定程度上提高股价预测的准确性。并最终融合技术指标与投资者情绪指标,基于BP神经网络构造出一个性能不错的股价预测模型。
【关键词】:股票预测 情感倾向性分析 BP神经网络 朴素贝叶斯
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:F832.51
【目录】:
- 中文摘要3-4
- 英文摘要4-9
- 1 绪论9-14
- 1.1 研究背景与意义9-10
- 1.2 国内外研究现状10-12
- 1.2.1 股票分析研究现状10-11
- 1.2.2 情感分类研究现状11-12
- 1.3 研究内容及创新点12-13
- 1.4 本文组织结构13-14
- 2 相关理论和技术14-26
- 2.1 股票分析14
- 2.1.1 基本面分析的方法14
- 2.1.2 技术面分析的方法14
- 2.2 文本挖掘关键技术14-18
- 2.2.1 文本预处理14-16
- 2.2.2 词库扩展16
- 2.2.3 特征选择16-17
- 2.2.4 文本表示17-18
- 2.3 文本情感分类技术18-20
- 2.3.1 基于语素的方法18
- 2.3.2 基于语义的方法18-19
- 2.3.3 基于机器学习的方法19-20
- 2.4 朴素贝叶斯20-22
- 2.5 BP神经网络22-25
- 2.5.1 BP神经网络简介22
- 2.5.2 BP神经网络模型22-24
- 2.5.3 BP神经网络算法24-25
- 2.6 本章小结25-26
- 3 基于技术指标的股价预测26-40
- 3.1 股价预测框架26-28
- 3.2 预测目标定义28
- 3.3 技术指标28-33
- 3.3.1 K线图28-30
- 3.3.2 量价关系30-31
- 3.3.3 平滑异同平均线(MACD)31
- 3.3.4 相对强弱指数(RSI)31-32
- 3.3.5 随机指标(KDJ)32
- 3.3.6 量能潮指标(OBV)32-33
- 3.4 神经网络建模33-35
- 3.4.1 输入输出设计33-34
- 3.4.2 网络拓扑设计34-35
- 3.5 实验及结果分析35-39
- 3.5.1 实验方案35-38
- 3.5.2 实验及结果分析38-39
- 3.6 本章小结39-40
- 4 加入投资者情绪指标的股价预测40-56
- 4.1 股票评论语料库构建40-44
- 4.1.1 数据来源40
- 4.1.2 网络爬虫40-42
- 4.1.3 数据获取42-44
- 4.2 金融词典构建44-47
- 4.2.1 N-GRAM算法构造分词词典44-45
- 4.2.2 PMI算法扩展情感词典45-47
- 4.2.3 领域词典的生成47
- 4.3 情感倾向性分析47-49
- 4.3.1 基于情感词典的情感倾向性分析47-48
- 4.3.2 基于朴素贝叶斯的情感倾向性分析48-49
- 4.4 投资者情绪指标49-51
- 4.5 实验及结果分析51-55
- 4.5.1 实验方案51-53
- 4.5.2 实验及结果分析53-55
- 4.6 本章小结55-56
- 5 总结和展望56-58
- 5.1 工作总结56
- 5.2 后续研究展望56-58
- 致谢58-59
- 参考文献59-62
【参考文献】
中国期刊全文数据库 前10条
1 盛仲飙;;BP神经网络在数据预测中的应用[J];软件导刊;2016年01期
2 葛斌;李芳芳;郭丝路;汤大权;;基于知网的词汇语义相似度计算方法研究[J];计算机应用研究;2010年09期
3 党蕾;张蕾;;一种基于知网的中文句子情感倾向判别方法[J];计算机应用研究;2010年04期
4 柳位平;朱艳辉;栗春亮;向华政;文志强;;中文基础情感词词典构建方法研究[J];计算机应用;2009年10期
5 李云飞;龚冬生;惠晓峰;;基于价值投资的PCA-SVM股票选择模型研究[J];西安工程大学学报;2009年03期
6 张中华;丁华福;;基于混沌神经网络的股票分析及其预测[J];计算机技术与发展;2009年03期
7 殷洪才;赵春燕;;基于神经网络股票预测的研究[J];哈尔滨师范大学自然科学学报;2007年03期
8 李庆东;聚类分析在股票分析中的应用[J];辽宁石油化工大学学报;2005年03期
9 柴明亮,宋苏;关联规则在股票分析中的应用[J];计算机应用;2005年04期
10 代六玲,黄河燕,陈肇雄;中文文本分类中特征抽取方法的比较研究[J];中文信息学报;2004年01期
中国硕士学位论文全文数据库 前10条
1 马妍;商品评论情感分析系统的设计与实现[D];北京交通大学;2015年
2 郭俊峰;聚类分析下的股票投资价值挖掘研究[D];大连海事大学;2015年
3 石馨;基于酒店领域情感词典的分类器研究[D];河北大学;2014年
4 刘建伟;房价微博情感分类研究[D];哈尔滨工业大学;2014年
5 刘欣;互联网财经新闻媒体对中国股市的影响力排名研究[D];西南财经大学;2014年
6 黄进;金融领域中基于UGC的情感分析[D];华东理工大学;2014年
7 张爱莲;汽车评论情感分析系统的设计与实现[D];西安电子科技大学;2013年
8 赵丽丽;互联网财经新闻对股市影响的定量分析[D];西南财经大学;2012年
9 赵茜倩;互联网财经新闻对中国股市的影响研究[D];西南财经大学;2012年
10 郑文;数据挖掘在股票分析中的应用[D];复旦大学;2012年
本文关键词:基于文本情感分析的股价预测研究与实现,由笔耕文化传播整理发布。
,本文编号:289327
本文链接:https://www.wllwen.com/jingjilunwen/touziyanjiulunwen/289327.html