当前位置:主页 > 经济论文 > 投融资论文 >

基于文本情感分析的股价预测研究与实现

发布时间:2017-04-06 17:22

  本文关键词:基于文本情感分析的股价预测研究与实现,由笔耕文化传播整理发布。


【摘要】:股票正在成为中国居民资产配置的一个重要方向。但是股票价格的波动瞬息万变,如果不能准确预测股价走势,把握合适的买卖时机,不但无法保障收益,还会承担巨大风险。目前的股票分析主要依靠炒股软件的技术指标,基于经验人工判断。这种方式主要存在两个问题。第一,技术指标种类繁多,每种指标的适用范围不同,而且单一指标的预测效果较差,通常需要结合不同的指标综合判断。这对于投资者来说有较大的学习成本。第二,技术指标本身是通过价格、成交量等反映在股市本身的客观事实演变而来,无法反映投资者的主观态度和情绪。为了解决以上问题,本文对股价的预测问题进行研究,通过预测模型,为投资者提供“买入”、“持有”、“卖出”三种投资信号,帮助投资者进行决策。本文工作主要依照以下两个方面展开。(1)基于技术指标的股价预测。首先,对股价预测的目标进行定义,确定买入、持有、卖出的阈值,将这三类结果作为预测输出。其次,对MACD、RSI、KDJ等技术指标进行量化,作为预测输入。最后,通过实验对比,选择表现最优的参数,构造出一个基于BP神经网络的股价预测模型。(2)加入了投资者情绪指标的股价预测。首先,通过网络爬虫,对“股吧”中的股评信息进行抓取。其次,构造了专门针对金融领域的词典,利用N-GRAM新词发现算法构建分词词典,利用PMI算法扩展情感词典。然后,对比了情感词词典、朴素贝叶斯两种情感分类算法,构造出一个性能最优的情感分类器。最后,利用构建的情感分类器对股评信息进行情感分类,计算投资者情绪指标,并将其作为输入加入到股价预测模型。本文探索性地将投资者情绪指标作为变量引入股价预测的模型中,实验结果表明,投资者情绪指标对于预测股价的走势具有指导意义,能够在一定程度上提高股价预测的准确性。并最终融合技术指标与投资者情绪指标,基于BP神经网络构造出一个性能不错的股价预测模型。
【关键词】:股票预测 情感倾向性分析 BP神经网络 朴素贝叶斯
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:F832.51
【目录】:
  • 中文摘要3-4
  • 英文摘要4-9
  • 1 绪论9-14
  • 1.1 研究背景与意义9-10
  • 1.2 国内外研究现状10-12
  • 1.2.1 股票分析研究现状10-11
  • 1.2.2 情感分类研究现状11-12
  • 1.3 研究内容及创新点12-13
  • 1.4 本文组织结构13-14
  • 2 相关理论和技术14-26
  • 2.1 股票分析14
  • 2.1.1 基本面分析的方法14
  • 2.1.2 技术面分析的方法14
  • 2.2 文本挖掘关键技术14-18
  • 2.2.1 文本预处理14-16
  • 2.2.2 词库扩展16
  • 2.2.3 特征选择16-17
  • 2.2.4 文本表示17-18
  • 2.3 文本情感分类技术18-20
  • 2.3.1 基于语素的方法18
  • 2.3.2 基于语义的方法18-19
  • 2.3.3 基于机器学习的方法19-20
  • 2.4 朴素贝叶斯20-22
  • 2.5 BP神经网络22-25
  • 2.5.1 BP神经网络简介22
  • 2.5.2 BP神经网络模型22-24
  • 2.5.3 BP神经网络算法24-25
  • 2.6 本章小结25-26
  • 3 基于技术指标的股价预测26-40
  • 3.1 股价预测框架26-28
  • 3.2 预测目标定义28
  • 3.3 技术指标28-33
  • 3.3.1 K线图28-30
  • 3.3.2 量价关系30-31
  • 3.3.3 平滑异同平均线(MACD)31
  • 3.3.4 相对强弱指数(RSI)31-32
  • 3.3.5 随机指标(KDJ)32
  • 3.3.6 量能潮指标(OBV)32-33
  • 3.4 神经网络建模33-35
  • 3.4.1 输入输出设计33-34
  • 3.4.2 网络拓扑设计34-35
  • 3.5 实验及结果分析35-39
  • 3.5.1 实验方案35-38
  • 3.5.2 实验及结果分析38-39
  • 3.6 本章小结39-40
  • 4 加入投资者情绪指标的股价预测40-56
  • 4.1 股票评论语料库构建40-44
  • 4.1.1 数据来源40
  • 4.1.2 网络爬虫40-42
  • 4.1.3 数据获取42-44
  • 4.2 金融词典构建44-47
  • 4.2.1 N-GRAM算法构造分词词典44-45
  • 4.2.2 PMI算法扩展情感词典45-47
  • 4.2.3 领域词典的生成47
  • 4.3 情感倾向性分析47-49
  • 4.3.1 基于情感词典的情感倾向性分析47-48
  • 4.3.2 基于朴素贝叶斯的情感倾向性分析48-49
  • 4.4 投资者情绪指标49-51
  • 4.5 实验及结果分析51-55
  • 4.5.1 实验方案51-53
  • 4.5.2 实验及结果分析53-55
  • 4.6 本章小结55-56
  • 5 总结和展望56-58
  • 5.1 工作总结56
  • 5.2 后续研究展望56-58
  • 致谢58-59
  • 参考文献59-62

【参考文献】

中国期刊全文数据库 前10条

1 盛仲飙;;BP神经网络在数据预测中的应用[J];软件导刊;2016年01期

2 葛斌;李芳芳;郭丝路;汤大权;;基于知网的词汇语义相似度计算方法研究[J];计算机应用研究;2010年09期

3 党蕾;张蕾;;一种基于知网的中文句子情感倾向判别方法[J];计算机应用研究;2010年04期

4 柳位平;朱艳辉;栗春亮;向华政;文志强;;中文基础情感词词典构建方法研究[J];计算机应用;2009年10期

5 李云飞;龚冬生;惠晓峰;;基于价值投资的PCA-SVM股票选择模型研究[J];西安工程大学学报;2009年03期

6 张中华;丁华福;;基于混沌神经网络的股票分析及其预测[J];计算机技术与发展;2009年03期

7 殷洪才;赵春燕;;基于神经网络股票预测的研究[J];哈尔滨师范大学自然科学学报;2007年03期

8 李庆东;聚类分析在股票分析中的应用[J];辽宁石油化工大学学报;2005年03期

9 柴明亮,宋苏;关联规则在股票分析中的应用[J];计算机应用;2005年04期

10 代六玲,黄河燕,陈肇雄;中文文本分类中特征抽取方法的比较研究[J];中文信息学报;2004年01期

中国硕士学位论文全文数据库 前10条

1 马妍;商品评论情感分析系统的设计与实现[D];北京交通大学;2015年

2 郭俊峰;聚类分析下的股票投资价值挖掘研究[D];大连海事大学;2015年

3 石馨;基于酒店领域情感词典的分类器研究[D];河北大学;2014年

4 刘建伟;房价微博情感分类研究[D];哈尔滨工业大学;2014年

5 刘欣;互联网财经新闻媒体对中国股市的影响力排名研究[D];西南财经大学;2014年

6 黄进;金融领域中基于UGC的情感分析[D];华东理工大学;2014年

7 张爱莲;汽车评论情感分析系统的设计与实现[D];西安电子科技大学;2013年

8 赵丽丽;互联网财经新闻对股市影响的定量分析[D];西南财经大学;2012年

9 赵茜倩;互联网财经新闻对中国股市的影响研究[D];西南财经大学;2012年

10 郑文;数据挖掘在股票分析中的应用[D];复旦大学;2012年


  本文关键词:基于文本情感分析的股价预测研究与实现,由笔耕文化传播整理发布。



本文编号:289327

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/touziyanjiulunwen/289327.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户64e86***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com