基于社交媒体文本的股市行情预测关键技术研究
发布时间:2021-01-25 06:18
金融行业的发展使得股票在各方面影响着我们的社会生活,也让股票市场逐渐成为了当今学术界不可忽视的研究领域之一,股价行情预测的相关研究更是得到了广泛的关注。但在一个典型的预测模型中并没有考虑到投资者情绪对模型的影响。为最优化投资策略,本文提出了一种基于社交媒体文本分析的股价趋势短期预测的融合模型,并在此基础上利用模糊控制器设计了一种改进的投资决策模型,该模型可明显提升短期预测模型的准确率及投资决策的收益率。本文工作主要包括以下两个方面:第一,设计了一种基于社交媒体文本分析的股价趋势短期预测模型。现阶段股价趋势短期预测模型主要有基于历史数据的预测模型以及基于投资者情绪的预测模型两大类。在基于投资者情绪的预测模型中,通常采用预先定义的情感分析模块提取预测指标,通过预测指标以及时间序列进行建模,完成股价趋势短期预测。然而由于中文情感分析资源的稀缺,以及股市中的情感倾向与现实社会中的情感倾向的巨大差异,传统的股价趋势短期预测难以达到令人满意的效果。为解决上述问题,本文提出了一种自动标注的方法构建数据集,通过文本分类模型提取文本情感倾向。该模型以天涯论坛股市板块、新浪博客股票类别以及百度股市通中的文...
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:55 页
【学位级别】:硕士
【部分图文】:
荃本模糊控制器结构
以最优化函数f(x)?=?为例,则基于遗传算法的最优化过程为:??(1)初始化:确定解空间的范围,以32位boolean类型表示一个整形数字,解空间为[-Z32-1』32—1-;^并设置进化代数计数器t=0,以及最大进化代数T随机生成M个个体作为初始群体P(t);??(2)个体评价:计算种群P(t)中各个个体的适应度,解码每个个体为一个整数字,代入公式f(x)?=?ei2,以评价每个个体的适应度;??(3)群体P(t)经过选择、交叉、变异运算之后,根据适应度函数f〇〇?=?e_x2,??生成下一代种群P(t+1);??(4)终止条件判断:当t=T时,终止进化,取P(T)中适应度最大的个体作为优解输出。??虽然遗传算法对难以解决的问题可以通过较为简单的方法求出最优结果的个近似解,但在实际应用过程中,遗传算法存在着一些不足之处,其主要表现在(1)编码不规范及编码不准确对实验结果有影响较大;(2)仅仅依靠遗传编码不很好地表现优化问题的约束,需要其他工作补充,计算量必然大幅度增加;(3)12??
.由上图可以看出,在经典的情感分析过程中,主要的流程包括:??(1)对原始语料的预处理,常见的包括分词、去除停用词等过程;??(2)特征选择,如在词袋模型中最常见的特征为TF-IDF,以及基于情感词加的额外的信息维度;??(3)依据某一分类算法,以及标注好的训练语料库对待测试文本进行分类
【参考文献】:
期刊论文
[1]基于微博情绪信息的股票市场预测[J]. 黄润鹏,左文明,毕凌燕. 管理工程学报. 2015(01)
[2]流动性对中国股票市场交易额影响的实证分析[J]. 张亮. 应用经济学评论. 2011(00)
[3]时间序列预测模型研究综述[J]. 张美英,何杰. 数学的实践与认识. 2011(18)
[4]基于模糊控制方法的股票投资决策研究[J]. 张素省,高风. 控制工程. 2007(06)
[5]一种新的时间序列分析算法及其在股票预测中的应用[J]. 周广旭. 计算机应用. 2005(09)
[6]基于模糊控制方法的股票投资策略研究[J]. 冯冬青,吴杰. 计算机工程与应用. 2005(01)
[7]Markowitz投资组合理论模型应用研究[J]. 李善民,徐沛. 经济科学. 2000(01)
[8]现代投资组合理论的若干进展[J]. 屠新曙,王键. 系统工程. 1999(01)
硕士论文
[1]时间序列分析在股票中的研究与应用[D]. 尤作军.沈阳工业大学 2014
[2]基于模糊控制的股票投资决策的研究[D]. 李站.南京邮电大学 2013
[3]模糊控制器在股票投资中的应用研究[D]. 方蕾.武汉理工大学 2010
本文编号:2998735
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:55 页
【学位级别】:硕士
【部分图文】:
荃本模糊控制器结构
以最优化函数f(x)?=?为例,则基于遗传算法的最优化过程为:??(1)初始化:确定解空间的范围,以32位boolean类型表示一个整形数字,解空间为[-Z32-1』32—1-;^并设置进化代数计数器t=0,以及最大进化代数T随机生成M个个体作为初始群体P(t);??(2)个体评价:计算种群P(t)中各个个体的适应度,解码每个个体为一个整数字,代入公式f(x)?=?ei2,以评价每个个体的适应度;??(3)群体P(t)经过选择、交叉、变异运算之后,根据适应度函数f〇〇?=?e_x2,??生成下一代种群P(t+1);??(4)终止条件判断:当t=T时,终止进化,取P(T)中适应度最大的个体作为优解输出。??虽然遗传算法对难以解决的问题可以通过较为简单的方法求出最优结果的个近似解,但在实际应用过程中,遗传算法存在着一些不足之处,其主要表现在(1)编码不规范及编码不准确对实验结果有影响较大;(2)仅仅依靠遗传编码不很好地表现优化问题的约束,需要其他工作补充,计算量必然大幅度增加;(3)12??
.由上图可以看出,在经典的情感分析过程中,主要的流程包括:??(1)对原始语料的预处理,常见的包括分词、去除停用词等过程;??(2)特征选择,如在词袋模型中最常见的特征为TF-IDF,以及基于情感词加的额外的信息维度;??(3)依据某一分类算法,以及标注好的训练语料库对待测试文本进行分类
【参考文献】:
期刊论文
[1]基于微博情绪信息的股票市场预测[J]. 黄润鹏,左文明,毕凌燕. 管理工程学报. 2015(01)
[2]流动性对中国股票市场交易额影响的实证分析[J]. 张亮. 应用经济学评论. 2011(00)
[3]时间序列预测模型研究综述[J]. 张美英,何杰. 数学的实践与认识. 2011(18)
[4]基于模糊控制方法的股票投资决策研究[J]. 张素省,高风. 控制工程. 2007(06)
[5]一种新的时间序列分析算法及其在股票预测中的应用[J]. 周广旭. 计算机应用. 2005(09)
[6]基于模糊控制方法的股票投资策略研究[J]. 冯冬青,吴杰. 计算机工程与应用. 2005(01)
[7]Markowitz投资组合理论模型应用研究[J]. 李善民,徐沛. 经济科学. 2000(01)
[8]现代投资组合理论的若干进展[J]. 屠新曙,王键. 系统工程. 1999(01)
硕士论文
[1]时间序列分析在股票中的研究与应用[D]. 尤作军.沈阳工业大学 2014
[2]基于模糊控制的股票投资决策的研究[D]. 李站.南京邮电大学 2013
[3]模糊控制器在股票投资中的应用研究[D]. 方蕾.武汉理工大学 2010
本文编号:2998735
本文链接:https://www.wllwen.com/jingjilunwen/huobiyinxinglunwen/2998735.html