当前位置:主页 > 经济论文 > 股票论文 >

基于机器学习算法的股票收益率方向预测及分析

发布时间:2020-04-28 07:18
【摘要】:时下建立在数理模型基础上的量化投资技术得到了广泛的应用,并给投资者带来了巨大的回报。当今人工智能和机器学习技术方兴未艾,在影像识别、搜索推荐等众多领域已取得傲人成就;相比时序分析,机器学习模型可以快速处理、分析海量数据,并往往具有较好的泛化能力。在本文中,尝试将相关机器学习算法应用于金融数据挖掘中,基于新近提出的极度梯度提升树XGBoost算法、以及主流的机器学习算法,提出了一套数据挖掘方法,对股票收益率的变化方向进行预测和分析。首先,考虑股市往往是不平稳的、低信噪比的复杂系统,通过小波分解以及阈值去噪对于数据的噪声进行过滤。通过小波的多尺度分析,将股价数据分解成不同频率的子序列,并对高频部分的数据降噪,以进一步提取数据中的有效信息。其次,引入多种机器学习模型,将股票收益率的变化方向转化为模式识别中的分类问题进行研究。极度梯度提升树XGBoost是一种新近提出的高效机器学习算法,本文基于该算法构建了一套量化研究模型,同时构建了包括随机森林、支持向量机SVM等多种前沿机器学习方法在内的模型进行对比研究。以沪深300中300支成分股2012-2017年的日频数据为样本,综合考虑了技术指标、基本面指标和舆情指标,并通过Boruta算法验证了所选指标的有效性。通过对去噪后的数据建模研究,发现XGBoost算法的准确率最高,三年的准确率近54.7%,且运行速度有大幅提升,在依靠概率取胜的量化投资中具有重要意义。进一步,根据模型预测的信号进行了回测交易,各算法构建的策略均可产生超额收益;同时基于XGBoost模型的输出构建了一个新的因子,设计了一种分层回测检验方法,发现各层策略之间具有显著差异,进一步验证了算法具有一定的识别能力。最后,机器学习存在黑箱特征,而已有研究中较少有对模型逻辑的研究和阐述,本文进一步尝试对模型的机理和选股逻辑进行了分析:定义了一种特征权重的度量方法,对XGBoost中各因子的权重进行了度量,研究发现能量潮、市盈率等指标相对重要;通过偏相依关系的计算,对于各指标与收益率的方向关系进行衡量,发现模型中市盈率、市净率整体与收益率变化方向呈现负向关系,ROE、周流入额等呈现正向关系。通过以上分析,一定程度上可以弥补机器学习中一直存在的“黑箱性”困扰,使得模型选股的策略逻辑更为清晰。
【图文】:

示例,决策树


入数据对其进行转化和分析。本文中使用的模型都为监督学习模型。逡逑根据预测最终输出的因变量属性的不同,监督学习模型包括分类和回归。分逡逑模型的输出是有限离散值;而当输出为连续数值的时候,则为回归模型。在本逡逑中,主要探讨的是分类问题。根据模型的集成性不同,下面对常用的机器学习逡逑型进行介绍。在后文中,约定训练集/)邋=邋{0171),...,0^,7以},其中4邋=逡逑(1)为输入的特征向量,n为特征维数,%邋=邋{1,2/0为类标记,/V为逡逑本容量。逡逑.1.1单一机器学习模型逡逑.决策树逡逑决策树是一种对数据样本进行分类、回归的树转结构,包括内部节点、叶节逡逑和有向边等部分。内部节点表示一个分裂特征、决定树的分裂和生长,叶节点逡逑表模型的输出,而有向边则连接树中的各个节点。构建决策树时,从根部开始,,逡逑过对输入数据多维特征中的某特征设置判别条件,将样本数据划分到不同的子逡逑点中,重复此过程直至到达叶子节点并输出分类。一个决策树模型如下所示:逡逑

函数图,决策树


图2-2邋sigmoid函数图逡逑
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:F832.51

【相似文献】

相关期刊论文 前10条

1 卓欣;王河流;;基于经营活动视角的财务指标与股票收益率相关性分析[J];中国乡镇企业会计;2019年05期

2 曹雷欣;孙红兵;;基于灰色神经网络的股票收益率预测[J];计算机与数字工程;2017年01期

3 徐斯e

本文编号:2643209


资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/jinrongzhengquanlunwen/2643209.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户39291***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com