基于Bootstrap方法、隐马尔可夫模型与随机森林的量化投资策略实证研究
发布时间:2020-09-27 14:03
量化投资近些年来越来越受到投资者的关注,尤其在中国,股票市场与期货期权市场有着非常多的标的可以进行交易与投资。由于机器学习方法本身与量化投资的特点相契合,机器学习方法逐渐成为了量化投资的主流研究方向。怎样将机器学习的优点与量化投资相结合,并且尽量规避机器学习方法过拟合的缺点,成为了很多从业者所要解决的主要问题。本文主要从国内较为活跃的商品期货铁矿石期货主力连续合约入手,对其日线级别的数据进行建模,从价格与成交量等数据中提取出特征,并对特征进行进一步的超额收益有效性检验与刻画市场价格状态能力的筛选,然后构造随机森林模型对市场涨跌状态进行预测,最后形成关于铁矿石期货的量化交易策略。本文首先介绍了量化投资、机器学习模型等领域的发展历程,简述了与实证部分相关的理论知识基础。之后用铁矿石的主力连续合约日线级别数据进行了实证研究。实证研究的第一步是构建特征,这些特征的来源是铁矿石日线级别的量价信息,接着使用非参数的bootstrap方法检验了每个特征对应的超额收益有效性。然后,利用上一步筛选的结果,使用非监督的隐马尔科夫模型检验哪些特征可以较好地刻画市场的状态。随后,使用如上步骤筛选出的指标构造模型对样本外数据进行预测。最后,根据预测的结果形成最终的铁矿石量化投资策略。本文的实证研究结果表明,本文所构造的随机森林模型在较短的时间尺度上可以达到较为良好的准确率,从量化策略的绩效角度讲可以获得更高的收益与更低的最大回撤。这说明了有效地使用机器学习方法与量化策略相结合可以产生稳定的超额收益。本文的研究结果有着一定的应用价值,后续的研究也可以基于此进一步探索下去。
【学位单位】:山东大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:F724.5;F764.1
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景与意义
1.1.1 研究背景
1.1.2 研究意义
1.2 文献综述
1.2.1 国外文献综述
1.2.2 国内文献综述
1.3 本文结构与创新点
1.3.1 本文结构
1.3.2 本文创新点
1.4 本章小结
第二章 理论介绍
2.1 量化投资
2.2 bootstrap方法
2.3 隐马尔科夫模型
2.4 随机森林算法
2.5 本章小结
第三章 实证研究思路简介
3.1 实证研究流程
3.1.1 待选特征构建
3.1.2 非参数的bootstrap方法
3.1.3 隐马尔可夫模型
3.1.4 随机森林模型
3.1.5 策略执行模块
3.2 python函数说明
3.3 本章小结
第四章 实证分析
4.1 数据选取与说明
4.1.1 数据选取
4.1.2 数据描述
4.2 实证研究过程与研究结果分析
4.2.1 非参数bootstrap方法选择具有显著超额收益的特征
4.2.2 隐马尔科夫模型绘制价格状态图
4.2.3 随机森林模型预测市场涨跌变化
4.2.4 策略设计与回测结果
4.3 实证研究结果分析
4.4 本章小结
第五章 总结与展望
5.1 总结
5.2 不足与展望
附录A 部分python代码介绍
附录B 隐马尔科夫模型图集
参考文献
致谢
附件
本文编号:2827969
【学位单位】:山东大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:F724.5;F764.1
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景与意义
1.1.1 研究背景
1.1.2 研究意义
1.2 文献综述
1.2.1 国外文献综述
1.2.2 国内文献综述
1.3 本文结构与创新点
1.3.1 本文结构
1.3.2 本文创新点
1.4 本章小结
第二章 理论介绍
2.1 量化投资
2.2 bootstrap方法
2.3 隐马尔科夫模型
2.4 随机森林算法
2.5 本章小结
第三章 实证研究思路简介
3.1 实证研究流程
3.1.1 待选特征构建
3.1.2 非参数的bootstrap方法
3.1.3 隐马尔可夫模型
3.1.4 随机森林模型
3.1.5 策略执行模块
3.2 python函数说明
3.3 本章小结
第四章 实证分析
4.1 数据选取与说明
4.1.1 数据选取
4.1.2 数据描述
4.2 实证研究过程与研究结果分析
4.2.1 非参数bootstrap方法选择具有显著超额收益的特征
4.2.2 隐马尔科夫模型绘制价格状态图
4.2.3 随机森林模型预测市场涨跌变化
4.2.4 策略设计与回测结果
4.3 实证研究结果分析
4.4 本章小结
第五章 总结与展望
5.1 总结
5.2 不足与展望
附录A 部分python代码介绍
附录B 隐马尔科夫模型图集
参考文献
致谢
附件
【参考文献】
相关博士学位论文 前8条
1 王国刚;基于二维高阶HMM的彩色滤波阵列插值研究[D];南京邮电大学;2016年
2 张乾;基于随机森林的视觉数据分类关键技术研究[D];华南理工大学;2016年
3 宋涛;基于谱隐马尔可夫模型的蛋白质序列模体识别方法研究[D];大连理工大学;2015年
4 张万军;基于大数据的个人信用风险评估模型研究[D];对外经济贸易大学;2016年
5 邢晓双;认知无线电网络中的频谱预测技术研究[D];北京交通大学;2014年
6 雷震;随机森林及其在遥感影像处理中应用研究[D];上海交通大学;2012年
7 李嵩松;基于隐马尔可夫模型和计算智能的股票价格时间序列预测[D];哈尔滨工业大学;2011年
8 李宁;旋转机械的测试信号分析及隐马尔科夫模型应用研究[D];重庆大学;2010年
相关硕士学位论文 前6条
1 史卫峰;PCA和随机森林在BARRA量化对冲模型中的应用研究[D];西安科技大学;2017年
2 易轩;基于投资者情绪的股市隐马尔科夫模型预测[D];华侨大学;2017年
3 洪淼波;隐马尔可夫模型在量化交易中的应用原理及其现实意义探究[D];北京外国语大学;2017年
4 林启敏;基于随机森林和QGA-SVR的量化选股研究[D];华南理工大学;2016年
5 韩燕龙;基于随机森林的指数化投资组合构建研究[D];华南理工大学;2015年
6 商晔;隐马尔可夫模型参数训练的改进及在股市预测中的应用[D];上海交通大学;2011年
本文编号:2827969
本文链接:https://www.wllwen.com/weiguanjingjilunwen/2827969.html