基于组合对称交叉验证(CSCV)的量化策略回测评价
发布时间:2021-01-23 23:29
量化投资历经40余年的发展,因其可持续获得超额收益的优势得到广泛流行。如今,大数据时代计算机技术的发展势不可挡,随着机器学习算法的不断迭代更新以及优化,投资领域的相关研究也必须与时俱进,量化投资策略更是层出不穷、日新月异。与此同时,正是机器学习、人工智能以及数十亿高频数据信号的可用性方面的最新进展,使得模型选择成为一项具有挑战性和紧迫性的需求。许多投资公司和基金经理依赖于回测(即基于历史市场数据的性能模拟)来选择投资策略和分配资本。金融发现通常涉及到识别一种低信噪比的现象,通常的做法是使用计算能力校准投资策略的参数,以使其绩效最大化。但是,低信噪比很容易导致这种校准结果是基于过去的噪声选择参数,而不是基于未来的信号,这样就发生了回测过拟合。回测过拟合是选择的一种投资策略在回测期间表现出色,但在实践中却表现不佳的现象。对于回测过拟合的评估并不是一件容易的事,相关方向的研究也甚是匮乏。David H.Bailey和Marcos L’opez de Prado等学者关注到了这一问题并进行了相关研究,在2017年给出了关于回测过拟合的量化定义,同时提出了一种估计回测过拟合概率的方法——组合对称...
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
图2-1生成匕对称组合??
接寻找最优分离超平面;而当样本空间线性不可分时,则通过核函数将输入空??间映射到一个高维的特征空间,在高维特征空间中寻找最优分离超平面。因此,??该方法应用线性模型的概念,在特征高维空间中将输入经过非线性映射分离出来。??在新空间中构造的线性模型可以表示原空间的非线性决策。??在样本空间中,超平面的表达式如下:??wTx?+?b?=?0,??而样本空间中任一点x到超平面的距离可写为:??\wTx?+?b\??f=?llwll?'??假设超平面(W,b)能将训练样本正确分类,如图3-1所示,距离超平面最近的??几个训练样本点被称作“支持向量”,两个分类相反的支持向量间的距离被称作??“间隔”(记做丫?)。SVM算法的目标就是找到“最大间隔”的划分超平面。??Hi??V??????1??Y?=?y^??.??0?〇??图3-1最优分离超平面与间隔??(1)硬间隔线性分类机??13??
特征,选择最佳分割特征作为节点建立CART决??策树;??3)重复以上两个步骤m次,就可以生成m棵CART决策树,从而形成随机森林;??4)新样本通过每颗决策树后,对于分类问题,通过m棵CART分类树投票决定??最终分类结果;对于回归问题,则由m棵CART回归树的均值得到最终预测??结果。?? ̄ ̄?训练集1???分类器1——??I?I?I?I??全部训练样本^??训练集k???分类器k?随机森林??I?…1?I?I?? ̄?训练集m???分类器m?—??图3-2随机森林示意图??3.1.3?XGBoost?算法??XGBoost?(extreme?Gradient?Boosting)算法对?Gradient?Boosting?算法的??优化,它提升了模型的预测能力,可以快速准确地解决许多数据科学问题。基于??Boosting算法的思想,XGBoost将许多树模型(CART回归树模型)集成在一起,??形成一个很强的分类器。给定训练集D?=?{(知%)},?|川=n,?Ae?e?/?,第??i个样本的预测值负可以表示成k棵回归树的加性模型,我们把它记作:??K??9i?=?'YJfk(.xi),fk?E?F.??k=l??此式中,Xi表示第i个样本的特征向量,通过算法每次迭代来生成一个回归树,??A就是第k次迭代所产生的第k个回归树。F是所有回归树的集合空间:??f7?=?{/(y)?=?-^t,w?e?rt).??其中,q?(x)表示将样本x分类到某叶子节点上,T表示该树叶子节点的数量,??w是叶子节点的分数,(^^表示回归树对样本的预测值。??为了控制模型发生过拟合的风险,XGBoos
【参考文献】:
期刊论文
[1]基于随机森林的支持向量机量化选股[J]. 贾秀娟. 区域金融研究. 2019(01)
[2]基于沪深300成分股的量化投资策略研究[J]. 吕凯晨,闫宏飞,陈翀. 广西师范大学学报(自然科学版). 2019(01)
[3]基于优化SVM算法的上证180指数选股策略构建[J]. 陈莹,梁成. 金融管理研究. 2018(02)
[4]创业板基于logistic模型量化选股[J]. 田凯,刘永睿. 现代商贸工业. 2017(01)
[5]随机森林在量化选股中的应用研究[J]. 王淑燕,曹正凤,陈铭芷. 运筹与管理. 2016(03)
[6]使用随机森林算法实现优质股票的选择[J]. 曹正凤,纪宏,谢邦昌. 首都经济贸易大学学报. 2014(02)
[7]基于启发式算法的支持向量机选股模型[J]. 陈荣达,虞欢欢. 系统工程. 2014(02)
[8]基于SVM分类算法的选股研究[J]. 全林,姜秀珍,赵俊和,汪东. 上海交通大学学报. 2009(09)
[9]用朴素贝叶斯分类法选股[J]. 钱颖能,胡运发. 计算机应用与软件. 2007(06)
硕士论文
[1]基于随机森林算法的多因子选股模型研究[D]. 李杰.哈尔滨工业大学 2019
[2]随机森林自适应特征选择和参数优化算法研究[D]. 刘凯.长春工业大学 2018
[3]基于XGBoost的沪深300量化投资策略研究[D]. 田浩.上海师范大学 2018
[4]基于SVM算法的多因子选股模型实证研究[D]. 周渐.浙江工商大学 2017
[5]基于XGBoost算法的多因子量化选股方案策划[D]. 李想.上海师范大学 2017
[6]支持向量机多因子选股模型[D]. 魏妹金.华侨大学 2015
[7]支持向量分类机(SVC)在量化选股中的应用[D]. 张伟.山东大学 2014
本文编号:2996117
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
图2-1生成匕对称组合??
接寻找最优分离超平面;而当样本空间线性不可分时,则通过核函数将输入空??间映射到一个高维的特征空间,在高维特征空间中寻找最优分离超平面。因此,??该方法应用线性模型的概念,在特征高维空间中将输入经过非线性映射分离出来。??在新空间中构造的线性模型可以表示原空间的非线性决策。??在样本空间中,超平面的表达式如下:??wTx?+?b?=?0,??而样本空间中任一点x到超平面的距离可写为:??\wTx?+?b\??f=?llwll?'??假设超平面(W,b)能将训练样本正确分类,如图3-1所示,距离超平面最近的??几个训练样本点被称作“支持向量”,两个分类相反的支持向量间的距离被称作??“间隔”(记做丫?)。SVM算法的目标就是找到“最大间隔”的划分超平面。??Hi??V??????1??Y?=?y^??.??0?〇??图3-1最优分离超平面与间隔??(1)硬间隔线性分类机??13??
特征,选择最佳分割特征作为节点建立CART决??策树;??3)重复以上两个步骤m次,就可以生成m棵CART决策树,从而形成随机森林;??4)新样本通过每颗决策树后,对于分类问题,通过m棵CART分类树投票决定??最终分类结果;对于回归问题,则由m棵CART回归树的均值得到最终预测??结果。?? ̄ ̄?训练集1???分类器1——??I?I?I?I??全部训练样本^??训练集k???分类器k?随机森林??I?…1?I?I?? ̄?训练集m???分类器m?—??图3-2随机森林示意图??3.1.3?XGBoost?算法??XGBoost?(extreme?Gradient?Boosting)算法对?Gradient?Boosting?算法的??优化,它提升了模型的预测能力,可以快速准确地解决许多数据科学问题。基于??Boosting算法的思想,XGBoost将许多树模型(CART回归树模型)集成在一起,??形成一个很强的分类器。给定训练集D?=?{(知%)},?|川=n,?Ae?e?/?,第??i个样本的预测值负可以表示成k棵回归树的加性模型,我们把它记作:??K??9i?=?'YJfk(.xi),fk?E?F.??k=l??此式中,Xi表示第i个样本的特征向量,通过算法每次迭代来生成一个回归树,??A就是第k次迭代所产生的第k个回归树。F是所有回归树的集合空间:??f7?=?{/(y)?=?-^t,w?e?rt).??其中,q?(x)表示将样本x分类到某叶子节点上,T表示该树叶子节点的数量,??w是叶子节点的分数,(^^表示回归树对样本的预测值。??为了控制模型发生过拟合的风险,XGBoos
【参考文献】:
期刊论文
[1]基于随机森林的支持向量机量化选股[J]. 贾秀娟. 区域金融研究. 2019(01)
[2]基于沪深300成分股的量化投资策略研究[J]. 吕凯晨,闫宏飞,陈翀. 广西师范大学学报(自然科学版). 2019(01)
[3]基于优化SVM算法的上证180指数选股策略构建[J]. 陈莹,梁成. 金融管理研究. 2018(02)
[4]创业板基于logistic模型量化选股[J]. 田凯,刘永睿. 现代商贸工业. 2017(01)
[5]随机森林在量化选股中的应用研究[J]. 王淑燕,曹正凤,陈铭芷. 运筹与管理. 2016(03)
[6]使用随机森林算法实现优质股票的选择[J]. 曹正凤,纪宏,谢邦昌. 首都经济贸易大学学报. 2014(02)
[7]基于启发式算法的支持向量机选股模型[J]. 陈荣达,虞欢欢. 系统工程. 2014(02)
[8]基于SVM分类算法的选股研究[J]. 全林,姜秀珍,赵俊和,汪东. 上海交通大学学报. 2009(09)
[9]用朴素贝叶斯分类法选股[J]. 钱颖能,胡运发. 计算机应用与软件. 2007(06)
硕士论文
[1]基于随机森林算法的多因子选股模型研究[D]. 李杰.哈尔滨工业大学 2019
[2]随机森林自适应特征选择和参数优化算法研究[D]. 刘凯.长春工业大学 2018
[3]基于XGBoost的沪深300量化投资策略研究[D]. 田浩.上海师范大学 2018
[4]基于SVM算法的多因子选股模型实证研究[D]. 周渐.浙江工商大学 2017
[5]基于XGBoost算法的多因子量化选股方案策划[D]. 李想.上海师范大学 2017
[6]支持向量机多因子选股模型[D]. 魏妹金.华侨大学 2015
[7]支持向量分类机(SVC)在量化选股中的应用[D]. 张伟.山东大学 2014
本文编号:2996117
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/2996117.html