当前位置:主页 > 经济论文 > 股票论文 >

基于随机森林算法的多因子量化选股方案策划

发布时间:2020-03-28 08:18
【摘要】:在金融市场中,如何获取较高的收益率,一直是投资者和投机者们分外关心的问题。量化投资理论因其与数学高度结合,具有高度的纪律性和系统性,已经成为国外的主流投资策略方案。近年来,随着人工智能的出现,机器学习也逐渐进入学者们的视野,其中,决策树和神经网络已经被一些学者们用来解决经济学问题,而更多的机器学习算法和量化投资的结合,是未来发展的新趋势。在美国量化投资30多年的发展史中,量化投资在目前美国二级市场的成交量占比达到将近80%,基金经理们通过挖掘市场信息构建数量模型,进而选择股票组合,赚得盆钵体满。其中世界上著名的文艺复兴科技公司的“大奖章对冲基金”的年均回报率高达34%,且发挥稳定。与美国已经成熟和完备的量化投资市场相比,我国的量化投资开展地较晚,但发展速度迅猛,存在着很多可以挖掘和提升的发展空间。根据2017年12月底的报道,我国A股市场已居世界第二位,在日均换手率,也就是流动性方面稳居第一位。但同时,在世界对冲基金总规模3万亿,其中30%以上都采用量化投资方式的现状来说,我国的量化投资规模还不足5%。而当今的国内的A股市场的有效性不强,量化投资可以利用大量的数据统计和挖掘,捕捉市场微观交易机会,享受量化选股策略带来的超出市场的超额收益和市场本身整体上涨所带来的收益。因此选取合适的方法和模型建立量化投资策略开辟市场,为券商和相关机构提升资管规模,获得更高收益具有重要的现实意义。在利用多因子模型进行量化选股的策略中,因子选取和因子分类选择是两个关键点。在这两个方向上,本文都做了相应的优化。在因子选取方面,本文选取的因子的数据包含了财务、估值、动量等等相关因子共计70个,在因子的数量和种类上有了一定的扩充。在因子分类方面,本文使用随机森林算法,对因子进行分类。在运用随机森林算法进行训练之后,它可以针对feature的重要性进行输出,并且可以检测出feature之间的相关影响。由于创造模型的时候是使用无偏估计的方式,因此赋予了模型更好的泛化能力,实现简单,训练速度快。除此之外,本文还把随机森林算法和SVM算法进行比较,从而更加凸显了随机森林算法在容错性和避免过拟合等方面的优势。根据上述设计思路,本文首先收集基本面、政策面、市场面等等方面对股票波动存在可能影响的因子,共70个。选取2008年12月31日之前上市的部分A股股票和沪深300指数成分股构建基于随机森林算法的多因子选股模型,在对其优化和修改之后进行回测,获得了极高的收益率,有了良好的效果。本文通过将新型的因子选择和随机森林算法相结合设计出的量化选股策略获得了高于市场和相关指数以及策略的收益率,具有一定的可行性和实践意义,同时对现有的选股策略和基金公司未来选股策略的设计和发展提供了新的思路。
【图文】:

技术路线图,技术路线,选股


图 1.1 本文的技术路线文的主要贡献文建立了基于随机森林算法的多因子量化选股模型,对其各步骤和改进,并与其他方法和选股策略进行比较,获得了良好的效果,了随机森林算法在量化投资方面的优势,更适合建立量化选股模身具有的容错率高和避免欠拟合的特性是对投资市场现状的良好着量化投资在我国的不断发展,将各种新型的更高效率的算法与相结合,是一种创新,,也是一种将计量方法与金融结合的方法。创化选股模型进行实践并获取更高的收益,是一种新的尝试,也给选股的发展提供了新的思路和方向。

流程图,方案设计,流程图,选股


上海师范大学硕士学位论文 第4章 基于随机森林算法的量化选股方案策划设计第 4 章 基于随机森林算法的量化选股方案策划设计4.1 方案设计的思路与方法指标介绍4.1.1 方案设计流程本文方案设计的思路主要是从七个方面来展开,包括获取数据构建股票池、提取特征和标签构建因子池、数据预处理、设置训练集和交叉验证集、训练调整参数、样本测试和模型评估。具体流程图如下:
【学位授予单位】:上海师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:F832.51

【相似文献】

相关期刊论文 前10条

1 沈智勇;苏

本文编号:2604190


资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/jinrongzhengquanlunwen/2604190.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户48032***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com