基于随机森林的指数化投资组合构建研究
本文关键词:基于随机森林的指数化投资组合构建研究
【摘要】:指数化投资,是指在相对成熟的证券市场当中,人们通过购买全部或者部分某指数成分股进行指数复制和追踪,在充分分散化风险和被动式管理的基础上,将交易成本降至最低以期获得市场平均收益的投资模式。从2002年我国第一只开放式指数基金出现以来,指数基金在我国的发展迅速。2015年,我国第一只股票期权——上证50ETF期权在上海证券交易所开始交易,指数基金的发展进入新的阶段。指数化投资组合的构建方法中,分层抽样的构建方法是以分析目标证券市场的市场结构为基础,选择最具代表性的指数成分股来拟合目标指数。本文扩展了随机森林的应用,将随机森林方法应用到指数化投资的成分股选择中,丰富了分层抽样的构建方法,并对其进行了适用性研究。具体而言,首先研究了随机森林在指数化投资组合构建流程的第一步——选股的适用性,本文选取上证50指数为基准指数,采用随机森林模型对各个指数成分股的重要性进行计算,选出相对重要的10只成分股,进而分析这10只股票在指数样本股中特征来解释随机森林在选股上的适用性;其次,研究了构建指数化投资组合构建流程的第二步——成分股权重分配,本文选后运用基于跟踪误差和收益率的资金配置模型和基于价格协整的资金配置模型完成了成分股的权重分配,通过绩效分析,比较了随机森林和其他分层抽样方法在不同资金配置模型上的表现,得出随机森林在整个指数化投资组合构建中的适用性。通过模型验证得出主要结论:(1)利用随机森林理论选出的成分股,在市值占比和行业种类上都比较多,在拟合指数走势上有较好的适用性;(2)相比于最大权重抽样法、最大相关系数法,行业分层抽样法和聚类分层抽样法,随机森林所构建的指数化投资组合的绩效表现相对较好;(3)在各种资金配置模型中,基于随机森林的MAD模型跟踪绩效相对较好;(4)在随机森林的基础上,通过对比基于跟踪误差和收益率的资金配置模型和基于价格协整的资金配置模型,前者的跟踪误差小于后者,有着更好地拟合效果;但同时,后者的绩效表现更好;在再平衡测试中,不追求较低的跟踪误差使得后者的再平衡成本和交易量都较低。
【关键词】:指数化投资 随机森林 跟踪误差 协整优化
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:F832.51;F224
【目录】:
- 摘要5-6
- Abstract6-9
- 第一章 绪论9-17
- 1.1 研究背景和意义9-10
- 1.1.1 研究背景9-10
- 1.1.2 研究意义10
- 1.2 文献综述10-14
- 1.3 研究内容与技术路线14-17
- 1.3.1 研究内容14
- 1.3.2 技术路线14-17
- 第二章 指数化投资和随机森林的概述17-29
- 2.1 指数化投资概述17-19
- 2.1.1 指数化投资的概念17-18
- 2.1.2 指数化投资在我国的现状18-19
- 2.2 指数化投资组合的构建方法19-21
- 2.3 指数化投资的资金配置模型21-25
- 2.4 随机森林概述25-27
- 2.4.1 随机森林的概念25-26
- 2.4.2 随机森林的基分类器——决策树26-27
- 2.5 本章小结27-29
- 第三章 随机森林在指数化投资的适用性分析29-39
- 3.1 理论层面适用性分析29-32
- 3.1.1 决策树在变量筛选上的适用性29-30
- 3.1.2 随机森林在变量筛选的适用性30-32
- 3.2 应用层面的适用性分析32-38
- 3.2.1 随机森林和其他分层抽样方法的选股过程32-37
- 3.2.2 随机森林和其他分层抽样方法选出的股票组合对比37-38
- 3.3 本章小结38-39
- 第四章 基于随机森林的指数化投资组合构建分析39-49
- 4.1 数据和分析说明39-41
- 4.2 随机森林在指数化投资组合构建中的绩效表现41-43
- 4.3 指数化投资组合的绩效对比43-46
- 4.4 指数化投资的再平衡研究46-48
- 4.5 本章小结48-49
- 研究结论49-52
- 参考文献52-56
- 附录56-58
- 攻读博士/硕士学位期间取得的研究成果58-59
- 致谢59-60
- 附件60
【参考文献】
中国期刊全文数据库 前10条
1 杨宝臣;王立芹;卢宇;;遗传算法在指数投资组合中的应用[J];北京航空航天大学学报(社会科学版);2005年04期
2 刘微;罗林开;王华珍;;基于随机森林的基金重仓股预测[J];福州大学学报(自然科学版);2008年S1期
3 谭治国;袁靖;;遗传算法构建我国指数基金自动生成模型的实证分析[J];石家庄经济学院学报;2007年02期
4 马骥,邓清;指数基金与跟踪误差优化模型[J];哈尔滨商业大学学报(社会科学版);2004年01期
5 邱一卉;林成德;;基于随机森林方法的异常样本检测方法[J];福建工程学院学报;2007年04期
6 蔡乙萍;万力;范旭东;;各种指数基金模型的实证比较分析[J];数量经济技术经济研究;2006年10期
7 李倩;孙林岩;;成份股数量和再平衡策略对协整优化指数跟踪组合的影响[J];统计与决策;2008年04期
8 严武,洪道麟;我国指数基金运作与绩效研究[J];统计研究;2000年12期
9 李扬;朱建锋;谢邦昌;;变量选择方法及其在健康食品市场研究中的应用探究[J];统计与信息论坛;2013年10期
10 曹正凤;纪宏;谢邦昌;;使用随机森林算法实现优质股票的选择[J];首都经济贸易大学学报;2014年02期
中国博士学位论文全文数据库 前2条
1 林飞;指数化投资理论、方法及实证研究[D];厦门大学;2003年
2 李俭富;基于我国证券市场的指数跟踪管理方法及应用研究[D];电子科技大学;2006年
,本文编号:541659
本文链接:https://www.wllwen.com/jingjilunwen/zbyz/541659.html