当前位置:主页 > 经济论文 > 股票论文 >

多因子选股模型在A股市场上的实证研究

发布时间:2020-10-18 13:49
   在大数据时代到来的当下,数据充斥着我们日常活动的方方面面,它在社会生活中扮演着极其重要的角色。在数据中我们能发现许多事物之间的内在联系,找寻有价值的信息。例如,通过对市场调研中消费者的满意调查数据,可以发现当下消费者的消费倾向然后以此调整经营策略;当教育研究者想了解某一群体学生的学习情况,可以通过平时表现、考试成绩等数据了解学生的学习情况,发掘学生存在的问题,以进一步制定相应的学习计划等等。在这些看似无用、凌乱且海量的数据中存在着极其有价值的信息等着后人发掘。同样在金融研究中,我们能在金融数据中发现经济运行的规律,成为现代金融研究中重要的实证依据。量化投资依托于传统投资理论,运用计算机高效的运算速度,提高研究的效率,以适应当前高速发展的今天,逐渐受到广大投资者的关注与喜爱。近年来,我国金融市场资金活动频繁,规模也日益壮大,如何在复杂多变的金融市场获取高额的回报率是每个金融投资者和研究者们非常关注的事情。在日常的市场活动中,研究者们不断的丰富投资理论,利用数学方法对金融数据进行有效的处理,得到了许多能反映市场变动的新指标,为广大投资者提供了非常好的参考依据,奠定了量化研究的研究热潮。新的指标和理论的创新都需要处理大量的数据,需要运用更多的数学方法等,这些都使的人们越来越关注量化投资的研究。本文以多因子选股模型作为研究的依据,旨在研究量化选股的相关理论,同时加入随机森林算法和模糊C均值聚类算法,验证新的算法能否适应市场规律同时达到提高多因子选股模型的说服力的目的。具体而言,本文选取沪深A股中流通市值排名前200的股票作为研究依据,以2009年到2017年的交易和财务数据进行预处理,选取了 15个常见的候选因子进行选股的验证,通过各因子下股票组合的累计超额收益、战胜市场基准概率、随机森林变量重要性等评价指标选取了 9个有效因子,并采用模糊C均值聚类算法的原理对有效因子聚类,在选取各类中表现最好的指标作为最终的选股依据,其他因子作为冗余因子剔除模型外;在剔除冗余后,采用等权重的方法在检验期对样本股的各有效因子进行打分,在加总各因子分数的大小,获得各样本股的综合得分的大小,选取评分20%的股票作为投资组合,检验投资组合的实际绩效表现。实证结果表明,随机森林分类原理中对变量重要性的描述非常适合有效因子的选取,通过训练各期的分类结果,统计其在整个模型期的重要性排序靠前的概率,若能较大几率其重要性都非常高,则可以说其在整个时期对收益变动的重要性非常高,在实证中大部分时期分类错误率都较低,效果显著,获得的重要的因子都能很大概率跑赢市场,因此可以作为有效因子选取的依据;模糊C均值聚类算法对因子间模糊概念的处理较好地说明金融变量间复杂的关联,其提出的隶属度概念将变量聚为某类的依据描述为变量隶属于该类的大小,最大隶属度所在的类就将其分为某类;将上述两种算法加入多因子选股模型形成的投资组合在检验期都能跑赢市场基准收益,获得了较高的超额收益,使投资者决策的参考方向更加丰富。
【学位单位】:安徽大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:F832.51
【文章目录】:
摘要
ABSTRACT
第一章 绪论
    一、选题背景和研究意义
        (一) 选题背景
        (二) 研究意义
    二、国内外研究现状
        (一) 国外研究综述
        (二) 国内研究现状
        (三) 文献述评
    三、主要内容安排及研究方法
        (一) 主要内容安排
        (二) 研究方法
    四、研究框架
    五、创新点与不足之处
        (一) 创新点
        (二) 不足之处
第二章 量化选股模型理论概念
    一、多因子选股基本概述
    二、多因子选股理论基础
        (一) CAPM理论
        (二) 套利定价理论(APT)
        (三) Fama-French三因素模型
    三、多因子选股模型的框架
        (一) 候选因子
        (二) 候选因子有效性的检验
        (三) 冗余因子的剔除
        (四) 综合评分模型构建投资组合
    四、模型绩效评价标准
        (一) 收益率评价指标
        (二) 风险评价指标
第三章 相关算法的理论概述及适用性
    一、随机森林分类算法及适用性
    二、模糊C均值聚类算法及适用性
第四章 实证研究
    一、数据的选取和因子的选取
    二、有效因子的检验
        (一) 随机森林实证检验
        (二) 有效因子筛选
    三、有效但冗余因子的剔除
    四、投资组合的构建
    五、模型结果评价
第五章 总结与展望
    一、总结
    二、展望与建议
参考文献
致谢
攻读学位期间发表的学术论文目录

【相似文献】

相关期刊论文 前10条

1 陈一诺;董绍华;;基于随机森林算法的管道缺陷预测方法[J];油气储运;年期

2 刘阳;杜华军;岳子涵;马杰;吕武;;基于随机森林的无人机检测方法[J];计算机工程与应用;年期

3 胡蝶;;基于随机森林的债券违约分析[J];当代经济;2018年03期

4 温博文;董文瀚;解武杰;马骏;;基于改进网格搜索算法的随机森林参数优化[J];计算机工程与应用;2018年10期

5 赵艺淞;杨昆;王保云;黎晓路;;随机森林在城市不透水面提取中的应用研究[J];云南师范大学学报(自然科学版);2017年03期

6 吴辰文;梁靖涵;王伟;李长生;;一种顺序响应的随机森林:变量预测和选择[J];小型微型计算机系统;2017年08期

7 顾娟;林敏;鞠桂玲;;基于随机森林回归的军械器材需求预测[J];自动化应用;2017年09期

8 刘迎春;陈梅玲;;流式大数据下随机森林方法及应用[J];西北工业大学学报;2015年06期

9 罗超;;面向高维数据的随机森林算法优化探讨[J];商;2016年04期

10 杨晓峰;严建峰;刘晓升;杨璐;;深度随机森林在离网预测中的应用[J];计算机科学;2016年06期


相关博士学位论文 前10条

1 王晓军;基于大数据的风洞马赫数集成建模方法的研究[D];东北大学;2016年

2 王鑫;基于随机森林的认知网络频谱感知算法研究[D];东北大学;2016年

3 姚登举;面向医学数据的随机森林特征选择及分类方法研究[D];哈尔滨工程大学;2016年

4 黄玥;VANET信息安全问题及异常检测技术研究[D];吉林大学;2017年

5 倪强;基于随机前沿和随机森林法的沿海开发区发展效率研究[D];天津大学;2011年

6 季斌;内蒙古浩布高地区多金属矿综合信息找矿预测研究[D];合肥工业大学;2017年

7 雷震;随机森林及其在遥感影像处理中应用研究[D];上海交通大学;2012年

8 金超;基于随机森林的医学影像分割算法研究及应用[D];苏州大学;2017年

9 李宝富;巨厚砾岩层下回采巷道底板冲击地压诱发机理研究[D];河南理工大学;2014年

10 赵东;基于群智能优化的机器学习方法研究及应用[D];吉林大学;2017年


相关硕士学位论文 前10条

1 叶蓓;WorldView-3数据的岩性信息自动提取方法研究[D];中国地质大学(北京);2018年

2 高聪;基于随机森林的不平衡大数据分类算法研究[D];东北电力大学;2018年

3 闫东阳;基于对象的随机森林遥感分类方法优化[D];中国地质大学(北京);2018年

4 吴卫星;随机森林在技术指标量化选股中的应用[D];电子科技大学;2018年

5 张向前;机器学习在辐射源信号指纹识别中的应用研究[D];电子科技大学;2018年

6 王梦芹;基于随机森林的个人信用评价指标分析[D];安徽大学;2018年

7 谈小雨;基于情感时序距离的文本情感分类和情感主体识别方法研究[D];安徽大学;2018年

8 苏靖宇;多因子选股模型在A股市场上的实证研究[D];安徽大学;2018年

9 刘建航;大数据环境下异常通话行为检测的研究[D];北京邮电大学;2018年

10 罗斌杰;基于随机森林的心脏病预测平台的设计与实现[D];北京邮电大学;2018年



本文编号:2846382

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/jinrongzhengquanlunwen/2846382.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户99f0f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com