基于大量因子的GBDT-SVM多层次选股模型研究
发布时间:2021-06-26 11:00
在量化投资领域中,多因子选股模型凭借稳定性高、资金容纳量大等优势被A股市场的广大专业投资者接受和使用。但近年来,模型的同质化愈发严重,A股市场风格频繁变化,基于多因子模型的投资难以获取稳定的可观收益。当前,在人工智能方法广泛应用和计算机运算能力飞速发展的背景下,梳理多因子选股模型在应用中存在的问题,将大数据样本下的机器学习算法与多因子模型相结合,可以为优化多因子投资模型提供一种手段。为了提高多因子模型对股票超额收益的获取能力,本文使用机器学习技术,对多因子模型中因子选取进行优化,并对因子权重作动态调整,故提出了基于大量因子的GBDT-SVM多层次选股模型。本模型在经典多因子模型的基础上,先使用梯度提升决策树算法对经典选股因子构建特征组合;再将特征组合作为新的一批因子,使用支持向量机算法构建选股模型。之后,使用中国A股市场数据进行实证研究,并与经典多因子模型和机器学习改进模型进行比较。研究结果表明,GBDT-SVM多层次选股模型具有更高的股票分类准确性,在模拟交易测试中也表现出了良好的盈利能力。本文的研究成果主要包括两个方面。一方面,本文构建了大量基于高频交易数据的特殊经典因子,也验证了...
【文章来源】:华南理工大学广东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
研究路线图
图 2-1 多因子建模流程图Step1:挑选因子挑选因子是模型研究的重点和难点,在挑选过程中,不仅要考虑该因子是否有经济意义,还要考虑因子是否在过往的市场行情中有效,还要考虑该因子与其他所选因子共线性问题。本文第三章将重点介绍本文使用的因子和选取因子的方法。Step2:因子选股在因子选股方面,模型使用固定周期选股的方式,通常按照周、月、季度等固定的间间隔使用模型,在周末、月末、季度末按照模型的结果选择股票和调换持有的股票,成选股投资模式。打分法和回归法为常用选股方式:其中,打分法通过某种方法对每个因子给予一定的权重,并对因子值进行加权求和获得每个股票的总得分,并通过得分筛选股票[5]。打分的方式通常因人而异:其中等重法将每个因子值等权求和得到总分;专家打分法则是通过投资经理对股市的预判为地给各个因子施加权重;ICIR 打分法通过分析各个因子在过去一段时间的表现,
图 3-1 单因子测试流程.1.1 因子数据处理本文从天软数据库和万得金融数据库下载并计算得到因子数据库后,选取 2005 年 月 1 日至 2012 年 12 月 31 日的市场所有股票数据进行单因子检验。该时间段样本数量充足,且充分涵盖了 A 股市场在不同经济环境下的行情,包括 2005 年 6 月至 200 10 月的大牛市行情,2007 年 10 月至 2008 年 11 月的大熊市行情以及若干段行情变幅度相对较小的牛市、熊市、和持续性强的震荡市行情。使用全 A 股市场股票数据够充分利用因子的有效性,更能得出因子对市场的适应情况。本文因为风险原因对两类股票进行剔除。第一类为公司连续会计年度亏损的股票括 ST 股票、*ST 股票和 PT 股票等。第二类股票为上市未满一年的股票,这类股票有“新股”的特性,较难使用因子模型进行预测,同时因为这些股票历史数据样本较,容易出现若干财务因子和技术因子的缺失。
【参考文献】:
期刊论文
[1]基于沪深300成分股的量化投资策略研究[J]. 吕凯晨,闫宏飞,陈翀. 广西师范大学学报(自然科学版). 2019(01)
[2]基于多因子选股的半监督核聚类算法改进研究[J]. 李文星,李俊琪. 统计与信息论坛. 2018(03)
[3]多因子量化模型在投资组合中的应用——基于LASSO与Elastic Net的比较研究[J]. 谢合亮,胡迪. 统计与信息论坛. 2017(10)
[4]公司特质风险、估值水平与股票收益——基于分位数Fama-MacBeth回归模型的实证分析[J]. 赵胜民,刘笑天. 华东经济管理. 2017(09)
[5]ML-TEA:一套基于机器学习和技术分析的量化投资算法[J]. 李斌,林彦,唐闻轩. 系统工程理论与实践. 2017(05)
[6]在线评论质量有用特征识别:基于GBDT特征贡献度方法[J]. 王洪伟,孟园. 中文信息学报. 2017(03)
[7]量化投资和高频交易:风险、挑战及监管[J]. 彭志. 南方金融. 2016(10)
[8]我国股指期货价格发现功能的再探讨——来自三个上市品种的经验证据[J]. 李政,卜林,郝毅. 财贸经济. 2016(07)
[9]Fama-French五因子模型比三因子模型更胜一筹吗——来自中国A股市场的经验证据[J]. 赵胜民,闫红蕾,张凯. 南开经济研究. 2016(02)
[10]新动量交易策略在A股市场的有效性研究——基于过去52周最高价格的实证检验[J]. 王明涛,黎单. 证券市场导报. 2015(07)
博士论文
[1]基于人工智能方法的股票价值投资研究[D]. 李云飞.哈尔滨工业大学 2008
硕士论文
[1]基于财务指标的我国中小制造企业信用评价研究[D]. 陶娇.四川师范大学 2018
[2]A股市场多因子选股量化模型构建及其检验[D]. 费洋.浙江大学 2018
[3]基于聚宽量化投资平台的股票多因子策略应用[D]. 杨世林.浙江大学 2018
[4]面向A股的基本面量化交易策略的设计[D]. 陈子宁.电子科技大学 2018
[5]基于Logistic回归的Barra因子选股模型研究[D]. 张冬阳.南京大学 2018
[6]基于集成学习的量化选股策略研究[D]. 王凯.华南理工大学 2017
[7]基于XGBoost算法的多因子量化选股方案策划[D]. 李想.上海师范大学 2017
[8]基于三层过滤模式的多因子选股模型研究[D]. 赵智辉.华南理工大学 2015
[9]基于多因子模型的量化选股[D]. 张利平.河北经贸大学 2014
[10]因子选股模型在中国市场的实证研究[D]. 刘毅.复旦大学 2012
本文编号:3251218
【文章来源】:华南理工大学广东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
研究路线图
图 2-1 多因子建模流程图Step1:挑选因子挑选因子是模型研究的重点和难点,在挑选过程中,不仅要考虑该因子是否有经济意义,还要考虑因子是否在过往的市场行情中有效,还要考虑该因子与其他所选因子共线性问题。本文第三章将重点介绍本文使用的因子和选取因子的方法。Step2:因子选股在因子选股方面,模型使用固定周期选股的方式,通常按照周、月、季度等固定的间间隔使用模型,在周末、月末、季度末按照模型的结果选择股票和调换持有的股票,成选股投资模式。打分法和回归法为常用选股方式:其中,打分法通过某种方法对每个因子给予一定的权重,并对因子值进行加权求和获得每个股票的总得分,并通过得分筛选股票[5]。打分的方式通常因人而异:其中等重法将每个因子值等权求和得到总分;专家打分法则是通过投资经理对股市的预判为地给各个因子施加权重;ICIR 打分法通过分析各个因子在过去一段时间的表现,
图 3-1 单因子测试流程.1.1 因子数据处理本文从天软数据库和万得金融数据库下载并计算得到因子数据库后,选取 2005 年 月 1 日至 2012 年 12 月 31 日的市场所有股票数据进行单因子检验。该时间段样本数量充足,且充分涵盖了 A 股市场在不同经济环境下的行情,包括 2005 年 6 月至 200 10 月的大牛市行情,2007 年 10 月至 2008 年 11 月的大熊市行情以及若干段行情变幅度相对较小的牛市、熊市、和持续性强的震荡市行情。使用全 A 股市场股票数据够充分利用因子的有效性,更能得出因子对市场的适应情况。本文因为风险原因对两类股票进行剔除。第一类为公司连续会计年度亏损的股票括 ST 股票、*ST 股票和 PT 股票等。第二类股票为上市未满一年的股票,这类股票有“新股”的特性,较难使用因子模型进行预测,同时因为这些股票历史数据样本较,容易出现若干财务因子和技术因子的缺失。
【参考文献】:
期刊论文
[1]基于沪深300成分股的量化投资策略研究[J]. 吕凯晨,闫宏飞,陈翀. 广西师范大学学报(自然科学版). 2019(01)
[2]基于多因子选股的半监督核聚类算法改进研究[J]. 李文星,李俊琪. 统计与信息论坛. 2018(03)
[3]多因子量化模型在投资组合中的应用——基于LASSO与Elastic Net的比较研究[J]. 谢合亮,胡迪. 统计与信息论坛. 2017(10)
[4]公司特质风险、估值水平与股票收益——基于分位数Fama-MacBeth回归模型的实证分析[J]. 赵胜民,刘笑天. 华东经济管理. 2017(09)
[5]ML-TEA:一套基于机器学习和技术分析的量化投资算法[J]. 李斌,林彦,唐闻轩. 系统工程理论与实践. 2017(05)
[6]在线评论质量有用特征识别:基于GBDT特征贡献度方法[J]. 王洪伟,孟园. 中文信息学报. 2017(03)
[7]量化投资和高频交易:风险、挑战及监管[J]. 彭志. 南方金融. 2016(10)
[8]我国股指期货价格发现功能的再探讨——来自三个上市品种的经验证据[J]. 李政,卜林,郝毅. 财贸经济. 2016(07)
[9]Fama-French五因子模型比三因子模型更胜一筹吗——来自中国A股市场的经验证据[J]. 赵胜民,闫红蕾,张凯. 南开经济研究. 2016(02)
[10]新动量交易策略在A股市场的有效性研究——基于过去52周最高价格的实证检验[J]. 王明涛,黎单. 证券市场导报. 2015(07)
博士论文
[1]基于人工智能方法的股票价值投资研究[D]. 李云飞.哈尔滨工业大学 2008
硕士论文
[1]基于财务指标的我国中小制造企业信用评价研究[D]. 陶娇.四川师范大学 2018
[2]A股市场多因子选股量化模型构建及其检验[D]. 费洋.浙江大学 2018
[3]基于聚宽量化投资平台的股票多因子策略应用[D]. 杨世林.浙江大学 2018
[4]面向A股的基本面量化交易策略的设计[D]. 陈子宁.电子科技大学 2018
[5]基于Logistic回归的Barra因子选股模型研究[D]. 张冬阳.南京大学 2018
[6]基于集成学习的量化选股策略研究[D]. 王凯.华南理工大学 2017
[7]基于XGBoost算法的多因子量化选股方案策划[D]. 李想.上海师范大学 2017
[8]基于三层过滤模式的多因子选股模型研究[D]. 赵智辉.华南理工大学 2015
[9]基于多因子模型的量化选股[D]. 张利平.河北经贸大学 2014
[10]因子选股模型在中国市场的实证研究[D]. 刘毅.复旦大学 2012
本文编号:3251218
本文链接:https://www.wllwen.com/jingjilunwen/hongguanjingjilunwen/3251218.html