基于顶端排序与深度模型的基本面量化方法
发布时间:2021-07-04 01:31
在股票市场中,量化投资作为一种利用计算机程序替代人为主观判断的投资方式,可以避免投资者因情绪波动而做出非理性的投资决策。通过对上市公司财务报表、公开数据进行文本挖掘与抽取,量化投资策略可以实现对于上市公司的基本面的分析,并寻找盈利状况较好的优质公司进行资产配置。为进一步提升量化投资策略的效果,本文对基本面量化策略中的量化选股模型和公告文本信息抽取问题进行了研究,主要创新成果如下:1.本文提出了一种基于顶端排序模型的量化选股算法。以往量化选股算法基于分类模型,难以体现对多支股票之间优劣的比较。本文从优化排序的角度出发,提出大小窗口下的顶端排序模型,着重预测业绩最优的少数股票及其顺序,更加利于资产配置。该方法构建大窗口来跟进股价较长时期内涨跌模式的演进,利用小窗口实现股价短期内走势的捕获,以此实现准确的排序。该方法具有时间复杂度低、可解释性强的优点,且得到的因子线性权重也可以结合传统多因子策略进行选股。实证检验结果表明,本文方法显著优于对比方法,可以稳定获得超额收益。2.本文提出了一种基于深度模型的递进式公告信息抽取方法,通过及时准确地获取上市公司最新公开信息,来帮助量化算法快速准确地反映...
【文章来源】:南京大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
图3-丨:传统排序与顶端排序效果比较??
?(3-14)??若满足,则返回顶端排序模型的权重w之后构造当期基本面因子特征进行??内积;若不满足收敛条件,则进行下一轮的迭代。如图3-2所示展示了顶端排??序模型的算法框架。??3.3实验验证??在本节,本文利用真实上市公司基本面因子数据对顶端排序算法进行验??证,数据来源某资产管理公司。??为方便理解,首先进行符号的定义。给定包含m家上市公司基本面因子数??据与股票收益率,其中每一家公司基本面因子数据足e??表示数据具有n期且每一期具有rf维数据,相应的,给定对应公司股票收益率??y/r0。w,为大窗口时间长度参数,为小窗口时间长度参数。??3.3.1实验框架??下面简要说明基于大小窗口下的顶端排序选股方法实验框架。主要在实验??层面对大小窗口下的顶端排序模型进行细节说明。??在初始化参数之后,首先对数据进行预处理,包括对数据的缺失值处理、??中位数去极值以及标准化。在缺失值的处理上
相同的构造方法构造当期各公司的基本面因子特征;使用计算好的顶端排序权??重与构造的特征进行内积,得到当期所有个股的排序。最后选取前30%个股作??为当期股票持仓,在第二日开盘后进行调仓。算法整体框架如图3-3所示:??在利用历史数据进行实验时,换仓周期为周换仓,在上周最后一个交易日??T结束后提取个股60日因子及收益率,对每日分别运行顶端排序模型,得到因??子权重,对60日因子权重以半衰期30日求得加权均值,使用此权重与T日个??股因子暴露加权后得到个股当日排序,选取前100只股票并求其行业中性权重??后,在下周第一个交易日T+1进行换仓,为了避免使用未来数据,提取T-5日??及之前的个股因子及其后5日收益率。实验流程图如图3-4所示:??接下来介绍实验所使用的相关参数及设置:??參回测时间从2008年5月至2018年6月,2008年1月-2008年5月用来确定??参数。???在训练时,股票池选取全A股票训练模型,剔除当期停牌股票,并将当期??收益率排名前15%的股票作为正例(y?=?1)
【参考文献】:
期刊论文
[1]基于多因子选股的半监督核聚类算法改进研究[J]. 李文星,李俊琪. 统计与信息论坛. 2018(03)
[2]基于多因子模型的量化选股分析[J]. 徐景昭. 金融理论探索. 2017(03)
[3]随机森林算法在多因子选股上的应用[J]. 李齐,杨君岐. 经营管理者. 2017(06)
[4]浅析基于大数据的多因子量化选股策略[J]. 李姝锦,胡晓旭,王聪. 经济研究导刊. 2016(17)
[5]中国股票市场的月份效应——基于消费习惯的解释[J]. 范辛亭,董文卓. 中山大学学报(社会科学版). 2007(03)
[6]文本挖掘技术研究进展[J]. 袁军鹏,朱东华,李毅,李连宏,黄进. 计算机应用研究. 2006(02)
[7]文本挖掘研究进展[J]. 谌志群,张国煊. 模式识别与人工智能. 2005(01)
[8]中国股市动量策略和反向策略的赢利性[J]. 罗洪浪,王浣尘. 系统工程理论方法应用. 2004(06)
[9]Web中文文本分词技术研究[J]. 马玉春,宋瀚涛. 计算机应用. 2004(04)
[10]文本挖掘及其关键技术与方法[J]. 王丽坤,王宏,陆玉昌. 计算机科学. 2002(12)
硕士论文
[1]因子选股模型在中国市场的实证研究[D]. 刘毅.复旦大学 2012
[2]多因子定价模型理论及在中国股票市场的检验[D]. 王小龙.武汉大学 2005
本文编号:3263753
【文章来源】:南京大学江苏省 211工程院校 985工程院校 教育部直属院校
【文章页数】:64 页
【学位级别】:硕士
【部分图文】:
图3-丨:传统排序与顶端排序效果比较??
?(3-14)??若满足,则返回顶端排序模型的权重w之后构造当期基本面因子特征进行??内积;若不满足收敛条件,则进行下一轮的迭代。如图3-2所示展示了顶端排??序模型的算法框架。??3.3实验验证??在本节,本文利用真实上市公司基本面因子数据对顶端排序算法进行验??证,数据来源某资产管理公司。??为方便理解,首先进行符号的定义。给定包含m家上市公司基本面因子数??据与股票收益率,其中每一家公司基本面因子数据足e??表示数据具有n期且每一期具有rf维数据,相应的,给定对应公司股票收益率??y/r0。w,为大窗口时间长度参数,为小窗口时间长度参数。??3.3.1实验框架??下面简要说明基于大小窗口下的顶端排序选股方法实验框架。主要在实验??层面对大小窗口下的顶端排序模型进行细节说明。??在初始化参数之后,首先对数据进行预处理,包括对数据的缺失值处理、??中位数去极值以及标准化。在缺失值的处理上
相同的构造方法构造当期各公司的基本面因子特征;使用计算好的顶端排序权??重与构造的特征进行内积,得到当期所有个股的排序。最后选取前30%个股作??为当期股票持仓,在第二日开盘后进行调仓。算法整体框架如图3-3所示:??在利用历史数据进行实验时,换仓周期为周换仓,在上周最后一个交易日??T结束后提取个股60日因子及收益率,对每日分别运行顶端排序模型,得到因??子权重,对60日因子权重以半衰期30日求得加权均值,使用此权重与T日个??股因子暴露加权后得到个股当日排序,选取前100只股票并求其行业中性权重??后,在下周第一个交易日T+1进行换仓,为了避免使用未来数据,提取T-5日??及之前的个股因子及其后5日收益率。实验流程图如图3-4所示:??接下来介绍实验所使用的相关参数及设置:??參回测时间从2008年5月至2018年6月,2008年1月-2008年5月用来确定??参数。???在训练时,股票池选取全A股票训练模型,剔除当期停牌股票,并将当期??收益率排名前15%的股票作为正例(y?=?1)
【参考文献】:
期刊论文
[1]基于多因子选股的半监督核聚类算法改进研究[J]. 李文星,李俊琪. 统计与信息论坛. 2018(03)
[2]基于多因子模型的量化选股分析[J]. 徐景昭. 金融理论探索. 2017(03)
[3]随机森林算法在多因子选股上的应用[J]. 李齐,杨君岐. 经营管理者. 2017(06)
[4]浅析基于大数据的多因子量化选股策略[J]. 李姝锦,胡晓旭,王聪. 经济研究导刊. 2016(17)
[5]中国股票市场的月份效应——基于消费习惯的解释[J]. 范辛亭,董文卓. 中山大学学报(社会科学版). 2007(03)
[6]文本挖掘技术研究进展[J]. 袁军鹏,朱东华,李毅,李连宏,黄进. 计算机应用研究. 2006(02)
[7]文本挖掘研究进展[J]. 谌志群,张国煊. 模式识别与人工智能. 2005(01)
[8]中国股市动量策略和反向策略的赢利性[J]. 罗洪浪,王浣尘. 系统工程理论方法应用. 2004(06)
[9]Web中文文本分词技术研究[J]. 马玉春,宋瀚涛. 计算机应用. 2004(04)
[10]文本挖掘及其关键技术与方法[J]. 王丽坤,王宏,陆玉昌. 计算机科学. 2002(12)
硕士论文
[1]因子选股模型在中国市场的实证研究[D]. 刘毅.复旦大学 2012
[2]多因子定价模型理论及在中国股票市场的检验[D]. 王小龙.武汉大学 2005
本文编号:3263753
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3263753.html