当前位置:主页 > 经济论文 > 投融资论文 >

基于机器学习的量化选股研究

发布时间:2017-07-03 06:20

  本文关键词:基于机器学习的量化选股研究


  更多相关文章: 量化投资 量化选股 机器学习 模式识别 动量反转


【摘要】:近年来,量化投资凭借其精力无限、依靠概率取胜和纪律性强的优势受到越来越多的关注。与西方成熟市场相比,我国量化投资还处于起步阶段,存在量化投资产品规模小、策略缺乏多样性、业绩表现分化的不足。尽管如此,从我国实情来看,量化投资仍会有很广阔的发展前景。因此,对于量化选股方法的理论及实践进行研究,构建适合A股市场的选股策略,并以此指导投资者进行量化投资有很重要的现实意义。股票市场是一个低信噪比的、复杂的非线性系统,而机器学习在诸多领域如搜索和语音识别中均被证明是针对模糊非线性数据进行建模的强有力工具,使用机器学习方法来构建量化投资策略具有一定的天然优势。选股本质是一个排序问题,投资者都希望能挑选出相对于其他股票在未来表现更好的股票,基于此,本文尝试将机器学习领域中两种较为成熟的学习排序算法GBDT和GBRank应用到选股问题中。本文以技术分析为理论根据,先后构建了基于模式识别的短线选股策略和基于动量和反转效应的长线选股策略。前者根据个股在过去一个月内的价格走势形态构来建特征向量,利用机器学习算法自动进行模式识别;后者以不同时间周期的动量、反转因子为基础构建特征向量,利用机器学习算法从大量数据中自动学习动量、反转效应在时间尺度上的分布规律。实验结果表明,采用GBDT排序算法的两个策略,在过去4年的时间里均可大幅跑赢沪深300指数,对交易者的投资决策具有一定的参考意义。本文的创新之处在于:将机器学习与技术分析结合,构建了基于模式识别、以及基于动量反转效应的量化选股策略,解决了传统选股方法中的模式发掘困难、参数难确定等弊端;首次将信息检索领域应用较好的机器学习排序算法GBDT和GBRank引入到量化选股领域,实验证明使用GBDT算法的两个策略有较强盈利性;对策略中特征向量的提取,做了一些降噪、引入分位数等数据上的处理,有利于提高机器学习的性能。
【关键词】:量化投资 量化选股 机器学习 模式识别 动量反转
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:F832.51
【目录】:
  • 摘要10-11
  • ABSTRACT11-13
  • 1 绪论13-22
  • 1.1 研究背景13-14
  • 1.2 研究目标及意义14-15
  • 1.2.1 研究目标14-15
  • 1.2.2 研究意义15
  • 1.3 量化选股研究现状15-18
  • 1.3.1 国外研究现状16-17
  • 1.3.2 国内研究现状17-18
  • 1.4 研究方法与技术路线18-20
  • 1.4.1 研究方法18-19
  • 1.4.2 技术路线19-20
  • 1.5 研究内容与论文结构20
  • 1.5.1 研究内容20
  • 1.5.2 论文结构20
  • 1.6 创新点20-22
  • 2 理论与方法基础22-39
  • 2.1 量化选股相关理论基础22-27
  • 2.1.1 模式识别23-25
  • 2.1.2 动量反转效应25-27
  • 2.2 基于机器学习的排序算法27-38
  • 2.2.1 GBDT算法30-35
  • 2.2.2 GBRank算法35-38
  • 2.3 本章小结38-39
  • 3 基于模式识别的短线选股策略研究39-49
  • 3.1 策略概述39-41
  • 3.2 数据准备41
  • 3.3 特征提取41-43
  • 3.4 模型训练43-45
  • 3.4.1 基于GBDT与模式识别的排序模型训练43-44
  • 3.4.2 基于GBRank与模式识别的排序模型训练44-45
  • 3.5 实验结果与分析45-47
  • 3.5.1 评价标准45
  • 3.5.2 基于GBDT与模式识别的排序模型实验结果与分析45-46
  • 3.5.3 基于GBRank与模式识别的排序模型实验结果与分析46-47
  • 3.6 本章小结47-49
  • 4 基于动量和反转效应的长线选股策略研究49-58
  • 4.1 策略概述49-50
  • 4.2 数据准备50-51
  • 4.3 特征提取51-52
  • 4.4 模型训练52-54
  • 4.4.1 基于GBDT与动量反转效应的排序模型训练52-54
  • 4.4.2 基于GBRank与动量反转效应的排序模型训练54
  • 4.5 实验结果与分析54-56
  • 4.5.1 评价标准54-55
  • 4.5.2 基于GBDT与动量反转效应的排序模型实验结果与分析55-56
  • 4.5.3 基于GBRank与动量反转效应的排序模型实验结果与分析56
  • 4.6 本章小结56-58
  • 5 总结与展望58-60
  • 5.1 总结58
  • 5.2 展望58-60
  • 参考文献60-66
  • 致谢66-67
  • 学位论文评阅及答辩情况表67

【相似文献】

中国期刊全文数据库 前10条

1 贺英杰;叶宗民;金吉学;;机器学习在入侵检测中的应用综述[J];计算机安全;2010年03期

2 袁鼎荣;;浅谈《机器学习》的课程教学方法[J];广西经济管理干部学院学报;2010年04期

3 李航;;机器学习正在改变我们的工作与生活[J];中国科技财富;2011年15期

4 井田;朱玉琴;;多侧面递进算法在机器学习中的应用[J];科技创新导报;2012年11期

5 ;“第12届中国机器学习会议”征文[J];科技导报;2009年19期

6 ;传漾:AdPlace[J];成功营销;2013年03期

7 白朝阳;;美国国安局:防不胜防的“信息窃贼”[J];中国经济周刊;2013年24期

8 ;“第12届中国机器学习会议”征文[J];科技导报;2009年21期

9 井超;陈立潮;;机器学习在科技成果评估专家系统中的应用[J];科技情报开发与经济;2006年07期

10 丁未;;机器学习为代表的人工智能在仪器仪表工业中的应用展望[J];中国仪器仪表;2014年08期

中国重要会议论文全文数据库 前10条

1 王珏;;归纳机器学习[A];2001年中国智能自动化会议论文集(上册)[C];2001年

2 王昊;李银波;纪志梁;;利用机器学习方法预测严重药物不良反应-呼吸困难[A];中国化学会第28届学术年会第13分会场摘要集[C];2012年

3 吴沧浦;;智能系统与机器学习的新领域[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年

4 周晴杰;徐立鸿;吴启迪;;机器学习串级结构的初步探讨[A];1998年中国控制会议论文集[C];1998年

5 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年

6 徐礼胜;李乃民;王宽全;张冬雨;耿斌;姜晓睿;陈超海;罗贵存;;机器学习在中医计算机诊断识别系统中的应用思考[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年

7 蔡健平;林世平;;基于机器学习的词语和句子极性分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

8 黄金铁;李景银;周建常;;对高炉炉况评价模型参数的机器学习——一个三类线性模式分类器的实现[A];1995中国控制与决策学术年会论文集[C];1995年

9 程国建;蔡磊;潘华贤;;核向量机在大规模机器学习中的应用[A];第十一届中国青年信息与管理学者大会论文集[C];2009年

10 张钹;张铃;;统计学习理论及其应用[A];2001年中国智能自动化会议论文集(上册)[C];2001年

中国重要报纸全文数据库 前10条

1 黎骊/文 [美] Tom M.Mitchell 著;机器学习与智能化社会[N];中国邮政报;2003年

2 IBM大数据专家 James Kobielus 范范 编译;机器学习已成为大数据基石[N];网络世界;2014年

3 本报记者 房琳琳;合久必分:分布式“机器学习”应运而生[N];科技日报;2014年

4 雨辰;机器学习类图书为什么火爆[N];中华读书报;2014年

5 百度公司技术副总监 多媒体部负责人 余凯;深度学习与多媒体搜索技术演进[N];中国信息化周报;2013年

6 本报记者 余建斌;机器学习与互联网搜索[N];人民日报;2011年

7 本报记者 张晔邋通讯员 李玮;周志华:永不墨守成规[N];科技日报;2008年

8 记者  彭德倩;机器学习精度提升近6个百分点[N];解放日报;2006年

9 本报记者 闵杰;大数据热 高端人才缺[N];中国电子报;2013年

10 沈建苗 编译;如何成为大数据科学家[N];计算机世界;2013年

中国博士学位论文全文数据库 前10条

1 董春茹;机器学习中的权重学习与差分演化[D];华南理工大学;2015年

2 姚明臣;机器学习和神经网络学习中的若干问题研究[D];大连理工大学;2016年

3 赵玉鹏;机器学习的哲学探索[D];大连理工大学;2010年

4 胡巍;面向格结构的机器学习[D];上海交通大学;2009年

5 张义荣;基于机器学习的入侵检测技术研究[D];国防科学技术大学;2005年

6 钱线;快速精确的结构化机器学习方法研究[D];复旦大学;2010年

7 梁锡军;稀疏优化在机器学习中的若干应用[D];大连理工大学;2013年

8 蒋刚;核机器学习方法若干问题研究[D];西南交通大学;2006年

9 陈慧灵;面向智能决策问题的机器学习方法研究[D];吉林大学;2012年

10 周伟达;核机器学习方法研究[D];西安电子科技大学;2003年

中国硕士学位论文全文数据库 前10条

1 张柯;基于机器学习的错误定位方法研究[D];南京航空航天大学;2015年

2 于雯;机器学习在信用评级中的应用[D];中国海洋大学;2015年

3 裴松年;基于机器学习的分类算法研究[D];中北大学;2016年

4 李红;基于机器学习的中医药配方评估研究[D];南京大学;2016年

5 周文U,

本文编号:512619


资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/touziyanjiulunwen/512619.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户30da0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com