基于深度强化学习的股票投资组合管理及实证研究
发布时间:2023-11-14 19:54
近年来,随着Google DeepMind等人工智能研发团队的不断出现,深度强化学习逐渐为人们所熟知。与此同时,我国股票交易市场逐渐向多样化、便捷化与信息化方向迅速发展,这使得股票交易市场每天都在产生大量数据。为了解决传统交易分析方法难以处理大量数据的缺陷,且避免人类投资者匮乏纪律性的非理性操作,具备科学性、系统性和准确性的量化投资逐渐成为机构投资研究者重点关注和发展的投资方式。量化投资是利用计算机对金融数据进行建模,挖掘数据中所蕴含的投资机会和交易信号,进而构建动态、自适应的投资策略,这与深度强化学习有异曲同工之妙,因此将二者结合起来用以解决现实金融问题是可行的。将深度强化学习应用于量化投资领域,一方面拓宽了量化投资的研究思路与建模方法,另一方面促进了金融交易向智能化与自动化方向发展。为获取最优投资机会与交易信号,本文尝试将深度强化学习(Deep Reinforcement Learning,DRL)方法应用于量化投资领域,以解决股票市场投资组合的管理问题。本文以A2C、PPO与SAC三种基于执行者/评论者的深度强化学习算法原理和框架为基础搭建模型智能体,结合股票市场历史真实价格、成...
【文章页数】:87 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景及研究意义
1.1.1 研究背景
1.1.2 研究意义
1.2 研究内容与论文框架
1.2.1 研究内容
1.2.2 论文框架
1.3 研究思路与研究方法
1.3.1 研究思路
1.3.2 研究方法
1.4 本文创新之处
第二章 文献综述
2.1 基于经典机器学习算法的量化投资
2.2 深度学习
2.2.1 深度学习在非金融领域的研究
2.2.2 深度学习在金融投资领域的研究
2.3 强化学习
2.3.1 基于价值的强化学习算法
2.3.2 基于策略的强化学习算法
2.4 深度强化学习
2.4.1 基于评论者的深度强化学习算法
2.4.2 基于执行者的深度强化学习算法
2.4.3 执行者/评论者算法
第三章 深度强化学习理论基础
3.1 深度学习理论基础
3.1.1 深度学习
3.1.2 深度神经网络
3.2 强化学习理论基础
3.2.1 马尔科夫决策过程
3.2.2 动态规划
3.2.3 蒙特卡罗强化学习方法
3.2.4 时序差分价值迭代
3.3 深度强化学习方法理论基础
3.3.1 值函数非线性近似方法
3.3.2 策略梯度方法
3.3.3 执行者/评论者方法
3.4 本章小结
第四章 构建深度强化学习投资组合管理模型
4.1 交易过程深度强化学习建模的可行性分析
4.1.1 交互过程
4.1.2 幕数与日内资产权重变化
4.1.3 模拟交易具体事项
4.2 状态、动作与奖励
4.2.1 状态
4.2.2 动作
4.2.3 奖励
4.3 智能体的构建
4.3.1 A2C
4.3.2 PPO
4.3.3 SAC
第五章 深度强化学习投资组合管理模型实证分析
5.1 实验设计
5.1.1 训练与测试的区间划分
5.1.2 交易资产组合的选择
5.1.3 数据的获取与预处理
5.1.4 基准与对照模型的设定
5.2 实验结果分析
5.2.1 累计收益率曲线
5.2.2 年化收益率
5.2.3 年化波动率
5.2.4 夏普比率
5.2.5 最大回撤率
5.2.6 Alpha值
5.2.7 Beta值
5.2.8 索提诺比率
5.3 本章小结
总结与展望
6.1 总结
6.2 展望
参考文献
致谢
攻读硕士学位期间取得的科研成果
本文编号:3864102
【文章页数】:87 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景及研究意义
1.1.1 研究背景
1.1.2 研究意义
1.2 研究内容与论文框架
1.2.1 研究内容
1.2.2 论文框架
1.3 研究思路与研究方法
1.3.1 研究思路
1.3.2 研究方法
1.4 本文创新之处
第二章 文献综述
2.1 基于经典机器学习算法的量化投资
2.2 深度学习
2.2.1 深度学习在非金融领域的研究
2.2.2 深度学习在金融投资领域的研究
2.3 强化学习
2.3.1 基于价值的强化学习算法
2.3.2 基于策略的强化学习算法
2.4 深度强化学习
2.4.1 基于评论者的深度强化学习算法
2.4.2 基于执行者的深度强化学习算法
2.4.3 执行者/评论者算法
第三章 深度强化学习理论基础
3.1 深度学习理论基础
3.1.1 深度学习
3.1.2 深度神经网络
3.2 强化学习理论基础
3.2.1 马尔科夫决策过程
3.2.2 动态规划
3.2.3 蒙特卡罗强化学习方法
3.2.4 时序差分价值迭代
3.3 深度强化学习方法理论基础
3.3.1 值函数非线性近似方法
3.3.2 策略梯度方法
3.3.3 执行者/评论者方法
3.4 本章小结
第四章 构建深度强化学习投资组合管理模型
4.1 交易过程深度强化学习建模的可行性分析
4.1.1 交互过程
4.1.2 幕数与日内资产权重变化
4.1.3 模拟交易具体事项
4.2 状态、动作与奖励
4.2.1 状态
4.2.2 动作
4.2.3 奖励
4.3 智能体的构建
4.3.1 A2C
4.3.2 PPO
4.3.3 SAC
第五章 深度强化学习投资组合管理模型实证分析
5.1 实验设计
5.1.1 训练与测试的区间划分
5.1.2 交易资产组合的选择
5.1.3 数据的获取与预处理
5.1.4 基准与对照模型的设定
5.2 实验结果分析
5.2.1 累计收益率曲线
5.2.2 年化收益率
5.2.3 年化波动率
5.2.4 夏普比率
5.2.5 最大回撤率
5.2.6 Alpha值
5.2.7 Beta值
5.2.8 索提诺比率
5.3 本章小结
总结与展望
6.1 总结
6.2 展望
参考文献
致谢
攻读硕士学位期间取得的科研成果
本文编号:3864102
本文链接:https://www.wllwen.com/jingjilunwen/jingjiguanlilunwen/3864102.html