基于深度强化学习的股票量化交易算法研究与实现
发布时间:2023-05-09 22:36
自21世纪以来,与计算机领域相关的软硬件技术蓬勃发展,为人工智能技术的兴起打下了良好的基础,而量化交易由于其高效和稳定的性能吸引了更多的投资者。在本文中,我们探索了深度强化学习以及元学习方法在量化交易中的潜力,提出了一种基于LSTM深度神经网络的智能体,以学习股票数据中的时间关系;并且使用策略梯度训练方法,依据当前的市场状况和历史数据进行自动化交易。本文主要完成以下工作:1.针对传统量化交易方法其表征金融信号时的缺陷,提出了格拉布斯去噪声的优化方法对金融数据进行处理,将其与量化交易系统结合,更为准确地捕捉到金融市场的特性。实验结果显示,格拉布斯去噪的优化过程可以大幅度提高智能体对股票数据的表征能力,从而超越传统方法的盈利性能。2.由于传统的量化交易方法在处理高维数据时存在难度,难以挖掘股票数据的历史意义,本文提出了基于深度强化学习的量化交易方法,智能体采用LSTM深度神经网络构造,在学习和记忆股票数据中的时序关系的同时探索最优的交易策略。实验证明,基于LSTM网络的交易智能体训练的性能优于基于全连接神经网络的智能体,前者最高收益率达到280%。3.由于金融数据存在大量噪声和冗余数据,金...
【文章页数】:90 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 选题背景及研究意义
1.2 研究现状与发展趋势
1.2.1 量化交易
1.2.2 深度强化学习
1.3 论文研究内容
1.4 论文组织结构
第二章 深度强化学习和量化交易理论
2.1 深度学习
2.2 强化学习
2.3 深度强化学习
2.4 量化交易
2.5 量化投资环境构成
第三章 直接强化学习交易算法
3.1 直接强化学习
3.1.1 夏普率
3.1.2 交易函数
3.1.3 梯度上升及策略训练
3.2 基于格拉布斯改进算法
3.2.1 直接强化学习算法缺陷
3.2.2 格拉布斯去噪优化
3.3 基于格拉布斯改进算法实验
3.3.1 数据选取
3.3.2 格拉布斯优化设置
3.3.3 实验结果
第四章 基于深度强化学习的股票交易算法改进
4.1 基于深度强化学习的量化交易算法
4.1.1 智能体网络结构
4.1.2 状态、动作及奖励值设计
4.1.3 牛市、熊市判别
4.1.4 动作筛选
4.1.5 智能体训练算法
4.2 优势指标筛选组合
4.3 实验设置
4.3.1 训练方法
4.3.2 智能体网络构造
4.3.3 优势指标筛选组合
4.4 实验结果
4.4.1 不同网络智能体性能对比
4.4.2 优势指标筛选组合
4.4.3 回溯测验:与直接强化学习算法对比
第五章 基于元强化学习方法的股票交易算法
5.1 元学习理论
5.1.1 监督学习中的元学习
5.1.2 强化学习中的元学习
5.2 基于元强化学习算法的量化交易算法
5.2.1 智能体构建
5.2.2 多任务学习梯度
5.2.3 二阶微分与一阶近似
5.3 回测设计
5.4 回测结果
第六章 总结与展望
6.1 工作总结
6.2 未来展望
致谢
参考文献
攻读硕士期间发表的学术论文与取得的其他研究成果
本文编号:3812510
【文章页数】:90 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 选题背景及研究意义
1.2 研究现状与发展趋势
1.2.1 量化交易
1.2.2 深度强化学习
1.3 论文研究内容
1.4 论文组织结构
第二章 深度强化学习和量化交易理论
2.1 深度学习
2.2 强化学习
2.3 深度强化学习
2.4 量化交易
2.5 量化投资环境构成
第三章 直接强化学习交易算法
3.1 直接强化学习
3.1.1 夏普率
3.1.2 交易函数
3.1.3 梯度上升及策略训练
3.2 基于格拉布斯改进算法
3.2.1 直接强化学习算法缺陷
3.2.2 格拉布斯去噪优化
3.3 基于格拉布斯改进算法实验
3.3.1 数据选取
3.3.2 格拉布斯优化设置
3.3.3 实验结果
第四章 基于深度强化学习的股票交易算法改进
4.1 基于深度强化学习的量化交易算法
4.1.1 智能体网络结构
4.1.2 状态、动作及奖励值设计
4.1.3 牛市、熊市判别
4.1.4 动作筛选
4.1.5 智能体训练算法
4.2 优势指标筛选组合
4.3 实验设置
4.3.1 训练方法
4.3.2 智能体网络构造
4.3.3 优势指标筛选组合
4.4 实验结果
4.4.1 不同网络智能体性能对比
4.4.2 优势指标筛选组合
4.4.3 回溯测验:与直接强化学习算法对比
第五章 基于元强化学习方法的股票交易算法
5.1 元学习理论
5.1.1 监督学习中的元学习
5.1.2 强化学习中的元学习
5.2 基于元强化学习算法的量化交易算法
5.2.1 智能体构建
5.2.2 多任务学习梯度
5.2.3 二阶微分与一阶近似
5.3 回测设计
5.4 回测结果
第六章 总结与展望
6.1 工作总结
6.2 未来展望
致谢
参考文献
攻读硕士期间发表的学术论文与取得的其他研究成果
本文编号:3812510
本文链接:https://www.wllwen.com/guanlilunwen/huobilw/3812510.html