基于强化学习的股票趋势跟踪策略研究

发布时间：2022-10-21 18:25

　　趋势跟踪策略已经在金融市场中实际应用很长时间,但仍存在着胜率低回撤大的缺点,许多研究者也从不同的方向改进这一策略,但采用智能算法对其改进的研究较少。因此本文引入近几年较为成功的强化学习算法来提高趋势跟踪策略的胜率,降低策略的回撤,进而提高策略的整体表现。本文以双均线策略作为输入样本,以净值为目标训练强化学习算法,同时以期望收益为指标评价普通趋势跟踪策略与本文所提出的基于强化学习的策略。针对算法在投资策略领域应用所存在的一些实际问题,本文采取了折扣奖励归一化、折扣奖励重置和引入惩罚项等方法,改善了训练过程与训练结果。最后,本文以限定持仓量的方式,在110只市值、行业加权抽样样本中对普通趋势跟踪策略和基于强化学习的趋势跟踪策略进行了回测。结果表明,本文所提出的策略净值、期望收益均优于普通趋势跟踪策略,这体现了本策略存在一定的实际应用价值。

【文章页数】：69 页

【学位级别】：硕士

【文章目录】：
摘要
abstract
1 绪论
    1.1 研究背景及意义
    1.2 研究内容及框架
    1.3 创新点
2 文献综述
    2.1 趋势跟踪策略文献综述
        2.1.1 趋势跟踪策略原理
        2.1.2 趋势跟踪策略改进
    2.2 强化学习应用于投资领域的文献综述
3 趋势跟踪策略
    3.1 趋势跟踪策略的理论基础
        3.1.1 认知偏差
        3.1.2 处置效应
        3.1.3 噪音交易风险
        3.1.4 羊群效应
        3.1.5 保守性偏误
        3.1.6 过度自信与自我归因偏差
        3.1.7 信息传递时滞
        3.1.8 情绪跷跷板
    3.2 趋势跟踪策略指标的种类
        3.2.1 双均线
        3.2.2 二阶低通滤波均线
        3.2.3 高低点
        3.2.4 布林带
    3.3 股指与个股的趋势性检验
        3.3.1 研究样本
        3.3.2 股指趋势性检验
        3.3.3 个股趋势性检验
    3.4 趋势跟踪策略设计与实证
        3.4.1 交易相关设定
        3.4.2 评价指标与结果汇总
        3.4.3 结果分析
    3.5 趋势跟踪策略应用现状及展望
4 强化学习策略
    4.1 强化学习的理论基础
        4.1.1 马尔可夫决策过程
        4.1.2 Q-learning与 DQN
        4.1.3 Policy Gradient
        4.1.4 LSTM
    4.2 强化学习策略的设计与实证
        4.2.1 强化学习算法的构建
        4.2.2 样本数据选取与构建
        4.2.3 奖励函数的设置
        4.2.4 算法训练结果与分析
        4.2.5 各趋势跟踪策略结果对比分析
5 结论及建议
    5.1 结论
    5.2 研究局限与建议
参考文献
致谢

【参考文献】：
期刊论文
[1]基于深度强化学习DDPG算法的投资组合管理[J]. 齐岳,黄硕华.  计算机与现代化. 2018(05)
[2]趋势跟踪类策略的内在逻辑[J]. 谭磊.  当代经济. 2017(06)

硕士论文
[1]基于深度强化学习的股市投资模型构建及实证研究[D]. 满奇.广东财经大学 2017
[2]强化学习在风险规避型数字化资产配置中的应用[D]. 曹晶.山东大学 2017

本文编号：3696154

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3696154.html

上一篇：四川西昌地区温泉及盐泉的特征及成因
下一篇：群上的度量空间值概周期函数和概自守函数

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|