当前位置:主页 > 管理论文 > 领导决策论文 >

基于流形学习的强化学习算法研究

发布时间:2024-01-29 06:53
  如何表示数据和怎样自动发现options是强化学习面临的两个巨大挑战。近年来分层强化学习在解决“维数灾难”问题方面取得了显著进展,其主要思想是将任务层次分解为子任务,从而加速智能体的学习和规划过程。目前的层次化分解方法基本都是根据先验知识预先设计好的,并不是自动生成的。特别是在动态变化的复杂领域,单凭先验知识预先设计层次结构,在实际应用中很难实现。子任务的自动发现问题已经成为分层强化学习研究领域的热点。流形学习作为一种重要的特征表示和降维技术,在模式识别中得到了广泛的研究。特征表示不仅对模式识别至关重要,而且对解决具有大规模或连续状态空间的序列决策问题也至关重要。因此,对于强化学习算法,非常有必要研究各种具有不同属性的特征学习方法,从而使其在不同的情况下获得更好的性能。为此,针对目前options发现方法中仍然存在的一些问题与不足,本文主要从策略构建方面和options的构造方面展开研究,提出相应的改进算法。主要研究工作如下:第一,针对options发现问题,本文提出了一种基于拉普拉斯特征映射的options自动发现算法。该算法通过PVFs间接定义options来解决options自动...

【文章页数】:87 页

【学位级别】:硕士

图9面上基金资助率随申请人年龄的分布

图9面上基金资助率随申请人年龄的分布


图1-1论文组织结构

图1-1论文组织结构


图2-1强化学习模型

图2-1强化学习模型


图2-2强化学习四要素

图2-2强化学习四要素



本文编号:3887880

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/3887880.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9342a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com