基于深度强化学习的虚拟装配路径规划方法研究
发布时间:2023-04-02 02:29
虚拟装配是虚拟制造的重要组成部分,利用虚拟装配,可以验证装配设计和操作的正确与否,以便及早的发现装配中的问题,对模型进行修改,并通过可视化显示装配过程。路径规划是虚拟装配的一个重要发展方向,研究虚拟装配环境下的路径规划技术对于复杂环境的装配路径设计具有十分重要的意义。装配路径规划是从产品的装配起点出发,根据装配环境的特点及待装配零部件与其它零部件的相对位置关系等信息进行路径求解,并最终获得一条满足装配要求的无碰撞路径。在计算机上搭建虚拟装配场景,实现装配路径的规划,可及时验证装配产品零部件的装配有效性。但是路径规划主要用于机器人领域,通过传感器识别简单环境,根据环境建模对路径进行规划。而虚拟装配中具有大量复杂环境,不容易被建模且包含狭窄空间,传统路径规划算法无法保证复杂环境下的通行性和规划效率,因而不适宜直接运用在虚拟装配的复杂环境中。针对虚拟装配中自由空间相对狭窄而造成的复杂环境通行性问题,提出了通过跟踪和反馈的方式学习最优的动作序列决策的深度强化学习。本文基于深度强化学习实现了虚拟装配的路径规划,主要完成了以下几个方面的问题:(1)介绍了路径规划领域的发展和研究现状,通过分析国内外...
【文章页数】:45 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景与意义
1.2 路径规划研究现状
1.3 虚拟装配路径规划算法存在的问题
1.4 本文主要工作
1.5 章节安排
第二章 路径规划和深度强化学习方法
2.1 路径规划基本步骤
2.2 强化学习
2.2.1 强化学习理论基础
2.2.2 值迭代算法和策略迭代算法
2.3 深度学习
2.3.1 深度学习的理论基础
2.3.2 卷积神经网络
2.4 深度强化学习
2.5 探索与利用
2.6 本章小结
第三章 基于深度Q网络的路径规划
3.1 DQN算法模型
3.2 经验回放与目标网络
3.3 路径规划的探索与利用问题
3.4 模糊贝叶斯决策算法
3.4.1 贝叶斯决策算法
3.4.2 具有先验知识的模糊贝叶斯决策算法
3.5 本章小结
第四章 实验结果及分析
4.1 探索与利用的实验效果
4.1.1 不同的ε取值的实验结果
4.1.2 模糊贝叶斯决策算法的实验结果
4.2 路径规划的实验结果
4.3 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
攻读硕士学位期间发表的论文及其它成果
致谢
本文编号:3778348
【文章页数】:45 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景与意义
1.2 路径规划研究现状
1.3 虚拟装配路径规划算法存在的问题
1.4 本文主要工作
1.5 章节安排
第二章 路径规划和深度强化学习方法
2.1 路径规划基本步骤
2.2 强化学习
2.2.1 强化学习理论基础
2.2.2 值迭代算法和策略迭代算法
2.3 深度学习
2.3.1 深度学习的理论基础
2.3.2 卷积神经网络
2.4 深度强化学习
2.5 探索与利用
2.6 本章小结
第三章 基于深度Q网络的路径规划
3.1 DQN算法模型
3.2 经验回放与目标网络
3.3 路径规划的探索与利用问题
3.4 模糊贝叶斯决策算法
3.4.1 贝叶斯决策算法
3.4.2 具有先验知识的模糊贝叶斯决策算法
3.5 本章小结
第四章 实验结果及分析
4.1 探索与利用的实验效果
4.1.1 不同的ε取值的实验结果
4.1.2 模糊贝叶斯决策算法的实验结果
4.2 路径规划的实验结果
4.3 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
攻读硕士学位期间发表的论文及其它成果
致谢
本文编号:3778348
本文链接:https://www.wllwen.com/kejilunwen/jiagonggongyi/3778348.html