当前位置:主页 > 社科论文 > 社会学论文 >

结合先验知识的深度Q神经网络算法在室内路径规划中的研究与应用

发布时间:2020-06-30 03:14
【摘要】:机器人路径规划问题是当前研究的热门方向。其中,室内机器人路径规划任务存在室内环境不确定性大、安全要求更高等问题。然而,传统的路径规划算法如全局路径规划算法需要根据环境建立导航地图,对不同环境的适应性较差,不便于处理室内路径规划问题;局部路径规划算法则容易陷入局部最优。针对这一问题,论文提出了一种基于结合先验知识的深度Q神经网络算法的室内路径规划模型,该模型能够通过自主学习完成路径规划任务,可以更好的解决不同室内场景差异较大的问题,不需要建立导航地图,仅通过摄像头传感器获取周围环境图像完成导航任务。论文具体研究内容如下:(1)论文总结了机器人路径规划问题和深度强化学习的研究现状,提出了一种结合先验知识的深度Q神经网络算法(Priori Knowledge-DQN,PK-DQN)研究方法。该方法对先验知识进行了定义和量化,并将先验知识引入深度Q神经网络算法中。该方法将先验知识定义为一种动作选择规则,从而干预算法的训练过程,通过减少算法训练中的无效探索来提高算法的效率。(2)论文对基于PK-DQN算法的室内机器人路径规划模型进行了研究。结合室内机器人路径规划任务,为了保证室内人和机器人的安全,设置了强制避障模块。将是否出现妨碍机器人安全的障碍物作为先验知识,设置了强制避障的阈值,从而构建了基于PK-DQN算法的室内机器人路径规划模型。(3)论文搭建了基于ROS机器人开发平台和Gazebo仿真软件的室内三维仿真环境,并设计室内移动机器人进行路径规划任务仿真实验,用该实验来验证基于PK-DQN算法的室内机器人路径规划模型的有效性。实验结果证明,该模型能有效的完成室内机器人路径规划和导航任务。
【学位授予单位】:合肥工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:C913.4
【图文】:

卷积


出特征信息的方法。该方法的思想来自于生物学界对于猫的视觉皮层的研究。在经层中,视觉信息会先通过简单的细胞进行处理,提取出简单的细胞提取出图像初级特征,然后跟高阶的细胞会对处理结果进行部分池化,经过一系列的处理最得到高层次的特征,然后这些高层次的特征可以用来进行图像的分类和识别。卷神经网络通过对复杂的输入数据进行卷积(Convolutional)操作,池化(pooling)作,全连接操作,最后输出分类或识别的结果,如图 2.3 所示。

算法,卷积,输出动作,全连接


算法输入

【参考文献】

相关期刊论文 前10条

1 宣冬梅;王菊韵;于华;赵佳;;深度学习中先验知识的应用[J];计算机工程与设计;2015年11期

2 张春元;朱清新;;基于对称扰动采样的Actor-critic算法[J];控制与决策;2015年12期

3 王国芳;方舟;李平;;基于批量递归最小二乘的自然Actor-Critic算法[J];浙江大学学报(工学版);2015年07期

4 郭丽丽;丁世飞;;深度学习研究进展[J];计算机科学;2015年05期

5 王田苗;陶永;;我国工业机器人技术现状与产业化发展战略[J];机械工程学报;2014年09期

6 孙志军;薛磊;许阳明;王正;;深度学习研究综述[J];计算机应用研究;2012年08期

7 王殿君;;基于改进A~*算法的室内移动机器人路径规划[J];清华大学学报(自然科学版);2012年08期

8 钱夔;宋爱国;章华涛;熊鹏文;;基于自适应模糊神经网络的机器人路径规划方法[J];东南大学学报(自然科学版);2012年04期

9 于振中;闫继宏;赵杰;陈志峰;朱延河;;改进人工势场法的移动机器人路径规划[J];哈尔滨工业大学学报;2011年01期

10 朱大奇;颜明重;;移动机器人路径规划技术综述[J];控制与决策;2010年07期

相关博士学位论文 前1条

1 王国芳;专家知识辅助的强化学习研究及其在无人机路径规划中的应用[D];浙江大学;2017年

相关硕士学位论文 前2条

1 许亚;基于强化学习的移动机器人路径规划研究[D];山东大学;2013年

2 胡国梁;智能家庭服务监控机器人的避障实现与路径规划研究[D];山东大学;2009年



本文编号:2734775

资料下载
论文发表

本文链接:https://www.wllwen.com/shekelunwen/shgj/2734775.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c8ce7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com