当前位置:主页 > 科技论文 > 自动化论文 >

移动机器人在复杂环境下的动态避障

发布时间:2021-10-11 02:50
  近年来,机器人在人类社会中扮演着越来越重要的角色,尤其是移动机器人正慢慢融入人们的日常生活。然而不论是室内使用的扫地机器人,还是在户外使用的外卖机器人、快递机器人、巡逻机器人等都面临着避障问题,它们的应用场景中不仅有静态的障碍物,还往往有人、动物以及其它交通工具等动态的障碍物,避开静态以及动态障碍物是对移动机器人的基本要求,也是机器人领域研究的一个核心问题。本文首先针对动态环境下的移动机器人避障问题提出了一种基于深度强化学习的端到端的动态避障算法。该算法提出了一种新型策略网络,该网络创造性地将处理文本时序信息的长短期记忆单元与处理图像信息的卷积层相结合构成新的特征提取网络。在此基础上本文设计了新型的奖赏函数,结合增加正则项的近端策略优化,经过训练得到了优化的避障策略模型。该算法输入为激光雷达扫描数据、目标位置坐标参数以及机器人本体的速度信息,基于这些参数可直接输出用于机器人灵活避障的速度指令,在本文仿真实验部分中设置的多种复杂仿真环境的综合平均避障成功率可达70%以上。硬件部分创新性地使用3D激光雷达与超宽带定位系统相结合的导航避障传感系统,同时优化了传感器的连接与供电方案,使得传感器... 

【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校

【文章页数】:75 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 课题研究背景
    1.2 国内外研究现状分析
        1.2.1 经典路径规划算法
        1.2.2 群体智能算法
        1.2.3 深度强化学习类算法
    1.3 本文的主要研究内容
第2章 基于深度强化学习的动态避障算法研究
    2.1 引言
    2.2 强化学习基本数学模型
    2.3 移动机器人动态避障建模
        2.3.1 观测空间设计
        2.3.2 动作空间设计
        2.3.3 奖赏函数设计
        2.3.4 基于近端策略优化的建模
    2.4 神经网络结构
    2.5 训练算法描述
    2.6 仿真环境的配置
    2.7 训练结果
    2.8 本章小结
第3章 基于改进动态窗口法的动态避障算法研究
    3.1 引言
    3.2 动态窗口法基本原理
        3.2.1 机器人运动学模型推导
        3.2.2 速度选取空间与预测轨迹评价函数
    3.3 动态窗口法DWA的改进
    3.4 动态窗口法改进算法的仿真
    3.5 本章小结
第4章 基于莱卡狗机器人的实验验证
    4.1 引言
    4.2 机器人硬件平台
    4.3 对基于深度强化学习的动态避障算法的实验验证
        4.3.1 传感器方案
        4.3.2 真实环境中的实验验证
    4.4 对基于改进DWA的动态避障算法的实验验证
        4.4.1 传感器方案
        4.4.2 真实环境中的实验方案
    4.5 两套避障方案的对比分析
        4.5.1 硬件部分的对比与分析
        4.5.2 算法部分的对比与分析
    4.6 本章小结
结论
参考文献
攻读硕士学位期间发表的研究成果
致谢


【参考文献】:
期刊论文
[1]“绝影”机器人助力智慧安防[J]. 朱秋国.  中国测绘. 2019(03)

硕士论文
[1]基于深度强化学习的未知环境下机器人路径规划的研究[D]. 卜祥津.哈尔滨工业大学 2018
[2]基于RGB-D相机中型组足球机器人的目标检测方法研究[D]. 程球.国防科学技术大学 2016



本文编号:3429643

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3429643.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fd277***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com