当前位置:主页 > 科技论文 > 汽车论文 >

基于深度强化学习的无人驾驶决策控制研究

发布时间:2021-06-22 05:06
  随着互联网技术以及通信技术的飞速发展,车辆的智能化和网联化技术也在逐步提高,无人驾驶技术作为智能交通的重要部分,其研究也越来越成熟。目前,大部分无人驾驶汽车都使用传统的局部路径规划以及车辆控制算法,而感知、决策、控制作为独立的模块,不能保证高精度的时间同步以及空间同步,对于自动驾驶而言,上述三个模块结合的越紧密,自动驾驶的安全性和准确性越高。随着人工智能技术的发展,深度强化学习为复杂系统的序贯优化决策问题提供了另一种解决思路,本文基于深度强化学习对无人驾驶决策控制方法进行研究,在开源赛车模拟器中进行动态行车环境的安全性分析。本文的主要研究工作如下:首先建立了面向无人驾驶的强化学习框架,基于TORCS仿真环境返回的环境和车辆状态参数对强化学习算法中状态和动作进行定义。针对期望的驾驶表现,设计了面向无人驾驶的强化学习算法奖励函数,并设计了训练过程的终止条件。根据深度确定性策略梯度算法原理和无人驾驶环境的状态、动作需求,分别建立了策略、价值、目标神经网络,分析了上述网络的训练与参数更新方法,搭建了深度强化学习算法的整个网络框架。根据车辆行驶过程中所处的状态对样本进行分类,设计了经验缓存池分离... 

【文章来源】:湖南大学湖南省 211工程院校 985工程院校 教育部直属院校

【文章页数】:69 页

【学位级别】:硕士

【部分图文】:

基于深度强化学习的无人驾驶决策控制研究


TORCS平台示意图

【参考文献】:
期刊论文
[1]深度强化学习概述[J]. 徐松林.  电脑知识与技术. 2019(03)
[2]改进DDPG算法在自动驾驶中的应用[J]. 张斌,何明,陈希亮,吴春晓,刘斌,周波.  计算机工程与应用. 2019(10)
[3]基于3D CNN-DDPG端到端无人驾驶控制[J]. 李国豪.  电子设计工程. 2018(22)
[4]无人驾驶系统中的关键技术浅论[J]. 张俊元.  时代汽车. 2018(11)
[5]无人驾驶车辆行为决策系统研究[J]. 熊璐,康宇宸,张培志,朱辰宇,余卓平.  汽车技术. 2018(08)
[6]基于改进人工势场法的智能车辆超车路径规划研究[J]. 王树凤,张钧鑫,刘宗锋.  汽车技术. 2018(03)
[7]基于人工势场算法的智能车辆路径规划仿真[J]. 安林芳,陈涛,成艾国,方威.  汽车工程. 2017(12)
[8]改进RRT在汽车避障局部路径规划中的应用[J]. 宋晓琳,周南,黄正瑜,曹昊天.  湖南大学学报(自然科学版). 2017(04)
[9]多策略蚁群算法求解越野路径规划[J]. 吴天羿,许继恒,刘建永,昝良.  解放军理工大学学报(自然科学版). 2014(02)

博士论文
[1]多智能体深度强化学习方法及应用研究[D]. 张悦.西安电子科技大学 2018
[2]智能驾驶车辆自主决策与规划的增强学习方法研究[D]. 左磊.国防科学技术大学 2016

硕士论文
[1]基于深度学习的智能控制研究[D]. 林昊威.吉林大学 2018
[2]面向无人驾驶的增强学习算法研究[D]. 陈银银.电子科技大学 2018
[3]基于深度强化学习的虚拟无人车控制研究[D]. 顾文逸.南京理工大学 2018
[4]基于深度强化学习的无人驾驶智能决策控制研究[D]. 左思翔.哈尔滨工业大学 2018
[5]基于改进型人工势场法的车辆避障路径规划研究[D]. 朱伟达.江苏大学 2017
[6]基于深度强化学习的自动驾驶决策仿真[D]. 夏伟.中国科学院大学(中国科学院深圳先进技术研究院) 2017
[7]典型路况下无人驾驶车辆局部路径规划方法研究[D]. 庄雷雨.武汉理工大学 2017
[8]无人驾驶汽车的路径规划与跟随控制算法研究[D]. 潘鲁彬.湖南大学 2016
[9]有限状态机及其应用[D]. 谭同超.华南理工大学 2013



本文编号:3242182

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/qiche/3242182.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c7400***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com