当前位置:主页 > 科技论文 > 汽车论文 >

基于深度增强学习的智能车安全并道决策研究

发布时间:2022-04-17 20:14
  “并道”全称为“向左、右变更车道”,即在道路同一方向上有两条或以上机动车道时,可以在不影响相关道内行驶的机动车的正常行驶的前提下,改变行车道路。汽车智能化技术作为当今世界车辆工程领域的研究热点,加强智能车安全并道决策行为研究对于缓解道路拥堵,提高道路通行能力,改善绿色生态驾驶环境具有重大意义。传统的经验规则决策算法对智能车及环境模型的依赖较高,在复杂动态的交通环境下,车辆的换道空间具有明显的差异性,换道过程中的大量动态性、不确定信息也为自动驾驶车辆的驾驶决策带来了巨大挑战。本文为保障智能车并道决策的安全性,研究并设计了两种智能车决策模型。首先,对分层状态机的混合式决策规划模型进行设计。基于一定的驾驶先验规则,通过分层状态机进行不同驾驶状态、子行为间的切换,能够将复杂的决策逻辑清晰条理化。轨迹规划模块采用滚动时域优化的局部路径规划方法,将行为规划的结果综合传感器感知的周围环境,针对不同的条件约束,采用高次多项式拟合的方式,考虑安全和舒适等原则,实时规划出最优路径,最后通过连续变道的仿真验证算法的有效性。然后,对深度增强学习DQN的动作反应式决策模型进行设计。首先针对传统经验回放改进,引入... 

【文章页数】:92 页

【学位级别】:硕士

【文章目录】:
摘要
abstract
第一章 绪论
    1.1 课题背景及意义
    1.2 驾驶决策算法研究现状
        1.2.1 先验规则型
        1.2.2 数据统计驱动型
    1.3 论文的结构安排
第二章 基本理论
    2.1 决策规划系统体系结构
        2.1.1 逐层递阶式
        2.1.2 动作反应式
        2.1.3 混合式
    2.2 智能车辆的运动分析
    2.3 深度增强学习的基本理论
        2.3.1 增强学习
        2.3.2 深度学习
        2.3.3 典型算法框架及应用
    2.4 本章小节
第三章 基于分层状态机的混合式驾驶决策模型
    3.1 引言
    3.2 换道行为分析
        3.2.1 换道动机
        3.2.2 换道风险系数
        3.2.3 车辆跟驰模型
        3.2.4 换道执行过程
    3.3 层次有限状态机
    3.4 分层状态机的行为规划设计
    3.5 滚动时域优化的路径规划
        3.5.1 规划过程
        3.5.2 阶段性实验结果
    3.6 实验设计及仿真
    3.7 本章小结
第四章 基于DQN的动作反应式决策模型
    4.1 引言
    4.2 DQN与智能车决策问题的契合
    4.3 经验回放的优先级采样
    4.4 多车道的选择性换道
        4.4.1 驾驶环境模型
        4.4.2 驾驶行为的MDP过程建模
            4.4.2.1 MDP状态集合的设计
            4.4.2.2 MDP动作集合的设计
            4.4.2.3 MDP回报集合的设计
        4.4.3 长短时记忆网络LSTM
        4.4.4 实验设计及结果仿真
            4.4.4.1 实验目标及实验环境
            4.4.4.2 实验描述
            4.4.4.3 实验结果分析
    4.5 匝道合流目的性换道
        4.5.1 驾驶行为的MDP过程建模
        4.5.2 实验设计及结果仿真
    4.6 模型特点比较
    4.7 本章小结
第五章 总结与展望
    5.1 全文总结
    5.2 后续工作展望
致谢
参考文献
攻读硕士学位期间取得的成果


【参考文献】:
期刊论文
[1]基于强化学习的无人驾驶匝道汇入模型[J]. 乔良,鲍泓,玄祖兴,梁军,潘峰.  计算机工程. 2018(07)
[2]车辆换道交互行为分析和建模[J]. 曲大义,陈文娇,杨万三,万孟飞,曹俊业.  公路交通科技. 2016(06)
[3]基于混合体系结构的无人驾驶车辆系统[J]. 修彩靖,陈慧.  农业机械学报. 2012(01)
[4]基于MAS的驾驶行为决策模型的研究[J]. 徐亮,张自力.  计算机工程与科学. 2010(05)
[5]智能车辆自由换道模型研究[J]. 李玮,高德芝,段建民.  公路交通科技. 2010(02)
[6]基于决策树的驾驶行为决策机制研究[J]. 王晓原,杨新月.  系统仿真学报. 2008(02)

博士论文
[1]城市环境下无人驾驶车辆决策系统研究[D]. 陈佳佳.中国科学技术大学 2014
[2]智能车辆自主导航中避障路径规划与跟踪控制研究[D]. 汪明磊.合肥工业大学 2013

硕士论文
[1]基于深度学习的换道行为建模与分析[D]. 房哲哲.北京交通大学 2018
[2]基于深度强化学习的视频游戏决策模型研究与应用[D]. 郭勤.江西理工大学 2018
[3]基于深度强化学习的股市投资模型构建及实证研究[D]. 满奇.广东财经大学 2017
[4]Q学习结合神经网络的智能驾驶行为决策系统[D]. 鄢婷.天津工业大学 2017
[5]复杂动态城市环境下无人驾驶车辆仿生换道决策模型研究[D]. 田赓.北京理工大学 2016
[6]深度强化学习在视频游戏中的应用[D]. 邱立威.华南理工大学 2015
[7]基于增强学习的无人车辆智能决策方法研究[D]. 郑睿.国防科学技术大学 2013



本文编号:3646194

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/qiche/3646194.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0f40b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com