基于深度强化学习的自动泊车控制策略研究
发布时间:2022-04-17 17:10
目前汽车行业的发展重心正逐步由传统车辆向智能车辆转移,随之带来的是智能驾驶技术的迅速发展。自动泊车系统是智能驾驶技术的研究方向之一,通过在泊车过程中给予驾驶引导或者完全代替驾驶员进行泊车操作,有效地提升了泊车成功率,降低了交通事故发生几率。同时,由于停车位狭小、停车不规范,驾驶员常常面临泊车困难的局面。因此,自动泊车系统成为了当下各大车企与高校的研究热点。首先,本文对自动泊车系统的研究现状进行分析与总结,选择自动泊车系统中的泊车控制策略作为本文的研究重点,总结了现有的自动泊车控制策略以及存在的问题。基于高斯坐标系以及传统的车辆坐标系构建泊车坐标系。以车辆的运动学原理为基础,对汽车参数与停车位参数进行简化。基于阿克曼转向原理建立汽车的运动学模型,以平行、垂直泊车为泊车场景,对运动学模型进行运动分析。以车辆的极限转弯特性为切入点,研究了汽车进行泊车所需的最小停车位尺寸。其次,对人工智能领域的深度强化学习算法进行了研究。DDPG(Deep Deterministic Policy Gradient)算法是深度强化学习算法之一,具有一定学习能力与泛化性能,本文将其应用于自动泊车控制策略,实现端...
【文章页数】:91 页
【学位级别】:硕士
【文章目录】:
致谢
摘要
abstract
第一章 绪论
1.1 课题研究背景及意义
1.2 自动泊车系统国内外研究现状
1.3 自动泊车控制策略国内外研究现状
1.3.1 基于经验的泊车运动控制策略
1.3.2 基于路径规划与追踪的泊车运动控制策略
1.4 深度强化学习国内外研究现状
1.5 本文主要研究内容
第二章 泊车运动学模型
2.1 车辆泊车坐标系
2.2 汽车泊车运动学模型
2.2.1 汽车参数与车身简化
2.2.2 阿克曼转向理论和几何分析
2.2.3 基于阿克曼转向的汽车运动学模型
2.3 最小停车空间
2.3.1 车辆最小转弯半径
2.3.2 最小停车空间仿真试验及分析
2.4 本章小结
第三章 深度强化学习算法模型
3.1 深度强化学习基础
3.1.1 强化学习基础概念
3.1.2 马尔可夫决策过程
3.1.3 强化学习算法分类
3.2 DDPG算法原理及改进
3.2.1 DDPG算法原理
3.2.2 DDPG算法改进
3.3 DDPG算法状态以及动作定义
3.4 基于轨迹学习的权重奖励函数
3.4.1 奖励函数设计原则
3.4.2 泊车轨迹数据采集试验
3.4.3 权重奖励函数设计
3.5 算法网络设计
3.6 基于优先经验回放方法的采样策略
3.6.1 优先经验回放方法
3.6.2 样本抽取方法设计
3.6.3 采样策略验证试验
3.7 本章小结
第四章 自动泊车控制系统仿真
4.1 仿真环境搭建
4.1.1 车辆参数与虚拟雷达设置
4.1.3 泊车环境设置
4.1.4 输入、输出参数设置
4.2 算法网络模型搭建
4.3 模型训练以及结果分析
4.3.1 平行泊车训练结果分析
4.3.2 垂直泊车测试结果分析
4.4 针对不同泊车工况的泛化性试验
4.4.1 泊车起始位置不同的泛化性试验
4.4.2 停车位尺寸不同的泛化性试验
4.5 本章小结
第五章 硬件在环试验及其分析
5.1 HIL系统仿真硬件平台
5.2 HIL系统试验方案设计
5.3 HIL硬件在环仿真试验
5.4 本章小结
第六章 总结与展望
6.1 本文总结
6.2 展望
参考文献
攻读硕士学位期间的学术活动及成果情况
【参考文献】:
期刊论文
[1]AlphaGo与AlphaZero原理和未来应用研究[J]. 陈铭禹. 通讯世界. 2019(12)
[2]卷积神经网络的训练方式研究[J]. 赖策,魏小琴. 信息与电脑(理论版). 2019(22)
[3]基于TensorFlow的交通标志识别系统研究[J]. 仲崇豪,宋斌,徐方明,杨怡均. 信息与电脑(理论版). 2019(22)
[4]深度强化学习中稀疏奖励问题研究综述[J]. 杨惟轶,白辰甲,蔡超,赵英男,刘鹏. 计算机科学. 2020(03)
[5]基于卷积神经网络的火焰识别[J]. 段锁林,刘福,高仁洲,王一凡,潘礼正. 计算机工程与设计. 2019(11)
[6]基于深度强化学习的交通信号控制方法[J]. 孙浩,陈春林,刘琼,赵佳宝. 计算机科学. 2020(02)
[7]深度学习算法研究进展[J]. 田启川,王满丽. 计算机工程与应用. 2019(22)
[8]基于改进强化学习的无人艇集群一致性控制[J]. 曹诗杰,陈于涛,曾凡明. 华中科技大学学报(自然科学版). 2019(09)
[9]基于DDPG的无人车智能避障方法研究[J]. 徐国艳,宗孝鹏,余贵珍,苏鸿杰. 汽车工程. 2019(02)
[10]深度强化学习理论及其应用综述[J]. 万里鹏,兰旭光,张翰博,郑南宁. 模式识别与人工智能. 2019(01)
博士论文
[1]自主泊车系统关键技术研究[D]. 宋金泽.国防科学技术大学 2009
硕士论文
[1]基于强化学习的倒立摆控制算法研究[D]. 杨文乐.西安理工大学 2019
[2]基于深度强化学习算法的卫星姿态控制算法研究[D]. 许瀚.哈尔滨工业大学 2019
[3]基于DDPG的智能汽车稳定性控制方法研究[D]. 宋能学.合肥工业大学 2019
[4]基于深度强化学习的无人车控制系统的设计与实现[D]. 张磊.中国地质大学(北京) 2019
[5]基于单点预瞄偏差模型的自动泊车算法研究[D]. 谢宁猛.长安大学 2019
[6]基于人工神经网络的智能汽车循迹控制研究[D]. 李子龙.合肥工业大学 2019
[7]基于深度强化学习的视频游戏决策模型研究与应用[D]. 郭勤.江西理工大学 2018
[8]基于深度强化学习在游戏上的应用[D]. 王康.沈阳理工大学 2018
[9]基于深度强化学习的主动人脸感知技术研究[D]. 张辉.山东大学 2017
[10]基于强化学习的智能车移动模型研究[D]. 罗志祥.大连理工大学 2017
本文编号:3645984
【文章页数】:91 页
【学位级别】:硕士
【文章目录】:
致谢
摘要
abstract
第一章 绪论
1.1 课题研究背景及意义
1.2 自动泊车系统国内外研究现状
1.3 自动泊车控制策略国内外研究现状
1.3.1 基于经验的泊车运动控制策略
1.3.2 基于路径规划与追踪的泊车运动控制策略
1.4 深度强化学习国内外研究现状
1.5 本文主要研究内容
第二章 泊车运动学模型
2.1 车辆泊车坐标系
2.2 汽车泊车运动学模型
2.2.1 汽车参数与车身简化
2.2.2 阿克曼转向理论和几何分析
2.2.3 基于阿克曼转向的汽车运动学模型
2.3 最小停车空间
2.3.1 车辆最小转弯半径
2.3.2 最小停车空间仿真试验及分析
2.4 本章小结
第三章 深度强化学习算法模型
3.1 深度强化学习基础
3.1.1 强化学习基础概念
3.1.2 马尔可夫决策过程
3.1.3 强化学习算法分类
3.2 DDPG算法原理及改进
3.2.1 DDPG算法原理
3.2.2 DDPG算法改进
3.3 DDPG算法状态以及动作定义
3.4 基于轨迹学习的权重奖励函数
3.4.1 奖励函数设计原则
3.4.2 泊车轨迹数据采集试验
3.4.3 权重奖励函数设计
3.5 算法网络设计
3.6 基于优先经验回放方法的采样策略
3.6.1 优先经验回放方法
3.6.2 样本抽取方法设计
3.6.3 采样策略验证试验
3.7 本章小结
第四章 自动泊车控制系统仿真
4.1 仿真环境搭建
4.1.1 车辆参数与虚拟雷达设置
4.1.3 泊车环境设置
4.1.4 输入、输出参数设置
4.2 算法网络模型搭建
4.3 模型训练以及结果分析
4.3.1 平行泊车训练结果分析
4.3.2 垂直泊车测试结果分析
4.4 针对不同泊车工况的泛化性试验
4.4.1 泊车起始位置不同的泛化性试验
4.4.2 停车位尺寸不同的泛化性试验
4.5 本章小结
第五章 硬件在环试验及其分析
5.1 HIL系统仿真硬件平台
5.2 HIL系统试验方案设计
5.3 HIL硬件在环仿真试验
5.4 本章小结
第六章 总结与展望
6.1 本文总结
6.2 展望
参考文献
攻读硕士学位期间的学术活动及成果情况
【参考文献】:
期刊论文
[1]AlphaGo与AlphaZero原理和未来应用研究[J]. 陈铭禹. 通讯世界. 2019(12)
[2]卷积神经网络的训练方式研究[J]. 赖策,魏小琴. 信息与电脑(理论版). 2019(22)
[3]基于TensorFlow的交通标志识别系统研究[J]. 仲崇豪,宋斌,徐方明,杨怡均. 信息与电脑(理论版). 2019(22)
[4]深度强化学习中稀疏奖励问题研究综述[J]. 杨惟轶,白辰甲,蔡超,赵英男,刘鹏. 计算机科学. 2020(03)
[5]基于卷积神经网络的火焰识别[J]. 段锁林,刘福,高仁洲,王一凡,潘礼正. 计算机工程与设计. 2019(11)
[6]基于深度强化学习的交通信号控制方法[J]. 孙浩,陈春林,刘琼,赵佳宝. 计算机科学. 2020(02)
[7]深度学习算法研究进展[J]. 田启川,王满丽. 计算机工程与应用. 2019(22)
[8]基于改进强化学习的无人艇集群一致性控制[J]. 曹诗杰,陈于涛,曾凡明. 华中科技大学学报(自然科学版). 2019(09)
[9]基于DDPG的无人车智能避障方法研究[J]. 徐国艳,宗孝鹏,余贵珍,苏鸿杰. 汽车工程. 2019(02)
[10]深度强化学习理论及其应用综述[J]. 万里鹏,兰旭光,张翰博,郑南宁. 模式识别与人工智能. 2019(01)
博士论文
[1]自主泊车系统关键技术研究[D]. 宋金泽.国防科学技术大学 2009
硕士论文
[1]基于强化学习的倒立摆控制算法研究[D]. 杨文乐.西安理工大学 2019
[2]基于深度强化学习算法的卫星姿态控制算法研究[D]. 许瀚.哈尔滨工业大学 2019
[3]基于DDPG的智能汽车稳定性控制方法研究[D]. 宋能学.合肥工业大学 2019
[4]基于深度强化学习的无人车控制系统的设计与实现[D]. 张磊.中国地质大学(北京) 2019
[5]基于单点预瞄偏差模型的自动泊车算法研究[D]. 谢宁猛.长安大学 2019
[6]基于人工神经网络的智能汽车循迹控制研究[D]. 李子龙.合肥工业大学 2019
[7]基于深度强化学习的视频游戏决策模型研究与应用[D]. 郭勤.江西理工大学 2018
[8]基于深度强化学习在游戏上的应用[D]. 王康.沈阳理工大学 2018
[9]基于深度强化学习的主动人脸感知技术研究[D]. 张辉.山东大学 2017
[10]基于强化学习的智能车移动模型研究[D]. 罗志祥.大连理工大学 2017
本文编号:3645984
本文链接:https://www.wllwen.com/kejilunwen/qiche/3645984.html