当前位置:主页 > 科技论文 > 软件论文 >

基于元胞自动机和强化学习的驾驶教学决策模型研究

发布时间:2023-04-03 17:31
  当今社会发展迅速,民用汽车拥有量不断增加,熟练的驾驶技术成为现代人的必备技能。为了提升驾校培训效率,人们开始重视机器人教练的开发与使用。然而,现有机器人教练的教学规则是固定不变的,无法像真人驾校教练一样根据学员的特性进行教学创新与因材施教,使得机器人教练难以达到真人教练的教学效果。想要用机器人教练实现因材施教的功能,主要面临两个问题:一是难以对学员建立准确的数学描述模型,这是因为在驾驶培训过程中,学员特性变化大,且学员的操作具有随机性;二是在学员特性不确定的情况下,难以建立驾校教练决策模型。针对以上两个问题,本文对驾驶培训过程进行了分析:将学员练车的过程分解为学员前馈、学员反馈、教练反馈三部分,分别讨论了三者对驾驶轨迹的影响;对驾校教练的教学过程进行了分析,比较了真人驾校教练与自动驾驶的区别,并讨论了机器人教练的优势与不足。以上述分析为基础,引入元胞自动机和强化学习算法,得到如下创新成果:(1)针对学员特性变化大、操作具有随机性的问题,本文以倒车入库为场景,将学员与车辆看作整体,设计了一种学员与车整体的元胞自动机模型。利用六边形网格划分元胞空间,离散化元胞的运动方向,确定元胞的状态和邻...

【文章页数】:80 页

【学位级别】:硕士

【文章目录】:
致谢
摘要
Abstract
第1章 引言
    1.1 课题研究背景及意义
    1.2 国内外研究现状
        1.2.1 驾驶培训
        1.2.2 元胞自动机
        1.2.3 强化学习
    1.3 本文研究内容及章节安排
第2章 驾驶培训过程分析
    2.1 引言
    2.2 驾校学员
    2.3 驾校教练
        2.3.1 真人教练
        2.3.2 机器人教练
    2.4 本章小结
第3章 驾校学员与车元胞自动机模型
    3.1 引言
    3.2 元胞自动机基本概念介绍
    3.3 基于元胞自动机的驾校学员与车模型
        3.3.1 元胞空间
        3.3.2 元胞状态
        3.3.3 元胞邻居
        3.3.4 元胞演化规则
    3.4 仿真结果与分析
        3.4.1 无教练教学的仿真
        3.4.2 有教练教学的仿真
        3.4.3 与真人练车数据对比
    3.5 本章小结
第4章 驾校教练强化学习决策模型
    4.1 引言
    4.2 强化学习算法
        4.2.1 基本概念
        4.2.2 策略探索
        4.2.3 常见算法
    4.3 基于强化学习的驾校教练决策模型
        4.3.1 驾校教练决策模型的马尔可夫决策过程分析
        4.3.2 基于策略迭代算法训练驾校教练决策模型
        4.3.3 基于Q-learning算法训练驾校教练决策模型
    4.4 驾校教练强化学习决策模型仿真实验与分析
        4.4.1 基于策略迭代算法训练的驾校教练决策模型仿真
        4.4.2 基于Q-learning算法训练的驾校教练决策模型仿真
        4.4.3 仿真结果分析
    4.5 本章小结
第5章 总结与展望
    5.1 总结
    5.2 展望
参考文献
研究成果



本文编号:3780836

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3780836.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户18ff3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com