基于强化学习的城市道路突发事件拥堵疏导决策方法研究
发布时间:2023-10-29 11:32
以交通事故为代表的道路突发事件是造成城市交通拥堵的重要因素之一。突发事件造成的交通拥堵因其偶然性和不可预测性,使得交通管理者很难提前采取应对措施缓解拥堵。因此,在事件发生后及时采取控制措施显得尤为重要。及时有效的控制措施能够降低交通拥堵的传播,加速拥堵的消散,减少交通事件的影响范围、时间和程度。研究城市道路拥堵疏导的决策方法,能够有效预防和缓解城市路网交通拥堵,提高城市交通智慧化管理水平。本文基于元胞自动机模型构建了城市路网动态交通流仿真模型,利用强化学习技术对突发事件下交通拥堵疏导决策进行了优化,并开发了相应的仿真平台,初步设计了突发事件拥堵疏导决策支持系统。首先,本文在考虑前车速度和安全距离交通流模型的基础上,对路段和交叉口的车辆更新规则进行了改进,构建了基于元胞自动机的城市路网动态交通流仿真模型,建立了包含基础性、特征性和综合性指标的路网交通运行状态评价指标体系,实现了城市交通系统运行状态的可视量化评价。其次,以路段、交叉口和车辆为智能体,以路段平均行程速度为状态,以车辆禁行等控制措施为动作,以拥堵改变程度、所需时间和通行车辆数量为奖惩依据,建立了城市路网交通流强化学习模型,采用...
【文章页数】:69 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
1 绪论
1.1 选题背景和意义
1.2 国内外研究现状
1.2.1 动态交通流建模与仿真
1.2.2 偶发性交通拥堵疏导决策方法
1.2.3 强化学习在交通中的应用
1.3 研究方案
1.3.1 研究目标
1.3.2 研究内容
1.3.3 研究方法
2 路网动态交通流仿真模型
2.1 引言
2.2 交通流模型对比
2.3 元胞自动机模型
2.3.1 元胞自动机定义
2.3.2 道路交通流中的元胞自动机模型
2.4 模型建立
2.4.1 多车道路段交通流模型
2.4.2 交叉口交通流模型
2.4.3 路段与交叉口衔接
2.5 路网交通运行状况评价
2.5.1 基础性指标
2.5.2 特征性指标
2.5.3 综合性指标
2.6 本章小结
3 突发事件下交通拥堵疏导决策模型
3.1 引言
3.2 强化学习的基本原理与算法
3.2.1 强化学习基本原理
3.2.2 强化学习相关算法
3.3 强化学习环境模型设计
3.3.1 路段Agent
3.3.2 交叉口Agent
3.3.3 车辆Agent
3.3.4 参数标定
3.4 强化学习模型构建
3.4.1 状态描述
3.4.2 动作集合
3.4.3 奖励设计
3.5 交通拥堵疏导决策方法仿真与分析
3.5.1 实验环境
3.5.2 实验过程
3.5.3 实验结果
3.6 本章小结
4 突发事件拥堵疏导决策支持系统设计
4.1 引言
4.2 拥堵疏导决策流程分析
4.2.1 传统拥堵疏导决策流程
4.2.2 突发事件拥堵疏导决策支持系统决策流程
4.3 决策支持系统功能模块
4.3.1 交通仿真模块
4.3.2 强化学习模块
4.3.3 拥堵疏导决策模块
4.4 决策支持系统界面设计
4.4.1 交通仿真模块
4.4.2 拥堵疏导决策模块
4.5 本章小结
5 结论与展望
5.1 研究结论
5.2 论文展望
参考文献
攻读学位期间取得的研究成果
致谢
本文编号:3857994
【文章页数】:69 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
1 绪论
1.1 选题背景和意义
1.2 国内外研究现状
1.2.1 动态交通流建模与仿真
1.2.2 偶发性交通拥堵疏导决策方法
1.2.3 强化学习在交通中的应用
1.3 研究方案
1.3.1 研究目标
1.3.2 研究内容
1.3.3 研究方法
2 路网动态交通流仿真模型
2.1 引言
2.2 交通流模型对比
2.3 元胞自动机模型
2.3.1 元胞自动机定义
2.3.2 道路交通流中的元胞自动机模型
2.4 模型建立
2.4.1 多车道路段交通流模型
2.4.2 交叉口交通流模型
2.4.3 路段与交叉口衔接
2.5 路网交通运行状况评价
2.5.1 基础性指标
2.5.2 特征性指标
2.5.3 综合性指标
2.6 本章小结
3 突发事件下交通拥堵疏导决策模型
3.1 引言
3.2 强化学习的基本原理与算法
3.2.1 强化学习基本原理
3.2.2 强化学习相关算法
3.3 强化学习环境模型设计
3.3.1 路段Agent
3.3.2 交叉口Agent
3.3.3 车辆Agent
3.3.4 参数标定
3.4 强化学习模型构建
3.4.1 状态描述
3.4.2 动作集合
3.4.3 奖励设计
3.5 交通拥堵疏导决策方法仿真与分析
3.5.1 实验环境
3.5.2 实验过程
3.5.3 实验结果
3.6 本章小结
4 突发事件拥堵疏导决策支持系统设计
4.1 引言
4.2 拥堵疏导决策流程分析
4.2.1 传统拥堵疏导决策流程
4.2.2 突发事件拥堵疏导决策支持系统决策流程
4.3 决策支持系统功能模块
4.3.1 交通仿真模块
4.3.2 强化学习模块
4.3.3 拥堵疏导决策模块
4.4 决策支持系统界面设计
4.4.1 交通仿真模块
4.4.2 拥堵疏导决策模块
4.5 本章小结
5 结论与展望
5.1 研究结论
5.2 论文展望
参考文献
攻读学位期间取得的研究成果
致谢
本文编号:3857994
本文链接:https://www.wllwen.com/kejilunwen/daoluqiaoliang/3857994.html