基于深度强化学习的多智能体城市道路交叉口交通流优化控制研究
【图文】:
强化学习基本原理
图 2-3 MDP 示例图状态,状态集表示为S { , , , ,, },动作 },红色标注当前状态转移到下一个状态的立即回报。的某一回合中,当给定初始状态和策略 时,我们定义
【学位授予单位】:福建工程学院
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:U491.54
【参考文献】
相关期刊论文 前10条
1 陆化普;孙智源;屈闻聪;;大数据及其在城市智能交通系统中的应用综述[J];交通运输系统工程与信息;2015年05期
2 闫飞;田福礼;史忠科;;城市区域交通信号迭代学习控制策略[J];控制与决策;2015年08期
3 张邻;吴伟明;黄选伟;;基于动态信号配时的非线性规划模型[J];公路交通科技;2014年08期
4 龙琼;胡列格;张谨帆;周昭明;彭烁;;考虑交通管理策略的交叉口信号控制多目标优化[J];中南大学学报(自然科学版);2014年07期
5 朱铭琳;陈阳舟;;基于博弈的交叉口交通信号配时系统设计[J];计算机仿真;2013年07期
6 首艳芳;徐建闽;;基于群体动力学的协调控制子区划分[J];华南理工大学学报(自然科学版);2013年04期
7 聂建强;徐大林;;基于模糊Q学习的分布式自适应交通信号控制[J];计算机技术与发展;2013年03期
8 李建明;余春艳;;演化博弈下单点信号灯配时优化研究[J];交通运输系统工程与信息;2012年04期
9 赵晓华;李振龙;于泉;荣建;;基于Q学习算法的两交叉口信号灯博弈协调控制[J];系统仿真学报;2007年18期
10 杜荣华;吴泉源;;城市区域交通协调控制中的多Agent博弈研究[J];计算机工程与科学;2007年04期
相关硕士学位论文 前5条
1 伦立宝;基于强化学习的城市交通信号控制方法研究[D];西安电子科技大学;2013年
2 韦钦平;基于Q学习的多路口交通信号协调控制研究[D];长沙理工大学;2012年
3 王恺;实时反馈自适应信号控制系统研究[D];大连理工大学;2011年
4 高丽颖;基于Agent的城市交通信号控制方法研究[D];北京工业大学;2008年
5 王伟平;城市平面交叉口交通信号控制优化方法的研究[D];山东科技大学;2004年
本文编号:2639057
本文链接:https://www.wllwen.com/kejilunwen/daoluqiaoliang/2639057.html