基于深度强化学习的交通配时优化技术研究
发布时间:2021-07-01 08:01
因为我国经济的高速发展、人民收入水平随之的不断提高、全球城市化进程的不断加速,导致城市路网中车辆数量在一个较大的基数上持续增加。除此之外,在高品质生活下的日常活动中,很多方面也增加了城市路网中的车辆数量。城市路网中车辆数量的增加导致交通拥堵、交通疏通不及时、路口交通事故等现象逐渐严重化和普遍化,这些现象已经开始由大中型城市向中小型城市蔓延,同时也成为困扰世界各城市的主要社会问题,制约着经济和社会的发展,日益引起各国政府的高度重视。解决城市交通问题,首先解决交通拥堵问题,而交通信号配时是解决交通拥堵问题的重要手段。鉴于交通信号配时在城市交通系统中的关键作用,发展更加有效的城市交通信号配时策略才是解决城市交通拥堵问题的根本出路。在交通配时技术上,基于传统Q-Learning的交通信号配时策略是解决交通配时问题的重要手段,但它存在繁琐的Q值表建立和搜索、目标Q值容易被高估、无法长期记忆经验等问题,导致疏通环境交通拥堵的效果有限。然而,深度强化学习本身具有的深度网络以及引入的经验池、贪婪策略、DOUBLE DQN等方法技术,可以很好的解决传统Q-Learning在交通信号配时上存在的上诉问题。...
【文章来源】:沈阳理工大学辽宁省
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
无交通信号控制的交叉路口图
图 2.1 无交通信号控制的交叉路口图 图 2.2 无交通信号控制的交叉路口及交通信2.1 Intersection without traffic signal control Fig.2.2 Intersection without traffic signal contrtraffic light(2) 相位一个十字路口的交通信号灯的每一个不同情况都可以被叫做为一个相位。相位
图 2.3 策略模型控制路口模型图g.2.3Agent control intersection model diagforcement Learning)算法ng 算法在 20 世纪 60 年代被提出,
【参考文献】:
期刊论文
[1]携手共建主流价值的“丝绸之路”[J]. 汪晓东. 新闻战线. 2018(11)
[2]学术期刊与新媒体融合的关键与进路[J]. 张耀铭. 济南大学学报(社会科学版). 2018(03)
[3]基于车辆诱导的交通灯动态配时算法研究[J]. 文峰,赵佳文,赵云志. 沈阳理工大学学报. 2017(05)
[4]深度强化学习综述[J]. 刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进. 计算机学报. 2018(01)
[5]基于时序关联规则挖掘的交通拥堵预测研究[J]. 乔春凯,赵佳文. 科技创新与应用. 2017(01)
[6]基于强化学习的交通灯控制与车辆诱导算法[J]. 赵佳文,乔春凯. 科技创新与应用. 2017(01)
[7]深度强化学习综述:兼论计算机围棋的发展[J]. 赵冬斌,邵坤,朱圆恒,李栋,陈亚冉,王海涛,刘德荣,周彤,王成红. 控制理论与应用. 2016(06)
[8]基于强化学习的值迭代算法[J]. 崔军晓,朱蒙婷,王海燕,章鹏,王辉. 电脑知识与技术. 2014(31)
[9]智能体技术在城市交通信号控制系统中应用综述[J]. 杨文臣,张轮,施弈骋,张孟. 武汉理工大学学报(交通科学与工程版). 2014(04)
[10]基于聚类的多层交通网络优化[J]. 文峰,王星乔,于洋. 网络安全技术与应用. 2014(03)
硕士论文
[1]基于机器学习的虚拟机放置优化算法研究[D]. 杨帅.电子科技大学 2018
[2]基于DQN的机械臂控制策略的研究[D]. 郭宪.北京交通大学 2018
[3]基于车辆诱导的交通灯动态配时优化算法研究[D]. 赵佳文.沈阳理工大学 2017
[4]基于搜索熵的强化学习搜索策略分析及算法研究[D]. 陈竺宏.南京大学 2016
[5]基于改进蚁群算法的单校校车路径规划问题研究[D]. 丁然.辽宁师范大学 2016
[6]基于Sarsa学习算法的路径诱导算法研究[D]. 王星乔.沈阳理工大学 2016
[7]综合治理城市交通拥堵问题研究[D]. 许允.山东大学 2012
[8]城市交叉路口交通灯控制系统的设计研究[D]. 禹翔.长安大学 2011
[9]城市平面交叉口交通信号控制优化方法的研究[D]. 王伟平.山东科技大学 2004
本文编号:3258761
【文章来源】:沈阳理工大学辽宁省
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
无交通信号控制的交叉路口图
图 2.1 无交通信号控制的交叉路口图 图 2.2 无交通信号控制的交叉路口及交通信2.1 Intersection without traffic signal control Fig.2.2 Intersection without traffic signal contrtraffic light(2) 相位一个十字路口的交通信号灯的每一个不同情况都可以被叫做为一个相位。相位
图 2.3 策略模型控制路口模型图g.2.3Agent control intersection model diagforcement Learning)算法ng 算法在 20 世纪 60 年代被提出,
【参考文献】:
期刊论文
[1]携手共建主流价值的“丝绸之路”[J]. 汪晓东. 新闻战线. 2018(11)
[2]学术期刊与新媒体融合的关键与进路[J]. 张耀铭. 济南大学学报(社会科学版). 2018(03)
[3]基于车辆诱导的交通灯动态配时算法研究[J]. 文峰,赵佳文,赵云志. 沈阳理工大学学报. 2017(05)
[4]深度强化学习综述[J]. 刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进. 计算机学报. 2018(01)
[5]基于时序关联规则挖掘的交通拥堵预测研究[J]. 乔春凯,赵佳文. 科技创新与应用. 2017(01)
[6]基于强化学习的交通灯控制与车辆诱导算法[J]. 赵佳文,乔春凯. 科技创新与应用. 2017(01)
[7]深度强化学习综述:兼论计算机围棋的发展[J]. 赵冬斌,邵坤,朱圆恒,李栋,陈亚冉,王海涛,刘德荣,周彤,王成红. 控制理论与应用. 2016(06)
[8]基于强化学习的值迭代算法[J]. 崔军晓,朱蒙婷,王海燕,章鹏,王辉. 电脑知识与技术. 2014(31)
[9]智能体技术在城市交通信号控制系统中应用综述[J]. 杨文臣,张轮,施弈骋,张孟. 武汉理工大学学报(交通科学与工程版). 2014(04)
[10]基于聚类的多层交通网络优化[J]. 文峰,王星乔,于洋. 网络安全技术与应用. 2014(03)
硕士论文
[1]基于机器学习的虚拟机放置优化算法研究[D]. 杨帅.电子科技大学 2018
[2]基于DQN的机械臂控制策略的研究[D]. 郭宪.北京交通大学 2018
[3]基于车辆诱导的交通灯动态配时优化算法研究[D]. 赵佳文.沈阳理工大学 2017
[4]基于搜索熵的强化学习搜索策略分析及算法研究[D]. 陈竺宏.南京大学 2016
[5]基于改进蚁群算法的单校校车路径规划问题研究[D]. 丁然.辽宁师范大学 2016
[6]基于Sarsa学习算法的路径诱导算法研究[D]. 王星乔.沈阳理工大学 2016
[7]综合治理城市交通拥堵问题研究[D]. 许允.山东大学 2012
[8]城市交叉路口交通灯控制系统的设计研究[D]. 禹翔.长安大学 2011
[9]城市平面交叉口交通信号控制优化方法的研究[D]. 王伟平.山东科技大学 2004
本文编号:3258761
本文链接:https://www.wllwen.com/kejilunwen/daoluqiaoliang/3258761.html