当前位置:主页 > 科技论文 > 路桥论文 >

基于强化学习的汇流瓶颈区可变限速策略研究

发布时间:2017-08-20 20:25

  本文关键词:基于强化学习的汇流瓶颈区可变限速策略研究


  更多相关文章: 智能交通 可变限速 强化学习 高速公路汇流瓶颈区 Q学习算法


【摘要】:为提高高速公路汇流瓶颈区的通行效率,本文结合强化学习无需建立模型,具有智能学习的特点,对瓶颈区的可变限速策略进行了优化,首次提出了基于Q学习算法的可变限速控制策略.策略以最大化系统总流出车辆数为目标,通过遍历交通流状态集合,尝试不同限速值序列进行自适应学习.以真实路段交通流数据搭建了元胞传输模型仿真平台,通过将其与无控制和基于反馈控制的可变限速策略进行对比,对Q学习策略的控制效果进行评价.通行时间的降低和交通参数的变化表明,强化学习控制策略在提高汇流瓶颈区通行效率和改善交通流运行状况方面具有优越性.
【作者单位】: 嘉兴学院;东南大学;加州大学;
【关键词】智能交通 可变限速 强化学习 高速公路汇流瓶颈区 Q学习算法
【基金】:国家自然科学基金资助项目(51322810)
【分类号】:U491
【正文快照】: 1引言在高速公路系统中,匝道与主线连接路段是一个明显的交通瓶颈[1].可变限速(Variable SpeedLimits,VSL),作为一种有效缓解交通拥堵、提高通行效率的技术手段,已被广泛应用于高速公路入口匝道处.其核心思想为通过调节瓶颈区上游主线交通需求,将拥堵期进入高速公路瓶颈区的车

【共引文献】

中国期刊全文数据库 前10条

1 张冬梅;刘强;;一种基于强化学习的传感器网络应用重构决策方法[J];北京交通大学学报;2010年03期

2 杨萍;毕义明;孙淑玲;;具有自主决策能力的机动单元智能体研究[J];兵工学报;2007年11期

3 赵晓华;李振龙;于泉;张杰;;基于切换模型的两交叉口信号灯Q学习协调控制[J];北京工业大学学报;2007年11期

4 孙若莹;李忱;赵刚;;基于强化学习的牛鞭效应对策模型[J];北京信息科技大学学报(自然科学版);2011年01期

5 王华;崔晓婷;刘向东;张宇河;;基于Q-学习的卫星姿态在线模糊神经网络控制[J];北京理工大学学报;2006年03期

6 毕金波,吴沧浦;有效的自适应λ即时差异学习(英文)[J];Journal of Beijing Institute of Technology(English Edition);1999年03期

7 童亮;陆际联;;Multi-Agent Reinforcement Learning Algorithm Based on Action Prediction[J];Journal of Beijing Institute of Technology(English Edition);2006年02期

8 吴洪岩;刘淑华;张嵛;;基于RBFNN的强化学习在机器人导航中的应用[J];吉林大学学报(信息科学版);2009年02期

9 杨银贤;Multi-agent reinforcement learning using modular neural network Q-learning algorithms[J];Journal of Chongqing University;2005年01期

10 杨东,殷苌茗,陈焕文,吴柏森;基于Q-学习的非线性控制[J];长沙电力学院学报(自然科学版);2003年01期

中国重要会议论文全文数据库 前10条

1 毛剑琳;向凤红;冯丽辉;;一种改进的IEEE802.15.4自适应实时带宽分配策略[A];第二十七届中国控制会议论文集[C];2008年

2 马丽;刘惟一;;多个交通路口调度博弈模型及其均衡求解的增强学习算法[A];第二十七届中国控制会议论文集[C];2008年

3 ;Complexity Analysis of Quantum Reinforcement Learning[A];第二十九届中国控制会议论文集[C];2010年

4 朴松昊;洪炳熔;褚海涛;;基于BDI的多Agent协作模型研究[A];2003中国控制与决策学术年会论文集[C];2003年

5 刘长有;孙光余;;一种应用Elman型回归网络的Q-学习[A];2004中国控制与决策学术年会论文集[C];2004年

6 邹亮;徐建闽;;基于Q-learning的电子地图动态最短路径求解方法[A];2005中国控制与决策学术年会论文集(下)[C];2005年

7 ;Hybrid Q-learning Algorithm About Cooperation in MAS[A];2009中国控制与决策会议论文集(3)[C];2009年

8 ;An Adaptive Inventory Control for a Supply Chain[A];2009中国控制与决策会议论文集(3)[C];2009年

9 谢志华;郑应平;;基于再励学习的排队系统优化控制[A];1995年中国控制会议论文集(下)[C];1995年

10 Meng Joo Er;;Modeling and Fuzzy Q-Learning Control of Biped Walking[A];第二十四届中国控制会议论文集(上册)[C];2005年

中国硕士学位论文全文数据库 前10条

1 李志强;Q学习在单路口交通信号控制中的应用研究[D];长沙理工大学;2010年

2 姜新丽;基于强化学习的多机器人协作控制方法研究[D];沈阳理工大学;2010年

3 乐天助;认知网络路由技术研究[D];西安电子科技大学;2011年

4 张小刚;面向社区服务的联机分析系统研究与实现[D];西安电子科技大学;2009年

5 孙亚光;基于蚁群算法的无线传感器网络路由协议的研究[D];北京交通大学;2011年

6 肖文;基于QoS的可信Web服务组合及其相关问题研究[D];西南大学;2011年

7 姚艳军;认知无线网络中动态频谱共享的研究[D];北京邮电大学;2011年

8 柴雪霞;基于强化学习的Web服务组合优化研究[D];合肥工业大学;2011年

9 任玲;无线传感器网络能量高效的传输策略研究[D];合肥工业大学;2011年

10 郭一明;基于强化学习的劣化系统维修策略研究[D];合肥工业大学;2011年

【相似文献】

中国期刊全文数据库 前10条

1 姜志宏,王妍哲,郑文;在《电工技术》课程中开展研究性学习的思考与实践[J];长春工程学院学报(社会科学版);2003年03期

2 张仁兴;学习型组织的教育培训[J];航天工业管理;2004年05期

3 王瑞;;如何做一名学习型企业的干部[J];中国电力教育;2007年04期

4 强桂;汤俊;;网络环境下研究性学习及其策略分析[J];中国电力教育;2010年24期

5 王凤\,

本文编号:708687


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/daoluqiaoliang/708687.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2e551***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com