基于应用需求的智能交通控制优化实现
本文选题:强化学习 切入点:智能交通控制系统 出处:《西安电子科技大学》2014年硕士论文
【摘要】:随着城市整体发展速度的不断加快,日趋紧张的交通问题给人们带来了巨大的效率,能源和生命上的损失。为了有效得改变现状,智能交通系统作为主要的解决方案开始受到各界关注,从而迅速发展起来。其中基于强化学习思想的交通信号灯智能控制算法已经成为缓解交通拥堵的主要手段之一,原因在于它对于动态多变的交通网络环境具有较强的适应性。本文从智能交通控制各个角度出发,对基于强化学习的控制算法实现了优化。在原始控制方案的基础上,给出了新型的交叉口协作方案,为交通控制提供了新的思路。相邻交叉口之间的协作关系并不是简单的信息交互,而是借助博弈论的思想寻找二者之间的纳什均衡点,进一步提高合作的有效性。在这种马尔科夫博弈论控制方案下,交叉口控制器在路网的动态运行过程中并不只是选择局部最优动作,而是通过合作机制选择更有利于全局的控制方案。通过大量的实验证明,该控制方案在控制效果上要优于基于协作图的Maxplus控制方法。从交通趋势性分析的角度,给出了结合预测分析和车道模型的智能控制方案。在路网中根据每个车道的具体历史交通流量值,为其建立相应的ARIMA预测模型,并利用该模型进行未来流量的预测。以预测数据为基础,利用车道的动态流量结构模型,分析其交通容量的变化趋势,再完成对整个网络的智能控制。由于该方法既把握了交通流量的趋势性,又考虑网络本身的动态相关性,要更优于原始的TC1控制方法。考虑到智能控制算法在现实应用中的局限性,提出了在POMDP条件背景下的优化控制方案。在当前的强化学习控制中,假设交叉口控制器对于与其相关的车道上的车辆信息具有完全的访问权,因而算法适用于完全可观察背景。在实际路网中,由于传感器本身的限制以及外在物理条件的影响,交叉口所获取的信息实际上是不完整的,因而为了实现控制方案在现实交通中的应用,需要研究算法在部分可观察条件下的实现方案。正是基于这一点,对基于POMDP的强化学习控制进行了研究。在车辆信任状态的基础上给出了如何获取车道信任状态的新方案,并以此为基础,利用所有信任状态实现优化控制方案。
[Abstract]:With the rapid development of the city as a whole, the increasingly tense traffic problems have brought great efficiency, energy loss and loss of life. In order to effectively change the status quo, As the main solution, Intelligent Transportation system (its) has been paid more and more attention and developed rapidly. Among them, the intelligent control algorithm of traffic signal light based on reinforcement learning has become one of the main methods to alleviate traffic congestion. The reason is that it has strong adaptability to the dynamic and changeable traffic network environment. This paper optimizes the control algorithm based on reinforcement learning from all aspects of intelligent traffic control. A new scheme of intersection cooperation is presented, which provides a new way for traffic control. The cooperative relationship between adjacent intersections is not a simple information exchange, but to find the Nash equilibrium point between them with the help of game theory. Further improve the effectiveness of cooperation. In this Markov game theory control scheme, the intersection controller in the dynamic operation of the road network not only select the local optimal action, A large number of experiments show that the control scheme is better than the Maxplus control method based on cooperative graph. From the point of view of traffic trend analysis, it is proved that the control scheme is better than the Maxplus control method based on cooperative graph. An intelligent control scheme based on predictive analysis and lane model is given. According to the specific historical traffic flow value of each lane in the road network, the corresponding ARIMA prediction model is established for each lane. Based on the prediction data and the dynamic flow structure model of the driveway, the change trend of traffic capacity is analyzed. The method not only grasps the trend of traffic flow, but also considers the dynamic correlation of the network itself. Considering the limitation of intelligent control algorithm in practical application, an optimal control scheme under the background of POMDP condition is proposed. It is assumed that the intersection controller has full access to the vehicle information in the lane associated with it, so the algorithm is suitable for the fully observable background. In the actual road network, due to the limitations of the sensor itself and the influence of external physical conditions, In order to realize the application of the control scheme in real traffic, it is necessary to study the implementation of the algorithm under partially observable conditions. In this paper, the reinforcement learning control based on POMDP is studied. Based on the trust state of vehicle, a new scheme of obtaining lane trust state is presented, and based on this, the optimal control scheme is realized by using all trust states.
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:U495;TP18
【相似文献】
相关期刊论文 前10条
1 ;合肥市测绘设计研究院助推合肥市智能交通控制系统建设[J];城市勘测;2008年02期
2 安新;;新一代智能交通控制系统技术课题列入国家“863计划”[J];道路交通管理;2007年03期
3 王学青;史树强;;一种全新的智能交通控制方法[J];机电工程技术;2008年03期
4 朱鸣;潘汉中;树爱兵;徐斌;;智能交通控制系统效益评价探讨[J];中国交通信息产业;2008年05期
5 周力;李炜;;我国智能交通控制系统的发展及展望[J];自动化与仪器仪表;2009年02期
6 施吉方;李庆风;徐婉萍;;一种自适应智能交通控制终端的设计[J];微计算机信息;2009年29期
7 欧阳红静;;物联网与智能交通控制系统[J];科技资讯;2013年20期
8 刘智勇,吴今培,万百五;高速公路智能交通控制系统的建模及多层描述[J];公路交通科技;1998年01期
9 鹿玲杰;申徐洲;;AGENT技术在智能交通控制中的应用[J];交通与计算机;2006年01期
10 马延敏;陈志辉;罗扬兴;;武汉市智能交通控制中心系统集成研究[J];地理空间信息;2008年04期
相关会议论文 前4条
1 于泉;刘金广;;中小城市智能交通控制平台设计方案研究[A];第二届中国智能交通年会论文集[C];2006年
2 程志远;;智能交通控制中心硬件平台设计方案[A];天津市电视技术研究会2010年年会论文集[C];2010年
3 胡和智;刘军芳;庞晶;苏双臣;;基于物联网技术的京津冀城市集群智能交通控制系统的设计[A];京津冀城市集群发展与廊坊市域经济定位的延伸研究——第五届环渤海·环首都·京津冀协同发展论坛学术会议论文集[C];2011年
4 张贤;;一种多功能交通控制器的设计与应用[A];天津市电视技术研究会2009年年会论文集(1)[C];2009年
相关重要报纸文章 前8条
1 记者 张静邋实习生 杨璇;我市智能交通控制系统暨应急指挥中心正式启用[N];新乡日报;2008年
2 通讯员 蓝霁霞;智能交通控制系统在新乡启用[N];河南日报;2008年
3 黄夏;为交通畅通安全提供技术保障[N];人民公安报;2007年
4 本报评论员;以现代科技实现兰州科学发展[N];兰州日报;2011年
5 记者 孙威;“绿灯亮了——走吧”[N];河北经济日报;2007年
6 文洋 张洋 李强;历史文化名城的文明之师[N];承德日报;2006年
7 记者 姚启慧 通讯员 吴培勇;高科技治疗武汉拥堵病[N];湖北日报;2013年
8 本报记者 朱丽宁;指尖上的对话 掌心里的服务[N];人民公安报·交通安全周刊;2013年
相关博士学位论文 前1条
1 孙晋文;基于Agent的智能交通控制策略与可视化动态仿真研究[D];中国农业大学;2001年
相关硕士学位论文 前10条
1 陆亚男;基于应用需求的智能交通控制优化实现[D];西安电子科技大学;2014年
2 高雨;多相位智能交通控制器研究[D];浙江大学;2006年
3 李广印;智能交通控制系统平台设计与实现[D];吉林大学;2009年
4 金稳;多相位智能交通控制器的研究[D];浙江大学;2007年
5 李炜;基于ARM的城市多路口智能交通控制器设计[D];安徽工程大学;2010年
6 王艳华;基于多智能体MAS的智能交通控制系统的研究[D];长沙理工大学;2007年
7 连剑;基于Agent的智能交通控制仿真系统研究[D];山东科技大学;2007年
8 赵亚妮;基于PLC的智能交通控制系统的设计与实现[D];长安大学;2007年
9 张涛;基于RFID技术的智能交通控制器设计[D];安徽理工大学;2014年
10 申徐洲;基于Agent的智能交通控制的研究[D];大庆石油学院;2006年
,本文编号:1663995
本文链接:https://www.wllwen.com/kejilunwen/jiaotonggongchenglunwen/1663995.html