基于深度强化学习的交通灯配时优化技术的研究
发布时间:2024-03-20 22:49
随着我国城市化建设的不断深入,大量人员和车辆涌入城市,城市交通变得异常拥堵。日益上升的拥堵情况给城市的经济发展和居民生活带来了严重的负面影响,同时也制约着我国城市化建设进程的发展。造成交通拥堵的因素有很多,如交通信号控制问题、交通路线诱导问题、汽车数量增长问题、交通基础设施不完善的问题等。本文针对交通信号控制问题,运用聚类算法结合深度强化学习实现自适应式的控制交通信号的决策,并重点解决在高饱和路网中潜在的拥堵问题。首先,因为交通路网中的交叉口之间存在关联性,所以为了避免因个别重要交叉口疏通不利而导致的拥挤情况扩散至整个路网的问题,本研究将全局的路网作为卷积神经网络的感受范围,并针对实际交通路网存在的路网规模大、结构不规则的问题,运用聚类算法将路网进行聚类处理,并建立多个互相关联的感受野。同时,考虑到深度学习在图像感知上的优秀表现,本研究通过卷积神经网络感知道路拓扑结构的空间特征,将规范化后的感受野作为输入,以便更好的感知路网状态。本研究将交叉口作为执行深度强化学习策略的智能体,运用深度强化学习模型预测各交叉口应采取的动作,交叉口通过不断地与路网环境进行交互试错,逐渐在交通数据中学习到有...
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
本文编号:3933424
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
图2.1交叉口示意图
沈阳理工大学硕士学位论文-10-当前信号时长g结束后,下一个信号时长g开始时,交叉口对相位的选择自适应的。图2.1交叉口示意图Fig.2.1Schematicdiagramofintersection(2)信号周期因为一个交通信号灯需要对交叉口周围入边车道分别设置行使权,所以将交....
图2.2强化学习模型
第2章相关理论简介-13-指quality,即动作的质量,智能体根据现状态s选择应该采取动作a的函数,函数Q的输入是一个状态-动作对as),(,返回值是该状态下执行该动作(以及所有后续动作)的预期回报asQ),(,其中是智能体采取的策略。在智能体开始探索环境之前,Q可以为任意值。....
图3.1感受野划分示意图
通路网状态的卷积神经网络模型的描述。3.1多感受野路网模型的研究因为像素具有自然的空间顺序,传统的卷积神经网络可的应用于图像中。本研究以此获得灵感,感受野也同样可以按照空间顺序进行移动来获取特征。但是路网中道路的状态不似图像具有自然顺序的空间位置信息,卷积神经网络在处理交通路网....
图3.2感受野确立图示
第3章交通路网感知策略研究-19-野N(hi),|N(hi)|=k,每个感受野是由多条车道组成的。算法3.2建立邻域算法Input:交叉口质心cmNh,感受野大小kOutput:节点hm的邻域N(hm)以hm为起点进行宽度优先搜索,获取集合Vi0WhilekhNm)(dopiV]....
本文编号:3933424
本文链接:https://www.wllwen.com/kejilunwen/daoluqiaoliang/3933424.html