基于深度强化学习的路径规划方法及应用
发布时间:2021-02-27 22:44
近些年,人群疏散仿真已经成为公共安全领域的研究热点。尤其是在人群分布集中的公共场所内,紧急情况发生时个人的犹豫不决和恐慌不定将导致行人发生推挤,踩踏他人等安全隐患。因此,合理规划逃生路径对疏散安全至关重要。为了保障逃生路线的合理性,需要人群进行疏散演练。传统的人群疏散演习费时费力,且难以规划好最佳疏散路径。越来越多的学者开始关注人群疏散仿真及其建模工作。计算机仿真技术利用推演的形式探究人群疏散中的路径规律,对建筑设计和应急管理提供理论指导,对防范公共事故,保障公共安全起到重大意义。因此,应用计算机仿真方法研究紧急情况下公共场所的人群疏散问题是十分必要的。对行人运动进行合理的路径规划避免破坏性行为发生,是人群疏散仿真研究的核心问题。针对目前大多数路径规划方法在实际应用时,常常面临复杂环境,存在效率低与计算复杂等问题,尤其是应用于人群疏散仿真时,忽略了行人之间的聚集与分组现象以及疏散过程中的运动细节,如行人的队列形成,出口选择等。因此,本文提出了一个基于深度强化学习的高效路径规划方法并应用于人群疏散仿真。首先提出了基于拥塞检测的多智能体强化学习模型,该模型充分考虑到现实生活中的“聚集-分组...
【文章来源】:山东师范大学山东省
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 深度强化学习方法
1.2.2 路径规划方法
1.2.3 人群疏散模型
1.3 人群疏散仿真中存在的问题
1.4 本文主要研究内容和创新点
1.5 论文组织结构
第二章 面向人群疏散仿真的路径规划研究现状
2.1 引言
2.2 基于群体智能路径规划方法
2.3 基于强化学习路径规划方法
2.4 本章小结
第三章 基于拥塞检测的多智能体强化学习模型
3.1 引言
3.2 现实场景下的人群聚集-分组现象
3.3 人群划分方法
3.4 引领者智能体的映射设计
3.5 强化学习基本原理
3.6 基于拥塞检测的强化学习元素定义
3.7 本章小结
第四章 基于深度强化学习的路径规划方法
4.1 引言
4.2 基于IMADDPG的上层全局路径规划
4.3 基于RVO的下层碰撞避免
4.4 实验与分析
4.4.1 不同深度强化学习算法的回报比较
4.4.2 不同深度强化学习算法的时间比较
4.4.3 不同人群疏散方法的疏散时间比较
4.4.4 拥塞检测区对疏散结果影响的比较
4.5 本章小结
第五章 仿真平台与仿真实验
5.1 引言
5.2 仿真平台功能设计
5.3 疏散仿真实验
5.4 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
攻读硕士学位期间的主要成果
致谢
【参考文献】:
期刊论文
[1]Guided Crowd Evacuation:Approaches and Challenges[J]. Min Zhou,Hairong Dong,Petros A.Ioannou,Yanbo Zhao,Fei-Yue Wang. IEEE/CAA Journal of Automatica Sinica. 2019(05)
[2]Cooperative Co-evolutionary Artificial Bee Colony Algorithm Based on Hierarchical Communication Model[J]. HU Chunyu,LIU Hong,ZHANG Peng. Chinese Journal of Electronics. 2016(03)
[3]移动机器人的实时路径规划研究与仿真[J]. 乔慧芬,潘广贞,元琴. 计算机仿真. 2015(01)
[4]基于切点优化人工势场法的三维避障规划[J]. 彭艳,国文青,刘梅,崔建祥,谢少荣. 系统仿真学报. 2014(08)
[5]基于社会力的行人交通微观仿真模型研究[J]. 王爱丽,董宝田,王泽胜. 系统仿真学报. 2014(03)
[6]空间密度场导向的人群仿真方法研究[J]. 郑利平,刘莉,王林,刘晓平. 系统仿真学报. 2014(03)
本文编号:3054908
【文章来源】:山东师范大学山东省
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 深度强化学习方法
1.2.2 路径规划方法
1.2.3 人群疏散模型
1.3 人群疏散仿真中存在的问题
1.4 本文主要研究内容和创新点
1.5 论文组织结构
第二章 面向人群疏散仿真的路径规划研究现状
2.1 引言
2.2 基于群体智能路径规划方法
2.3 基于强化学习路径规划方法
2.4 本章小结
第三章 基于拥塞检测的多智能体强化学习模型
3.1 引言
3.2 现实场景下的人群聚集-分组现象
3.3 人群划分方法
3.4 引领者智能体的映射设计
3.5 强化学习基本原理
3.6 基于拥塞检测的强化学习元素定义
3.7 本章小结
第四章 基于深度强化学习的路径规划方法
4.1 引言
4.2 基于IMADDPG的上层全局路径规划
4.3 基于RVO的下层碰撞避免
4.4 实验与分析
4.4.1 不同深度强化学习算法的回报比较
4.4.2 不同深度强化学习算法的时间比较
4.4.3 不同人群疏散方法的疏散时间比较
4.4.4 拥塞检测区对疏散结果影响的比较
4.5 本章小结
第五章 仿真平台与仿真实验
5.1 引言
5.2 仿真平台功能设计
5.3 疏散仿真实验
5.4 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
攻读硕士学位期间的主要成果
致谢
【参考文献】:
期刊论文
[1]Guided Crowd Evacuation:Approaches and Challenges[J]. Min Zhou,Hairong Dong,Petros A.Ioannou,Yanbo Zhao,Fei-Yue Wang. IEEE/CAA Journal of Automatica Sinica. 2019(05)
[2]Cooperative Co-evolutionary Artificial Bee Colony Algorithm Based on Hierarchical Communication Model[J]. HU Chunyu,LIU Hong,ZHANG Peng. Chinese Journal of Electronics. 2016(03)
[3]移动机器人的实时路径规划研究与仿真[J]. 乔慧芬,潘广贞,元琴. 计算机仿真. 2015(01)
[4]基于切点优化人工势场法的三维避障规划[J]. 彭艳,国文青,刘梅,崔建祥,谢少荣. 系统仿真学报. 2014(08)
[5]基于社会力的行人交通微观仿真模型研究[J]. 王爱丽,董宝田,王泽胜. 系统仿真学报. 2014(03)
[6]空间密度场导向的人群仿真方法研究[J]. 郑利平,刘莉,王林,刘晓平. 系统仿真学报. 2014(03)
本文编号:3054908
本文链接:https://www.wllwen.com/falvlunwen/fanzuizhian/3054908.html