基于强化学习的电梯群控调度技术研究
发布时间:2017-05-09 13:04
本文关键词:基于强化学习的电梯群控调度技术研究,由笔耕文化传播整理发布。
【摘要】:由于电梯群组系统在实际的生活中有着重要的意义,电梯群组的调度问题得到广泛关注。乘客对电梯服务质量的要求也越来越高,单台电梯已不能很好很快的满足乘客的需求。缩短乘客的候梯时间、乘梯时间,同时减少电梯占有土地面积已成为人们对电梯群的基本要求,此时电梯群控调度便引起了人们的注意。电梯群控系统,即采用优化的智能控制方法管理多个电梯群,以提高其运行效率和服务质量。 强化学习是属于人工智能领域的一部分。本文采用强化学习作为电梯群控系统中的调度方法,以马尔可夫决策过程为理论的背景,建立数学模型;以平均候梯时间、平均乘梯时间、平均停靠的次数作为评价的标准,采用随机行为选择策略和前馈神经网络分别解决强化学习在应用中所存在的探索问题和值函数的泛化问题,并将两者与Q学习的值迭代算法结合,共同构成基于强化学习的电梯群控系统。 首先,,本文对电梯群控问题进行了研究,其次,介绍了强化学习算法的基本原理及其数学模型,之后建立了基于强化学习算法的电梯群控调度模型。最后,通过现成的功能齐全的试验平台完成了仿真实验,验证了强化学习算法在电梯群控调度中的可用性与有效性。
【关键词】:电梯群组调度 强化学习 调度算法 马尔可夫决策过程
【学位授予单位】:哈尔滨理工大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TU857;TP18
【目录】:
- 摘要5-6
- Abstract6-10
- 第1章 绪论10-16
- 1.1 课题来源和意义10-11
- 1.2 国内外研究现状11-14
- 1.2.1 电梯群控系统的研究现状11-13
- 1.2.2 群控系统主要难点13
- 1.2.3 强化学习算法的研究现状13-14
- 1.3 课题的来源及研究内容14-16
- 1.3.1 课题来源14
- 1.3.2 课题的主要研究内容14-16
- 第2章 电梯群控调度问题研究16-22
- 2.1 群控系统性能评价方法16-17
- 2.2 电梯群控动态调度研究方法17-20
- 2.2.1 传统的调度方法17-18
- 2.2.2 智能调度方法18-20
- 2.3 基于强化学习的方法20-21
- 2.4 本章小结21-22
- 第3章 强化学习方法的研究22-30
- 3.1 强化学习的基本思想22-23
- 3.1.1 强化学习的基本概念22
- 3.1.2 强化学习的原理22-23
- 3.2 强化学习的基本模型23-26
- 3.2.1 强化学习的理论背景23-25
- 3.2.2 建立数学模型25-26
- 3.3 强化学习中的典型算法26-28
- 3.3.1 动态规划26-28
- 3.3.2 Q-learning 算法28
- 3.3.3 其他算法28
- 3.4 本章小结28-30
- 第4章 基于强化学习的电梯群控调度技术研究与设计30-38
- 4.1 电梯群控的调度问题30-33
- 4.1.1 电梯群控的调度目标30
- 4.1.2 电梯交通的模式30-31
- 4.1.3 电梯群组调度的问题模型31-33
- 4.2 基于强化学习的电梯群控调度33-35
- 4.2.1 值调度算法33-34
- 4.2.2 行为选择的探索性随机策略34
- 4.2.3 基于神经网络的泛化技术34-35
- 4.3 电梯群控系统的调度算法35-36
- 4.4 本章小结36-38
- 第5章 实验平台与调度结果分析38-45
- 5.1 电梯群组调度的仿真环境38-39
- 5.2 基于强化学习的电梯调度算法的运行环境39-41
- 5.3 电梯动态调度仿真实验与结果分析41-44
- 5.4 本章小结44-45
- 结论45-46
- 参考文献46-49
- 攻读硕士学位期间所发表的学术论文49-50
- 致谢50
【引证文献】
中国硕士学位论文全文数据库 前1条
1 杨博钦;基于Petri网的电梯群控系统[D];西华大学;2015年
本文关键词:基于强化学习的电梯群控调度技术研究,由笔耕文化传播整理发布。
本文编号:352528
本文链接:https://www.wllwen.com/jianzhugongchenglunwen/352528.html