多智能体情感决策学习方法及其在Flow智能交通中的应用
发布时间:2022-07-12 14:17
传统的计算机技术已经满足不了人工智能的发展需求,人们迫切需求更加智能的决策学习方法来解决各种复杂问题。分布式技术使得智能体(Agent)之间可以相互协作和学习,处理复杂决策问题的能力大大提升,已成为智能控制领域的研究热点。然而,多智能体(Multi-Agent)在完成需要频繁交互的决策任务时,普遍存在学习能力差、偏好评估和群体一致性较低等问题。近年来,情感计算以其可以量化展示群体智慧的涌现过程和决策一致性的收敛过程的优势,为解决这类复杂决策问题提供了一种新方法。目前针对情感计算的研究主要集中在情感识别和表达,鲜有探讨如何利用情感机制来进行更好的决策。此外,智能体的发展局限于逻辑推理能力的改进,很少涉及个体情感变化和群体情感交互。值得一提的是,面向大规模多智能体的系统建模问题时,情感机制的反馈会有助于更好地评估当前的环境并帮助智能体做出有利的决策,使得系统更加智能,决策更加高效。为此,本文提出了一种情感交互机制下的多智能体决策学习方法,构造了融合决策偏好的多层情感计算模型,给出了智能体情感变化和行为偏好之间的映射关系;然后,定义了一种新型的决策一致性指数和方案决策熵,以此体现决策的收敛过...
【文章页数】:82 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
符号说明
第一章 绪论
1.1 课题背景及意义
1.2 国内外研究现状及发展动态
1.2.1 情感计算与智能决策
1.2.2 多智能体强化学习
1.2.3 智能交通系统
1.3 论文内容简介
第二章 融合决策偏好的情感模型
2.1 引言
2.2 多层情感计算模型
2.3 决策偏好情感模型
2.4 群体一致性分析
2.4.1 衡量群体一致性方法
2.4.2 情感在所提方法中的重要性分析
2.5 本章小结
第三章 基于多智能体的情感交互
3.1 引言
3.2 多智能体决策系统
3.3 群体情感交互与决策流程
3.3.1 多智能体协商和交互系统
3.3.2 多智能体的情感交互式决策
3.4 实例分析
3.5 本章小结
第四章 基于情感驱动强化学习的智能交通系统
4.1 引言
4.2 Ray分布式计算框架
4.2.1 Ray分布式系统架构
4.2.2 可拓展的强化学习库Rllib
4.3 Flow智能交通系统
4.3.1 基于SUMO的交通路网与车辆建模
4.3.2 Flow混合自主交通强化学习框架
4.4 情感驱动的多智能体强化学习方法
4.4.1 情感与驾驶行为偏好
4.4.2 奖励函数设计
4.5 实例研究
4.5.1 仿真分析
4.5.2 方法对比
4.6 本章小结
第五章 结论与展望
5.1 结论
5.2 展望
参考文献
附录一: 传统多属性群决策问题决策流程
附录二: 智能交通实验相关参数设置
致谢
研究成果及发表的学术论文
作者和导师介绍
附件
【参考文献】:
期刊论文
[1]智能公路发展现状与关键技术[J]. 徐志刚,李金龙,赵祥模,李立,王忠仁,童星,田彬,侯俊,汪贵平,张骞. 中国公路学报. 2019(08)
[2]基于深度强化学习的车辆跟驰控制[J]. 朱冰,蒋渊德,赵健,陈虹,邓伟文. 中国公路学报. 2019(06)
[3]国际智能交通系统研发热点[J]. 王笑京,张纪升,宋向辉,汪林. 科技导报. 2019(06)
[4]情绪对驾驶行为影响研究[J]. 张殿业,程静,张艺. 中国安全科学学报. 2018(10)
[5]深度学习在无人驾驶汽车领域应用的研究进展[J]. 王科俊,赵彦东,邢向磊. 智能系统学报. 2018(01)
[6]面向未来智能社会的智能交通系统发展策略[J]. 武雯婧. 环球市场信息导报. 2017(01)
[7]城市智能交通系统技术发展现状及趋势[J]. 刘小明,何忠贺. 自动化博览. 2015(01)
[8]性格、心情和情感的多层情感建模方法[J]. 李海芳,何海鹏,陈俊杰. 计算机辅助设计与图形学学报. 2011(04)
[9]对中国大城市交通拥堵问题的认识[J]. 郭继孚,刘莹,余柳. 城市交通. 2011(02)
[10]完全智能控制 Google无人驾驶汽车路试[J]. 苏鑫. 道路交通与安全. 2010(04)
博士论文
[1]情感交互式决策方法及其在过程控制中的应用[D]. 宿翀.北京化工大学 2012
硕士论文
[1]基于深度强化学习的自动驾驶决策仿真[D]. 夏伟.中国科学院大学(中国科学院深圳先进技术研究院) 2017
[2]基于多智能体强化学习的足球机器人决策策略研究[D]. 丁明刚.合肥工业大学 2017
[3]智能公交信息的采集处理及应用研究[D]. 邓捷.重庆交通大学 2014
[4]脑电、眼动技术融合的情感测量方法研究[D]. 庄晓旭.东北大学 2013
[5]基于多智能体强化学习的决策支持系统的研究[D]. 李东华.南京航空航天大学 2009
本文编号:3659280
【文章页数】:82 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
符号说明
第一章 绪论
1.1 课题背景及意义
1.2 国内外研究现状及发展动态
1.2.1 情感计算与智能决策
1.2.2 多智能体强化学习
1.2.3 智能交通系统
1.3 论文内容简介
第二章 融合决策偏好的情感模型
2.1 引言
2.2 多层情感计算模型
2.3 决策偏好情感模型
2.4 群体一致性分析
2.4.1 衡量群体一致性方法
2.4.2 情感在所提方法中的重要性分析
2.5 本章小结
第三章 基于多智能体的情感交互
3.1 引言
3.2 多智能体决策系统
3.3 群体情感交互与决策流程
3.3.1 多智能体协商和交互系统
3.3.2 多智能体的情感交互式决策
3.4 实例分析
3.5 本章小结
第四章 基于情感驱动强化学习的智能交通系统
4.1 引言
4.2 Ray分布式计算框架
4.2.1 Ray分布式系统架构
4.2.2 可拓展的强化学习库Rllib
4.3 Flow智能交通系统
4.3.1 基于SUMO的交通路网与车辆建模
4.3.2 Flow混合自主交通强化学习框架
4.4 情感驱动的多智能体强化学习方法
4.4.1 情感与驾驶行为偏好
4.4.2 奖励函数设计
4.5 实例研究
4.5.1 仿真分析
4.5.2 方法对比
4.6 本章小结
第五章 结论与展望
5.1 结论
5.2 展望
参考文献
附录一: 传统多属性群决策问题决策流程
附录二: 智能交通实验相关参数设置
致谢
研究成果及发表的学术论文
作者和导师介绍
附件
【参考文献】:
期刊论文
[1]智能公路发展现状与关键技术[J]. 徐志刚,李金龙,赵祥模,李立,王忠仁,童星,田彬,侯俊,汪贵平,张骞. 中国公路学报. 2019(08)
[2]基于深度强化学习的车辆跟驰控制[J]. 朱冰,蒋渊德,赵健,陈虹,邓伟文. 中国公路学报. 2019(06)
[3]国际智能交通系统研发热点[J]. 王笑京,张纪升,宋向辉,汪林. 科技导报. 2019(06)
[4]情绪对驾驶行为影响研究[J]. 张殿业,程静,张艺. 中国安全科学学报. 2018(10)
[5]深度学习在无人驾驶汽车领域应用的研究进展[J]. 王科俊,赵彦东,邢向磊. 智能系统学报. 2018(01)
[6]面向未来智能社会的智能交通系统发展策略[J]. 武雯婧. 环球市场信息导报. 2017(01)
[7]城市智能交通系统技术发展现状及趋势[J]. 刘小明,何忠贺. 自动化博览. 2015(01)
[8]性格、心情和情感的多层情感建模方法[J]. 李海芳,何海鹏,陈俊杰. 计算机辅助设计与图形学学报. 2011(04)
[9]对中国大城市交通拥堵问题的认识[J]. 郭继孚,刘莹,余柳. 城市交通. 2011(02)
[10]完全智能控制 Google无人驾驶汽车路试[J]. 苏鑫. 道路交通与安全. 2010(04)
博士论文
[1]情感交互式决策方法及其在过程控制中的应用[D]. 宿翀.北京化工大学 2012
硕士论文
[1]基于深度强化学习的自动驾驶决策仿真[D]. 夏伟.中国科学院大学(中国科学院深圳先进技术研究院) 2017
[2]基于多智能体强化学习的足球机器人决策策略研究[D]. 丁明刚.合肥工业大学 2017
[3]智能公交信息的采集处理及应用研究[D]. 邓捷.重庆交通大学 2014
[4]脑电、眼动技术融合的情感测量方法研究[D]. 庄晓旭.东北大学 2013
[5]基于多智能体强化学习的决策支持系统的研究[D]. 李东华.南京航空航天大学 2009
本文编号:3659280
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3659280.html
最近更新
教材专著