基于演化博弈的多智能体任务转发的研究
发布时间:2017-10-19 23:34
本文关键词:基于演化博弈的多智能体任务转发的研究
【摘要】:随着多智能体在任务分配方面的发展,如何优化任务分配的问题越来越受到研究者的关注。由于智能体通常执行任务时所处的通信环境相对恶劣,因而智能体之间是否能够有效协作,完成任务,该问题至关重要。 针对智能体转发任务决策影响其他智能体获取任务的问题,通常在多智能体的群体中每个智能体都尽可能多地转发自己获取的任务,以达到资源共享的目的。但是考虑到智能体在转发任务时,由于受到通讯环境的限制,发送的任务一直丢失,,未能准确地将任务送达到其邻近的智能体,将导致智能体不再愿意继续消耗能量转发其他智能体的任务。 本文以演化博弈的动力学为基础进行分析,推导出使得多智能体系统转发任务演化稳定的条件以及一段时间内各智能体的收益总和最大的条件,并通过实验验证了推导的结论,得出了激励制度和通讯等干扰因素对演化稳定状态以及多智能体收益的影响。 文章主要研究内容如下: 1.考虑智能体受到通讯环境的影响,结合博弈论对于智能体是否转发其他智能体的矛盾点进行了阐述; 2.构建智能体任务转发演化模型,使得演化过程中体现出智能体个体策略的调整,最终达到转发任务或者不转发任务的稳定状态,并得出激励制度和通讯等干扰因素对演化稳定状态以及多智能体收益的结论; 3.通过仿真实验得出结论,并分析实验结果。
【关键词】:多智能体 演化博弈 转发任务 奖励机制
【学位授予单位】:东华大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP18;O225
【目录】:
- 摘要5-6
- ABSTRACT6-10
- 1 绪论10-16
- 1.1 课题研究背景10-11
- 1.2 国内外研究现状11-13
- 1.3 课题意义13
- 1.4 课题目标13-14
- 1.5 论文组织结构14-16
- 2 智能体与演化博弈16-34
- 2.1 智能体16-19
- 2.1.1 智能体的概念16-17
- 2.1.2 多智能体的体系结构17
- 2.1.3 多智能体的通信17-18
- 2.1.4 多智能体的协作与协调18
- 2.1.5 多智能体技术18-19
- 2.1.6 多智能体的技术应用领域19
- 2.2 博弈论19-30
- 2.2.1 博弈论的基本要素20-21
- 2.2.2 纳什均衡21-23
- 2.2.3 博弈的类型23-25
- 2.2.4 博弈论研究的问题25
- 2.2.5 演化博弈论25-26
- 2.2.6 演化博弈的理论起源26
- 2.2.7 演化博弈的基本特征26-27
- 2.2.8 演化博弈的建立27-28
- 2.2.9 演化博弈的应用优势28-30
- 2.3 复制子动态30-32
- 2.3.1 复制子动态的概述30
- 2.3.2 一般的两人对称博弈复制子动态30-31
- 2.3.3 一般两人对称博弈复制子动态和 ESS31-32
- 2.3.4 标准的 N 总体复制子动态32
- 2.4 本章总结32-34
- 3 基于演化博弈的多智能体任务转发模型34-45
- 3.1 博弈模型34-37
- 3.1.1 智能体双方都选择转发策略35
- 3.1.2 智能体双方只有一方选择转发策略35-36
- 3.1.3 智能体双方都选择不转发策略36-37
- 3.2 反思机制37-38
- 3.3 演化动力学分析38-40
- 3.4 转发模型分析40-42
- 3.5 智能体达到稳定状态时的总收益分析42
- 3.6 智能体整个博弈过程中的总收益分析42-43
- 3.7 引入反思机制前后的对比43-44
- 3.8 本章总结44-45
- 4 实验验证45-54
- 4.1 智能体趋向于任务转发与趋向于不转发的条件验证45-50
- 4.2 智能体趋向于任务转发时收益最大的条件的验证50-51
- 4.3 基于反思机制的复制子动态与随机博弈收益对比的验证51-52
- 4.4 基于反思机制的复制子动态与复制子动态收敛速度对比的验证52-54
- 5 总结与展望54-56
- 5.1 工作总结54
- 5.2 展望54-56
- 参考文献56-60
- 攻读硕士学位期间发表的学术论文60-61
- 致谢61
【参考文献】
中国期刊全文数据库 前9条
1 王占杰;刘晶晶;;基于多Agent的分布式多目标任务调度机制研究[J];大连理工大学学报;2011年05期
2 耿霆;胡建武;张志良;单小军;;基于复杂网络与Agent的作战系统建模[J];舰船电子工程;2010年09期
3 方齐云;郭炳发;;演化博弈理论发展动态[J];经济学动态;2005年02期
4 刘金琨,尔联洁;多智能体技术应用综述[J];控制与决策;2001年02期
5 沈士根;马绚;蒋华;李玮;曹奇英;;基于演化博弈论的WSNs信任决策模型与动力学分析[J];控制与决策;2012年08期
6 王蕊;周光辉;;基于非合作博弈批量调度优化[J];制造业自动化;2013年14期
7 肖正;张世永;;基于后悔值的多Agent冲突博弈强化学习模型[J];软件学报;2008年11期
8 徐杨;李响;常宏;王月星;;复杂网络特性对大规模多智能体协同控制的影响[J];软件学报;2012年11期
9 刘跃峰;张安;;有人机/无人机编队协同任务分配方法[J];系统工程与电子技术;2010年03期
中国博士学位论文全文数据库 前1条
1 金元日;不确定通信下多智能体系统的一致性[D];浙江大学;2013年
本文编号:1064001
本文链接:https://www.wllwen.com/kejilunwen/yysx/1064001.html