服务Agent学习算法
发布时间:2022-12-18 10:55
面向服务的架构如Web服务技术,以及Agent技术已经被广泛地应用于各个IT领域。基于Web服务和Agent而提出的服务Agent技术,是对二者的有效结合。它既满足了Web服务的可重复性,低耦合性,又包含了Agent的持续性、自治性、交互性等特性。作为智能Agent的一个重要特性,它必须也能具有学习的能力,即通过过去的经验,面对新的任务能够自主而快速地找到一个较为优化的解。 本文首先提出了一个服务Agent的模型结构、语义架构以及服务Agent应用于Web服务组合的工作机制,然后给出了一种新的高效的服务Agent学习算法。该算法基于强化学习和团队马尔科夫博弈过程,并做出了相应的优化,使得在复杂环境下,尤其是多Agent环境下,该学习算法能够利用过去所学习到的知识,快速地达到收敛。该算法利用Q学习的理论基础,兼顾了多Agent之间博弈和协商,同时还能支持对知识模型的动态存储和更新,从而实现在多Agent条件下也能快速收敛。
【文章页数】:73 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 课题背景
1.2 研究现状
1.2.1 Agent 技术和 Web 服务
1.2.2 多 Agent 学习
1.3 目前存在的问题
1.4 本文研究内容
1.5 本文组织结构
第二章 相关技术
2.1 智能 AGENT 技术
2.1.1 Agent 的定义
2.1.2 多 Agent 学习
2.2 WEB 服务组合
2.2.1 Web 服务
2.2.2 Web 服务组合
2.3 本体
2.3.1 计算机学界关于本体的定义
2.3.2 本体的组成部分
2.3.3 本体语言
2.3.4 本体在本文中的结构形式
2.4 本章小结
第三章 服务 AGENT 的框架和模型
3.1 引言
3.2 服务 AGENT 框架
3.2.1 服务 Agent 模型结构
3.2.2 服务 Agent 系统的事件语义模型
3.2.3 服务 Agent 系统的目标语义模型
3.2.4 服务 Agent 系统的规划语义模型
3.2.5 服务 Agent 系统的规划语法模型
3.2.6 服务 Agent 的目标拆分
3.2.7 服务 Agent 系统的工作机制
3.3 本章小结
第四章 服务 AGENT 学习
4.1 引言
4.2 强化学习
4.2.1 马尔科夫决策过程
4.2.2 Q 学习
4.2.3 博弈论和纳什平衡
4.2.4 团队马尔科夫博弈
4.3 服务 AGENT 的学习机制
4.4 服务 AGENT 学习算法
4.5 实验结果及分析
4.5.1 实验环境
4.5.2 实验一:可行性实验以及与前向搜索算法的比较
4.5.3 具体案例
4.5.4 实验二:重复进行相同请求
4.5.5 实验三:重复进行相似的请求
4.5.6 实验四:处理不太相近的请求
4.5.7 实验五:在学习过程采取通信
4.6 本章小结
第五章 学习模型的存储
5.1 基本思路
5.2 实验结果及分析
5.2.1 实验一:处理不太相近的请求
5.2.2 实验二:存储模型数量与收敛时间的关系
第六章 总结及展望
6.1 论文主要工作
6.2 未来研究展望
致谢
参考文献
攻读硕士学位期间已发表或录用的论文及参与的项目
【参考文献】:
硕士论文
[1]服务Agent中的学习模型[D]. 王磊.上海交通大学 2009
本文编号:3721925
【文章页数】:73 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 课题背景
1.2 研究现状
1.2.1 Agent 技术和 Web 服务
1.2.2 多 Agent 学习
1.3 目前存在的问题
1.4 本文研究内容
1.5 本文组织结构
第二章 相关技术
2.1 智能 AGENT 技术
2.1.1 Agent 的定义
2.1.2 多 Agent 学习
2.2 WEB 服务组合
2.2.1 Web 服务
2.2.2 Web 服务组合
2.3 本体
2.3.1 计算机学界关于本体的定义
2.3.2 本体的组成部分
2.3.3 本体语言
2.3.4 本体在本文中的结构形式
2.4 本章小结
第三章 服务 AGENT 的框架和模型
3.1 引言
3.2 服务 AGENT 框架
3.2.1 服务 Agent 模型结构
3.2.2 服务 Agent 系统的事件语义模型
3.2.3 服务 Agent 系统的目标语义模型
3.2.4 服务 Agent 系统的规划语义模型
3.2.5 服务 Agent 系统的规划语法模型
3.2.6 服务 Agent 的目标拆分
3.2.7 服务 Agent 系统的工作机制
3.3 本章小结
第四章 服务 AGENT 学习
4.1 引言
4.2 强化学习
4.2.1 马尔科夫决策过程
4.2.2 Q 学习
4.2.3 博弈论和纳什平衡
4.2.4 团队马尔科夫博弈
4.3 服务 AGENT 的学习机制
4.4 服务 AGENT 学习算法
4.5 实验结果及分析
4.5.1 实验环境
4.5.2 实验一:可行性实验以及与前向搜索算法的比较
4.5.3 具体案例
4.5.4 实验二:重复进行相同请求
4.5.5 实验三:重复进行相似的请求
4.5.6 实验四:处理不太相近的请求
4.5.7 实验五:在学习过程采取通信
4.6 本章小结
第五章 学习模型的存储
5.1 基本思路
5.2 实验结果及分析
5.2.1 实验一:处理不太相近的请求
5.2.2 实验二:存储模型数量与收敛时间的关系
第六章 总结及展望
6.1 论文主要工作
6.2 未来研究展望
致谢
参考文献
攻读硕士学位期间已发表或录用的论文及参与的项目
【参考文献】:
硕士论文
[1]服务Agent中的学习模型[D]. 王磊.上海交通大学 2009
本文编号:3721925
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3721925.html