基于中介Agent的强化学习优化协商模型
本文关键词:基于中介Agent的强化学习优化协商模型 出处:《计算机科学》2017年01期 论文类型:期刊论文
更多相关文章: 多Agent 强化学习 自适应学习 中介Agent
【摘要】:提出了一种基于强化学习的双边优化协商模型。引入了一个中介Agent。在强化学习策略中使用不同的参数产生提议,进而选出最好的参数进行协商。为了进一步提高协商的性能,还提出了基于中介Agent自适应的学习能力。仿真实验结果证明了所提协商方法的有效性,且该方法提高了协商的性能。
[Abstract]:A bilateral optimal negotiation model based on reinforcement learning is proposed. An agent agent is introduced. Different parameters are used to generate proposals in reinforcement learning strategies. Then the best parameters are selected for negotiation. In order to further improve the performance of the negotiation, an adaptive learning ability based on intermediary Agent is proposed. The simulation results show the effectiveness of the proposed negotiation method. The method improves the performance of negotiation.
【作者单位】: 哈尔滨工程大学计算机科学与技术学院;
【基金】:国家自然科学基金项目(61472095,61272186) 智能教育与信息工程黑龙江省高校重点实验室资助
【分类号】:TP18
【正文快照】: 1引言 协商是实现网上电子商务的重要手段,也是设计软件Agent的重要目标。如何提高Agent自主协商的能力一直是多Agent系统迫切需要解决的问题。 已经存在很多关于自主Agent协商的研究方法。比如:张化祥等人[4]把强化学习运用到谈判过程中,引入了价格信念、时间信念和时间贴
【参考文献】
相关期刊论文 前3条
1 孙天昊;陈飞;朱庆生;曹峰;;基于贝叶斯分类的增强学习协商策略[J];计算机科学;2011年09期
2 隋新;蔡国永;史磊;;基于Q-强化学习的多Agent协商策略及算法[J];计算机工程;2010年17期
3 张化祥,黄上腾;基于增强学习的代理谈判模型[J];计算机工程;2004年10期
【共引文献】
相关期刊论文 前10条
1 张京敏;董红斌;;基于中介Agent的强化学习优化协商模型[J];计算机科学;2017年01期
2 檀何凤;刘政怡;;模式分类方法比较研究[J];计算机技术与发展;2015年02期
3 武玉英;李豪;蒋国瑞;;基于RBF神经网络和强化学习算法的供应链产销协同计划冲突消解研究[J];计算机应用研究;2015年05期
4 邓佳宾;廉佐政;王海珍;李耀成;韩江;;基于记忆模型学习的商务Agent协商设计[J];齐齐哈尔大学学报(自然科学版);2014年06期
5 张科;罗军;邓俊昆;;基于改进增强学习算法的双边多协议协商策略[J];计算机科学;2014年01期
6 游正陆;张刚;;基于贝叶斯的多维数据分类模型[J];改革与开放;2013年06期
7 姚淑君;张永亮;;广义Maxwell流体分数阶微分方程的数值解法[J];计算机工程与应用;2013年12期
8 蒋国瑞;胡应兰;;基于D-S证据理论的多Agent辩论谈判策略研究[J];计算机工程与应用;2013年12期
9 孙天昊;邓俊昆;陈飞;朱庆生;;基于增强学习协商策略的研究及优化[J];计算机工程与应用;2012年23期
10 张步良;;基于分类概率加权的朴素贝叶斯分类方法[J];重庆理工大学学报(自然科学);2012年07期
【二级参考文献】
相关期刊论文 前5条
1 程昱;高济;古华茂;傅朝阳;;基于机器学习的自动协商决策模型[J];软件学报;2009年08期
2 李剑;牛少彰;;一种基于混合遗传算法的双边多议题协商[J];北京邮电大学学报;2009年02期
3 孙天昊;朱庆生;李双庆;周明强;;一种优化的基于增强学习协商策略[J];计算机工程与应用;2008年30期
4 程昱;高济;古华茂;傅朝阳;;基于对手态度学习的协商决策模型[J];浙江大学学报(工学版);2008年10期
5 张化祥,黄上腾;基于增强学习的代理谈判模型[J];计算机工程;2004年10期
【相似文献】
相关期刊论文 前10条
1 张宇晴,佟振声,胡旦华,武雪芳;Agent技术在厂级监控信息系统中的应用[J];上海电力学院学报;2004年01期
2 林菁,孟波;群体决策支持系统中的管理和协调Agent及其应用研究[J];计算机应用与软件;2004年12期
3 罗朝春,涂光瑜,罗毅,盛戈f,
本文编号:1439311
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1439311.html