社科论文管理论文经济论文科技论文教育论文文艺论文医学论文外语论文硕博论文法律论文理工论文农业论文

当前位置：主页 > 科技论文 > 自动化论文 >

基于中介Agent的强化学习优化协商模型

发布时间：2018-01-18 03:35

本文关键词：基于中介Agent的强化学习优化协商模型　出处：《计算机科学》2017年01期 　论文类型：期刊论文

更多相关文章： 多Agent 强化学习 自适应学习 中介Agent

【摘要】：提出了一种基于强化学习的双边优化协商模型。引入了一个中介Agent。在强化学习策略中使用不同的参数产生提议,进而选出最好的参数进行协商。为了进一步提高协商的性能,还提出了基于中介Agent自适应的学习能力。仿真实验结果证明了所提协商方法的有效性,且该方法提高了协商的性能。
[Abstract]:A bilateral optimal negotiation model based on reinforcement learning is proposed. An agent agent is introduced. Different parameters are used to generate proposals in reinforcement learning strategies. Then the best parameters are selected for negotiation. In order to further improve the performance of the negotiation, an adaptive learning ability based on intermediary Agent is proposed. The simulation results show the effectiveness of the proposed negotiation method. The method improves the performance of negotiation.
【作者单位】：哈尔滨工程大学计算机科学与技术学院;
【基金】：国家自然科学基金项目(61472095,61272186) 智能教育与信息工程黑龙江省高校重点实验室资助
【分类号】：TP18
【正文快照】： 1引言协商是实现网上电子商务的重要手段,也是设计软件Agent的重要目标。如何提高Agent自主协商的能力一直是多Agent系统迫切需要解决的问题。已经存在很多关于自主Agent协商的研究方法。比如:张化祥等人[4]把强化学习运用到谈判过程中,引入了价格信念、时间信念和时间贴

【参考文献】

相关期刊论文前3条

1 孙天昊;陈飞;朱庆生;曹峰;;基于贝叶斯分类的增强学习协商策略[J];计算机科学;2011年09期

2 隋新;蔡国永;史磊;;基于Q-强化学习的多Agent协商策略及算法[J];计算机工程;2010年17期

3 张化祥,黄上腾;基于增强学习的代理谈判模型[J];计算机工程;2004年10期

【共引文献】

相关期刊论文前10条

1 张京敏;董红斌;;基于中介Agent的强化学习优化协商模型[J];计算机科学;2017年01期

2 檀何凤;刘政怡;;模式分类方法比较研究[J];计算机技术与发展;2015年02期

3 武玉英;李豪;蒋国瑞;;基于RBF神经网络和强化学习算法的供应链产销协同计划冲突消解研究[J];计算机应用研究;2015年05期

4 邓佳宾;廉佐政;王海珍;李耀成;韩江;;基于记忆模型学习的商务Agent协商设计[J];齐齐哈尔大学学报(自然科学版);2014年06期

5 张科;罗军;邓俊昆;;基于改进增强学习算法的双边多协议协商策略[J];计算机科学;2014年01期

6 游正陆;张刚;;基于贝叶斯的多维数据分类模型[J];改革与开放;2013年06期

7 姚淑君;张永亮;;广义Maxwell流体分数阶微分方程的数值解法[J];计算机工程与应用;2013年12期

8 蒋国瑞;胡应兰;;基于D-S证据理论的多Agent辩论谈判策略研究[J];计算机工程与应用;2013年12期

9 孙天昊;邓俊昆;陈飞;朱庆生;;基于增强学习协商策略的研究及优化[J];计算机工程与应用;2012年23期

10 张步良;;基于分类概率加权的朴素贝叶斯分类方法[J];重庆理工大学学报(自然科学);2012年07期

【二级参考文献】

相关期刊论文前5条

1 程昱;高济;古华茂;傅朝阳;;基于机器学习的自动协商决策模型[J];软件学报;2009年08期

2 李剑;牛少彰;;一种基于混合遗传算法的双边多议题协商[J];北京邮电大学学报;2009年02期

3 孙天昊;朱庆生;李双庆;周明强;;一种优化的基于增强学习协商策略[J];计算机工程与应用;2008年30期

4 程昱;高济;古华茂;傅朝阳;;基于对手态度学习的协商决策模型[J];浙江大学学报(工学版);2008年10期

5 张化祥,黄上腾;基于增强学习的代理谈判模型[J];计算机工程;2004年10期

【相似文献】

相关期刊论文前10条

1 张宇晴,佟振声,胡旦华,武雪芳;Agent技术在厂级监控信息系统中的应用[J];上海电力学院学报;2004年01期

2 林菁,孟波;群体决策支持系统中的管理和协调Agent及其应用研究[J];计算机应用与软件;2004年12期

3 罗朝春,涂光瑜,罗毅,盛戈f，

本文编号：1439311

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1439311.html

上一篇：自适应遗传算法在光伏发电系统中的应用
下一篇：基于冲压设备现状自动化改造的设计与研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

最近更新

教材专著

·主编|副主编|备案副主编|编委|参编

热点文章

Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明：资料由用户2ed7b***提供，本站仅收录摘要或目录，作者需要删除请E-mail邮箱bigeng88@qq.com