基于RBF神经网络和强化学习算法的供应链产销协同计划冲突消解研究
本文关键词:基于RBF神经网络和强化学习算法的供应链产销协同计划冲突消解研究
更多相关文章: 多agent 自学习 RBF神经网络 Q-强化学习 冲突消解
【摘要】:为提高传统协商自学习能力,利用多agent智能技术,建立基于黑板模型的协商框架,构建五元组协商模型,采取Q-强化学习算法,给出一种协商策略;使用RBF神经网络进一步优化协商策略,预测对手信息并调整让步幅度。通过算例验证该方法的可行性和有效性,通过与未改进的Q-强化学习算法对比,该方法可增强协商agent的自学习能力,缩短协商时间,提高冲突消解效率。
【作者单位】: 北京工业大学经济管理学院;
【关键词】: 多agent 自学习 RBF神经网络 Q-强化学习 冲突消解
【基金】:国家自然科学基金面上资助项目(71371018) 北京市社科规划项目(13JDJGB037)
【分类号】:F274;TP183
【正文快照】: 0引言为快速及时地满足动态变化的市场需求,供应链上的销售商往往与制造商提早建立合同,制定商品采购计划。目前计划的制定已从过去简单的物品买卖,转变为考虑全局利益的产销协同计划。然而由于供应链企业之间的目标往往是对立的,协同计划时不免针对价格、交货期等产生分歧,出
【参考文献】
中国期刊全文数据库 前1条
1 隋新;蔡国永;史磊;;基于Q-强化学习的多Agent协商策略及算法[J];计算机工程;2010年17期
【共引文献】
中国期刊全文数据库 前10条
1 张冬梅;刘强;;一种基于强化学习的传感器网络应用重构决策方法[J];北京交通大学学报;2010年03期
2 杨萍;毕义明;孙淑玲;;具有自主决策能力的机动单元智能体研究[J];兵工学报;2007年11期
3 赵晓华;李振龙;于泉;张杰;;基于切换模型的两交叉口信号灯Q学习协调控制[J];北京工业大学学报;2007年11期
4 孙若莹;李忱;赵刚;;基于强化学习的牛鞭效应对策模型[J];北京信息科技大学学报(自然科学版);2011年01期
5 王华;崔晓婷;刘向东;张宇河;;基于Q-学习的卫星姿态在线模糊神经网络控制[J];北京理工大学学报;2006年03期
6 毕金波,吴沧浦;有效的自适应λ即时差异学习(英文)[J];Journal of Beijing Institute of Technology(English Edition);1999年03期
7 童亮;陆际联;;Multi-Agent Reinforcement Learning Algorithm Based on Action Prediction[J];Journal of Beijing Institute of Technology(English Edition);2006年02期
8 吴洪岩;刘淑华;张嵛;;基于RBFNN的强化学习在机器人导航中的应用[J];吉林大学学报(信息科学版);2009年02期
9 杨银贤;Multi-agent reinforcement learning using modular neural network Q-learning algorithms[J];Journal of Chongqing University;2005年01期
10 杨东,殷苌茗,陈焕文,吴柏森;基于Q-学习的非线性控制[J];长沙电力学院学报(自然科学版);2003年01期
中国博士学位论文全文数据库 前10条
1 王作为;具有认知能力的智能机器人行为学习方法研究[D];哈尔滨工程大学;2010年
2 高延增;超小型水下机器人关键性能提升技术研究[D];华南理工大学;2010年
3 黄正行;临床过程分析与优化技术研究[D];浙江大学;2010年
4 林龙信;仿生水下机器人的增强学习控制方法研究[D];国防科学技术大学;2010年
5 冯奇;POMDP近似解法研究及在中医诊疗方案优化中的应用[D];北京交通大学;2011年
6 孙祥;大学生就业区域流向及引导策略研究[D];合肥工业大学;2011年
7 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
8 李s,
本文编号:649315
本文链接:https://www.wllwen.com/guanlilunwen/gongyinglianguanli/649315.html