智能协同算法研究及应用
发布时间:2023-05-21 18:51
近年来,随着智能化时代的来临,人工智能算法的应用逐渐成为各个领域中研究的热点技术。作为人工智能领域的重要内容之一,智能协同试图通过研究先进的智能算法,使得多智能体具有高效的协作能力。对智能协同算法的研究给人工智能、现代优化及机器学习等理论的发展带来了新的挑战,与此同时,这些理论和技术上新的发展又可以应用到智能协同系统中,这也是对其应用领域的进一步扩展和完善。智能协同的核心是多智能体通过有效的协同控制以达到整体效能最优。本文综合利用计算智能相关理论,对智能协同系统中的若干关键技术问题展开研究,研究智能协同中的碰撞避免、协同任务分配和协同路径规划等问题,为未来智能协同控制提供技术支持。无论从科学角度还是理论价值上来说,都具有极强的研究意义和实用价值。本文的主要研究内容包括以下四部分:(1)动态环境下碰撞避免。在传统强化学习的基础上,提出了一种改进强化学习算法并将其应用于动态环境下机器人实时碰撞避免问题中。并对其算法原理进行了分析。算法中将动态障碍物的运动方向加入到状态空间的定义中来消除Q值更新产生的歧义。为了增加最优解的多样性,在策略选择中,将?-贪心策略和“近目标”策略两种策略结合来为机...
【文章页数】:129 页
【学位级别】:博士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究工作背景与意义
1.2 国内外研究历史与现状
1.3 本文主要贡献与创新
1.4 论文结构安排
第二章 基于强化学习的智能体动态避障
2.1 强化学习
2.2 动态避障环境建模
2.2.1 状态空间
2.2.2 动作空间
2.3 基于改进Q学习的机器人避障
2.3.1 回报函数
2.3.1.1 回报函数多目标问题建模
2.3.1.2 基于NSGA-II算法的回报函数优化求解
2.3.2 Q值
2.3.3 选择策略
2.4 仿真实验与结果分析
2.4.1 不同场景避障仿真
2.4.2 改进强化学习实验对比
2.4.3 回报函数优化前后对比
2.5 本章小结
第三章 基于深度强化学习的多智能体防守对抗
3.1 深度强化学习和多智能体防守对抗
3.1.1 多智能体防守对抗问题
3.1.2 深度强化学习相关算法
3.2 多智能体防守对抗环境建模
3.2.1 状态空间
3.2.2 动作空间
3.2.3 回报函数
3.2.3.1 攻击智能体回报函数
3.2.3.2 防守智能体回报函数
3.3 智能体模型和学习方法
3.3.1 基于单智能体的模型和学习方法
3.3.1.1 网络结构
3.3.1.2 学习方法
3.3.2 基于多智能体的模型和学习方法
3.3.2.1 网络结构
3.3.2.2 学习方法
3.4 仿真实验与结果分析
3.4.1 环境建模
3.4.2 评测标准及模型参数设置
3.4.3 基于规则运动的攻击智能体防守对抗结果
3.4.4 基于学习模型的攻击智能体防守对抗结果
3.5 本章小结
第四章 基于交叉熵方法的协同任务分配
4.1 交叉熵方法
4.2 基于交叉熵方法的多类型无人机任务分配
4.2.1 问题描述
4.2.2 任务分配方法
4.3 仿真实验与结果分析
4.3.1 基于CE方法的任务分配
4.3.2 两种任务分配方法对比
4.4 本章小结
第五章 基于k-degree平滑的协同路径规划算法
5.1 基于Voronoi图的环境建模方法
5.2 初始路径规划算法
5.2.1 基于改进蚁群优化算法的初始路径规划
5.2.2 改进蚁群优化算法流程
5.3 基于k-degree的平滑算法
5.3.1 k-degree的定义
5.3.2 理论分析
5.4 多无人机协同策略
5.5 仿真实验与结果分析
5.5.1 初始路径规划算法对比
5.5.2 路径平滑仿真
5.5.3 多无人机协同
5.5.3.1 强协同
5.5.3.2 弱协同
5.6 本章小结
第六章 全文总结与展望
6.1 全文总结
6.2 未来工作展望
致谢
参考文献
攻读博士学位期间取得的成果
本文编号:3821257
【文章页数】:129 页
【学位级别】:博士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究工作背景与意义
1.2 国内外研究历史与现状
1.3 本文主要贡献与创新
1.4 论文结构安排
第二章 基于强化学习的智能体动态避障
2.1 强化学习
2.2 动态避障环境建模
2.2.1 状态空间
2.2.2 动作空间
2.3 基于改进Q学习的机器人避障
2.3.1 回报函数
2.3.1.1 回报函数多目标问题建模
2.3.1.2 基于NSGA-II算法的回报函数优化求解
2.3.2 Q值
2.3.3 选择策略
2.4 仿真实验与结果分析
2.4.1 不同场景避障仿真
2.4.2 改进强化学习实验对比
2.4.3 回报函数优化前后对比
2.5 本章小结
第三章 基于深度强化学习的多智能体防守对抗
3.1 深度强化学习和多智能体防守对抗
3.1.1 多智能体防守对抗问题
3.1.2 深度强化学习相关算法
3.2 多智能体防守对抗环境建模
3.2.1 状态空间
3.2.2 动作空间
3.2.3 回报函数
3.2.3.1 攻击智能体回报函数
3.2.3.2 防守智能体回报函数
3.3 智能体模型和学习方法
3.3.1 基于单智能体的模型和学习方法
3.3.1.1 网络结构
3.3.1.2 学习方法
3.3.2 基于多智能体的模型和学习方法
3.3.2.1 网络结构
3.3.2.2 学习方法
3.4 仿真实验与结果分析
3.4.1 环境建模
3.4.2 评测标准及模型参数设置
3.4.3 基于规则运动的攻击智能体防守对抗结果
3.4.4 基于学习模型的攻击智能体防守对抗结果
3.5 本章小结
第四章 基于交叉熵方法的协同任务分配
4.1 交叉熵方法
4.2 基于交叉熵方法的多类型无人机任务分配
4.2.1 问题描述
4.2.2 任务分配方法
4.3 仿真实验与结果分析
4.3.1 基于CE方法的任务分配
4.3.2 两种任务分配方法对比
4.4 本章小结
第五章 基于k-degree平滑的协同路径规划算法
5.1 基于Voronoi图的环境建模方法
5.2 初始路径规划算法
5.2.1 基于改进蚁群优化算法的初始路径规划
5.2.2 改进蚁群优化算法流程
5.3 基于k-degree的平滑算法
5.3.1 k-degree的定义
5.3.2 理论分析
5.4 多无人机协同策略
5.5 仿真实验与结果分析
5.5.1 初始路径规划算法对比
5.5.2 路径平滑仿真
5.5.3 多无人机协同
5.5.3.1 强协同
5.5.3.2 弱协同
5.6 本章小结
第六章 全文总结与展望
6.1 全文总结
6.2 未来工作展望
致谢
参考文献
攻读博士学位期间取得的成果
本文编号:3821257
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3821257.html