多情感机器人的情感建模和行为决策研究
发布时间:2020-04-12 01:35
【摘要】:情感计算是人工智能学科的一个重要研究课题,多机器人行为决策是多机器人协作系统的重要研究内容,将两者结合起来研究多机器人协作系统中的情感机器人的行为决策是一个更有趣更复杂的问题。情感能够调节行为,也是一种交流信号,能促进机器人和机器人团队的自动化。本文的主要研究内容包括:(1)为多机器人协作系统中的机器人提出一个可解释和可计算的情感模型。我们结合前期基础工作,构建了一个相对完善的情感模型,该模型包括了个性、情绪、意愿度几个基本元素,和情绪衰减、情绪感染、外界刺激几个影响关系。本文详细描述了情感模型各模块及其耦合关系,提出了CASE个性模型以描述协作中的机器人的个性特征,完善了刺激类型定义与计算,最终通过意愿度来衡量机器人对任务的执行意愿,并作为任务分配的主要依据。最后通过仿真实验展示了情感的各组件在任务协作各环节中发挥的积极作用。(2)任务分配是多机器人协作的关键问题之一,研究如何高效协调地组织机器人执行任务。基于本文提出的情感模型,针对有情感的多机器人协作系统设计了任务分配算法,发挥情感的积极作用。最后通过多机器人追捕任务仿真实验展示了该任务分配算法的有效性。(3)多机器人协作系统中的机器人行为决策还包括任务执行中的行为策略,本文以追捕任务为实例研究了多机器人的追捕策略。本文引入势点分配的思想,并将势点集合扩展到连续空间,结合逃跑目标的移动方向给出了连续势点的定义。通过为追捕者分配不同的势点,使追捕者选择不同的追捕行为。通过深度确定性策略梯度算法优化团队内部追捕势点分配策略,通过多次迭代最终收敛到较优的结果。最后在仿真实验中展示了深度确定性策略梯度算法的有效收敛,验证了基于势点分配的围捕算法的智能性和高效性,并分析了算法的优势和不足。
【图文】:
通过情感特征观察值给出特征观察序列与情感状态之间的统计关系程根据初始情感的分布概率和转移概率来模拟情感状态的自发转移过3)Kismetismet 是由 MIT 的 Breazeal 博士设计的一个用于情感计算实验的机器它可以识别和模拟情感。Kismet 通过视觉和听觉感知外界社交信息,表情、姿势和声乐表达社交信息。该机器人通过低级特征提取系统于传感器的特征,通过注意系统确定这些特征中最突出和相关的刺组织行为反应的关注点,对应的低级特征在高级感知系统中被封装的感知信息,通过感知信息影响其他行为、动机和运动过程。Kism件触发,这些事件与机器人的幸福感相关。被触发后的情绪作为连境的功能集合。Kismet 的情感状态由唤醒、姿态和效价三个维度来间中的任意一点都表示一个情感状态,三维空间被划分为六个情感:愤怒、厌恶、恐惧、快乐、悲伤和惊讶,机器人根据当前情感点出该类情感对应的表情,距离区域中心越近情感强度越大。
图 2.1 强化学习原理框架Fig 2.1 Reinforcement learning通常被建模为马尔科夫决策过程(Ma义为一个四元组 S , A,P,r,其中:态的集合, sSt 表示智能体在t时刻所处,,则状态值等于观察值,如果是部分可作的集合, aAt 表示智能体在t时刻采取态转移概率矩阵, Pssssatttass P','1状态转移到 s '的概率;, rRssaatttas E,1表示智能体在状。奖励值是一个标量反馈信号,表示智能中的一个重要概念,策略就是智能体的行
【学位授予单位】:合肥工业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP242
本文编号:2624105
【图文】:
通过情感特征观察值给出特征观察序列与情感状态之间的统计关系程根据初始情感的分布概率和转移概率来模拟情感状态的自发转移过3)Kismetismet 是由 MIT 的 Breazeal 博士设计的一个用于情感计算实验的机器它可以识别和模拟情感。Kismet 通过视觉和听觉感知外界社交信息,表情、姿势和声乐表达社交信息。该机器人通过低级特征提取系统于传感器的特征,通过注意系统确定这些特征中最突出和相关的刺组织行为反应的关注点,对应的低级特征在高级感知系统中被封装的感知信息,通过感知信息影响其他行为、动机和运动过程。Kism件触发,这些事件与机器人的幸福感相关。被触发后的情绪作为连境的功能集合。Kismet 的情感状态由唤醒、姿态和效价三个维度来间中的任意一点都表示一个情感状态,三维空间被划分为六个情感:愤怒、厌恶、恐惧、快乐、悲伤和惊讶,机器人根据当前情感点出该类情感对应的表情,距离区域中心越近情感强度越大。
图 2.1 强化学习原理框架Fig 2.1 Reinforcement learning通常被建模为马尔科夫决策过程(Ma义为一个四元组 S , A,P,r,其中:态的集合, sSt 表示智能体在t时刻所处,,则状态值等于观察值,如果是部分可作的集合, aAt 表示智能体在t时刻采取态转移概率矩阵, Pssssatttass P','1状态转移到 s '的概率;, rRssaatttas E,1表示智能体在状。奖励值是一个标量反馈信号,表示智能中的一个重要概念,策略就是智能体的行
【学位授予单位】:合肥工业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP242
【参考文献】
相关期刊论文 前1条
1 王浩;张权益;方宝富;方帅;;基于状态空间与概率空间映射的极大相似度匹配情感模型[J];模式识别与人工智能;2013年06期
相关硕士学位论文 前1条
1 孙博寒;大规模情感机器人追捕问题研究[D];合肥工业大学;2018年
本文编号:2624105
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2624105.html