基于深度学习的机械臂交互预测研究
发布时间:2021-12-09 12:22
预测推理是机器人模仿人类智能的一项重要能力。近年来计算机视觉领域中的视频预测技术为机器人提供了预测编码的实现手段,使得机器人可以根据少量连续的视频等信息通过图像生成的方式预测得到合理的未来场景,机器便可以像人一样根据环境状态运用自身的预测能力自行规划完成一些操作任务,极大提高了机器人的智能性。目前,实现上述目标存在技术上的挑战性,包括如何构建视频预测模型从而得到准确真实的预测、如何评价预测生成的结果并选择出机器人可以使用的优秀模型、机器人如何根据视频预测模型实现自监督的运动规划。本文主要围绕以上三点开展了如下研究工作:1)开展基于机械臂与物理环境交互场景的视频预测研究。构建融合变分自编码器与生成对抗网络的无监督学习视频预测模型训练结构以及LSTM-CNN的图像预测生成器;搭建基于UR5机械臂的实验平台并完成交互轨迹数据集的制作,训练得到视频预测模型。实验结果表明,通过动态前景像素转换与静态背景合成的方式,模型可以得到较为清晰准确的预测。2)提出基于人眼视觉感知的图像质量评价指标。不同的视频预测模型往往造成不同类型和不同程度的失真,从而降低了机器人面向预测的可操作性。视频预测任务的图像质...
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
图1.1谷歌基于大规模标记数据的机械臂学习??
图1.2自编码器形式的视频预测模型结构W??
图1.3基于编码-递归-解码的视频预测模型结构m??
【参考文献】:
期刊论文
[1]基于深度学习的视频预测研究综述[J]. 莫凌飞,蒋红亮,李煊鹏. 智能系统学报. 2018(01)
[2]无参考图像质量评价综述[J]. 王志明. 自动化学报. 2015(06)
本文编号:3530624
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
图1.1谷歌基于大规模标记数据的机械臂学习??
图1.2自编码器形式的视频预测模型结构W??
图1.3基于编码-递归-解码的视频预测模型结构m??
【参考文献】:
期刊论文
[1]基于深度学习的视频预测研究综述[J]. 莫凌飞,蒋红亮,李煊鹏. 智能系统学报. 2018(01)
[2]无参考图像质量评价综述[J]. 王志明. 自动化学报. 2015(06)
本文编号:3530624
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3530624.html
最近更新
教材专著