基于深度学习的单目图像三维人体姿态估计算法研究
发布时间:2022-11-11 17:15
单目图像的三维人体姿态估计是计算机视觉中一项基本但富有挑战的任务,其目的是检测单目图像中的人体姿态并将其投影到三维空间中。随着科学技术的快速发展,三维视觉已成为人工智能研究和应用的热门领域,越来越多的专家学者投入到该领域的探索中。三维人体姿态估计精度一方面受图像外部遮挡、自遮挡和光线等因素影响,另一方面人体结构的特殊性也会给该问题的解决带来诸多困难。并且,如何将二维空间提升到三维空间本身是一个复杂的病态问题,深度数据缺失会导致一个二维坐标与多个三维坐标问题对应。目前已有的算法通常会对三维人体姿态进行整体回归,无法有效估计部分难度较高的关节点。针对三维人体姿态估计的难题,本文研究的重点是,在深度学习框架下利用人体拓扑结构信息来提高三维人体姿态估计效果,主要工作如下:(1)为了利用网络深层特征中包含的人体结构信息,本文提出了一个人体结构感知网络模型来进行三维人体姿态估计,通过由粗到精级联加深全连接网络深度的方式,扩大模型参数空间从而提高网络的非线性拟合能力。本文先利用“沙漏网络”检测、提取单目图像中人体的二维关节点坐标,其次通过“基本网络”将二维关节点坐标提升到三维空间中,再根据人体拓扑结...
【文章页数】:74 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景及意义
1.2 研究难点
1.3 国内外研究现状
1.3.1 两级单目图像三维人体姿态估计
1.3.2 端到端三维人体姿态估计
1.4 研究内容与章节安排
第2章 相关工作介绍
2.1 人体姿态的定义
2.2 基于堆叠沙漏网络的二维人体姿态估计
2.2.1 二维姿态的热力图表示
2.2.2 堆叠沙漏网络模型
2.3 投影模型及坐标系转换
2.3.1 弱透视投影
2.3.2 坐标系转换
2.4 二维人体姿态到三维人体姿态估计算法
2.4.1 基于相机参数优化的三维人体姿态估计算法
2.4.2 基于深度学习的三维人体姿态估计
2.5 相关的公开数据集
2.5.1 二维人体姿态数据集
2.5.2 三维人体姿态数据集
2.6 本章小结
第3章 基于人体结构感知网络的三维人体姿态估计
3.1 二维人体姿态估计
3.2 人体结构感知网络模型
3.2.1 二维姿态和三维姿态数据预处理
3.2.2 基本子网络
3.2.3 单通道优化子网络
3.2.4 双通道优化子网络
3.3 实验与分析
3.3.1 评价指标及实验设置
3.3.2 可视化定性分析
3.3.3 定量分析
3.4 本章小结
第4章 基于层次上下文相关优化网络的三维人体姿态估计
4.1 人体骨架模型的分层结构
4.2 基于随机增强模块的基本子网络
4.3 基于人体分层结构的层次上下文相关优化子网络
4.4 注意力模块
4.5 实验与分析
4.5.1 评价指标与实验设置
4.5.2 Human3.6M上的定量评估
4.5.3 消融实验
4.5.4 Human Eva上的定量评估
4.5.5 可视化结果
4.6 本章小结
第5章 总结与展望
5.1 工作总结
5.2 工作展望
参考文献
指导教师对研究生学位论文的学术评语
学位论文答辩委员会决议书
致谢
攻读硕士学位期间的研究成果
【参考文献】:
期刊论文
[1]举重运动的人体三维模型重建及仿真[J]. 刘国翌,陈睿,邓宇,李华. 系统仿真学报. 2006(02)
[2]基于视频的三维人体运动跟踪[J]. 刘国翌,陈睿,邓宇,李华. 计算机辅助设计与图形学学报. 2006(01)
博士论文
[1]基于单目视频无标记点的三维人体姿态估计的研究[D]. 刘晨光.哈尔滨工业大学 2011
本文编号:3705427
【文章页数】:74 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景及意义
1.2 研究难点
1.3 国内外研究现状
1.3.1 两级单目图像三维人体姿态估计
1.3.2 端到端三维人体姿态估计
1.4 研究内容与章节安排
第2章 相关工作介绍
2.1 人体姿态的定义
2.2 基于堆叠沙漏网络的二维人体姿态估计
2.2.1 二维姿态的热力图表示
2.2.2 堆叠沙漏网络模型
2.3 投影模型及坐标系转换
2.3.1 弱透视投影
2.3.2 坐标系转换
2.4 二维人体姿态到三维人体姿态估计算法
2.4.1 基于相机参数优化的三维人体姿态估计算法
2.4.2 基于深度学习的三维人体姿态估计
2.5 相关的公开数据集
2.5.1 二维人体姿态数据集
2.5.2 三维人体姿态数据集
2.6 本章小结
第3章 基于人体结构感知网络的三维人体姿态估计
3.1 二维人体姿态估计
3.2 人体结构感知网络模型
3.2.1 二维姿态和三维姿态数据预处理
3.2.2 基本子网络
3.2.3 单通道优化子网络
3.2.4 双通道优化子网络
3.3 实验与分析
3.3.1 评价指标及实验设置
3.3.2 可视化定性分析
3.3.3 定量分析
3.4 本章小结
第4章 基于层次上下文相关优化网络的三维人体姿态估计
4.1 人体骨架模型的分层结构
4.2 基于随机增强模块的基本子网络
4.3 基于人体分层结构的层次上下文相关优化子网络
4.4 注意力模块
4.5 实验与分析
4.5.1 评价指标与实验设置
4.5.2 Human3.6M上的定量评估
4.5.3 消融实验
4.5.4 Human Eva上的定量评估
4.5.5 可视化结果
4.6 本章小结
第5章 总结与展望
5.1 工作总结
5.2 工作展望
参考文献
指导教师对研究生学位论文的学术评语
学位论文答辩委员会决议书
致谢
攻读硕士学位期间的研究成果
【参考文献】:
期刊论文
[1]举重运动的人体三维模型重建及仿真[J]. 刘国翌,陈睿,邓宇,李华. 系统仿真学报. 2006(02)
[2]基于视频的三维人体运动跟踪[J]. 刘国翌,陈睿,邓宇,李华. 计算机辅助设计与图形学学报. 2006(01)
博士论文
[1]基于单目视频无标记点的三维人体姿态估计的研究[D]. 刘晨光.哈尔滨工业大学 2011
本文编号:3705427
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3705427.html