基于深度学习的人体姿态估计方法研究
发布时间:2021-03-25 11:01
人体姿态估计是当前计算机视觉中重要的组成部分,是动作识别的关键步骤。随着深度学习的迅速流行,使得实现快速且准确的人体姿态估计任务成为可能。研究如何使得人体姿态估计任务更好的根据现实需求应用于视频中逐渐成为当前具有重要现实意义的研究内容。该文探索了人体姿态估计算法中所涉及的处理速度及精度之间平衡性的相关因素,最后形成了一种有效的人体姿态估计方法。目前已经存在多种人体姿态估计方法,包括单人姿态估计方法和多人姿态估计方法,其中单人姿态估计方法的研究已经比较成熟,当前主要研究方向是多人姿态估计方法。针对多人姿态估计在视频中的应用,大多数方法特别关注准确度而忽略实际应用中对方法处理速度的要求,本文所做的主要工作是对多种现有的具有代表性的单人和多人姿态估计方法进行研究,通过多组对比实验分别对这些方法的处理速度和准确度的相关指标进行探索和分析,提出可行的相关改进想法有针对性的改进了相关方法,并与原方法进行对比实验,从而得出了影响人体姿态估计准确度和处理速度之间平衡性的若干因素,由此基础上该文提出了一种通过改进Dense Net网络进行人体姿态估计的方法。所提出的基于改进Dense Net网络的人体姿...
【文章来源】:湘潭大学湖南省
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
图像卷积示意
6第2章相关理论概述2.1卷积神经网络基于部件模型的姿态估计方法存在的主要不足之处有图像中包含繁杂各异的特征,必然需要处理大量像素信息,而将每个像素都被视为与其他像素完全不同的对象是不合理的,因为在实际的图像中,在相同部件的局部位置上,边缘像素总是参差不齐[16]。因此,基于人工设计的特征提取方法在面对复杂多变的图像内容时,常常显得有心无力,在包括姿态估计任务在内的多种图像处理任务中,基于人工特征提取并采用层次流水线的方法对于速度和精度的提升收效甚微[5],而卷积神经网络的发展几乎改变了这一切。2.1.1卷积神经网络技术卷积神经网络(ConvolutionalNeuralNetworks,CNN),是由Bell实验室和纽约大学的YannLeCun研究小组开发创立的基于神经网络的相关系统架构,其对于图像数据的处理有独特的效果[29]。图2.1展示了卷积操作的原理,其可以看作使用一个矩阵在图像上进行滑动。而图2.2则是输出每一个矩阵位置与对应图像位置的卷积运算结果示意。一般滑动的动作轨迹为从图像的左上角开始,依次往右到图像的右边界,然后在图像往下一行像素位置最左边移动,还是依次从左向右滑动。每次向右滑动的像素距离,称为步长。通常可以使用不同步长和是否对图像进行零填充来控制输出的卷积层矩阵大校图2.1图像卷积示意图2.2卷积计算
8可以共享其迁移过来的,具备对低层次特征强提取能力的卷积神经网络参数。不得不说,迁移学习加速了神经网络结构的发展和更迭。2.2图像金字塔在图像处理的过程中,由于图像中相邻像素之间有密切联系,不管是从纹理或是灰度级都很相似。若图像中的目标对象尺寸很小,一般要用较高的分辨率来观察。我们想要观察到小目标的细节部分则需要扩大视野将小目标的尺寸放大。相反,若图像中的目标尺寸很大,那么就仅仅需要较低的分辨率就能够有效观察。若图像中的目标尺寸大小不一,进行多分辨率处理的效果更佳。图像金字塔(ImagePyramid)就是以多分辨率来解析图像而诞生的一种简单有效的方法,也是在图像中多尺度信息的表达方式之一[32]。简而言之,图像金字塔实际上是将图像进行按比例缩放。顾名思义,图像金字塔就是以图像的尺寸由底层最大,往上层依次降低类似金字塔状的形式,如图2.3所示,其是较高分辨率的原图像副本,而顶部则是较低分辨率的原图像副本。图2.3图像金字塔2.3图像上采样在卷积神经网络中,为了降低参数量使原图像分辨率快速下降,便于减少计算设备的计算量,会采取下采样的操作,即添加池化层于卷积层之后[29,33]。池化层的输入为卷积层的输出,将卷积层最大响应的特征结果进行压缩,并去除冗余的信息,可实现尺度、旋转和平移等多种特征不变性。池化操作有多种,常见的有两种:1.平均池化,计算的是特征图中规定范围内各值的平均;2.最大池化,计算的是特征图中规定范围内的最大值。可以从图2.4中看到两者之间的计算差异。
【参考文献】:
期刊论文
[1]改进的YOLO V3算法及其在小目标检测中的应用[J]. 鞠默然,罗海波,王仲博,何淼,常铮,惠斌. 光学学报. 2019(07)
[2]面向小目标的多尺度Faster-RCNN检测算法[J]. 黄继鹏,史颖欢,高阳. 计算机研究与发展. 2019(02)
[3]基于中粒度模型的视频人体姿态估计[J]. 史青宣,邸慧军,陆耀,田学东. 自动化学报. 2018(04)
[4]卷积神经网络研究综述[J]. 周飞燕,金林鹏,董军. 计算机学报. 2017(06)
[5]基于肢体调整的人体姿态估计[J]. 蔡鹏,孔德慧,尹宝才,霍奕. 系统仿真学报. 2015(10)
[6]基于视觉的人体动作识别综述[J]. 胡琼,秦磊,黄庆明. 计算机学报. 2013(12)
[7]图像和视频中基于部件检测器的人体姿态估计[J]. 苏延超,艾海舟,劳世竑. 电子与信息学报. 2011(06)
[8]人体运动捕捉及运动控制的研究[J]. 黄波士,陈福民. 计算机工程与应用. 2005(07)
硕士论文
[1]基于姿态估计的交警手势识别方法的研究[D]. 黄聚.吉林大学 2019
[2]基于深度卷积神经网络的人体姿势估计研究[D]. 王冉.电子科技大学 2016
本文编号:3099571
【文章来源】:湘潭大学湖南省
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
图像卷积示意
6第2章相关理论概述2.1卷积神经网络基于部件模型的姿态估计方法存在的主要不足之处有图像中包含繁杂各异的特征,必然需要处理大量像素信息,而将每个像素都被视为与其他像素完全不同的对象是不合理的,因为在实际的图像中,在相同部件的局部位置上,边缘像素总是参差不齐[16]。因此,基于人工设计的特征提取方法在面对复杂多变的图像内容时,常常显得有心无力,在包括姿态估计任务在内的多种图像处理任务中,基于人工特征提取并采用层次流水线的方法对于速度和精度的提升收效甚微[5],而卷积神经网络的发展几乎改变了这一切。2.1.1卷积神经网络技术卷积神经网络(ConvolutionalNeuralNetworks,CNN),是由Bell实验室和纽约大学的YannLeCun研究小组开发创立的基于神经网络的相关系统架构,其对于图像数据的处理有独特的效果[29]。图2.1展示了卷积操作的原理,其可以看作使用一个矩阵在图像上进行滑动。而图2.2则是输出每一个矩阵位置与对应图像位置的卷积运算结果示意。一般滑动的动作轨迹为从图像的左上角开始,依次往右到图像的右边界,然后在图像往下一行像素位置最左边移动,还是依次从左向右滑动。每次向右滑动的像素距离,称为步长。通常可以使用不同步长和是否对图像进行零填充来控制输出的卷积层矩阵大校图2.1图像卷积示意图2.2卷积计算
8可以共享其迁移过来的,具备对低层次特征强提取能力的卷积神经网络参数。不得不说,迁移学习加速了神经网络结构的发展和更迭。2.2图像金字塔在图像处理的过程中,由于图像中相邻像素之间有密切联系,不管是从纹理或是灰度级都很相似。若图像中的目标对象尺寸很小,一般要用较高的分辨率来观察。我们想要观察到小目标的细节部分则需要扩大视野将小目标的尺寸放大。相反,若图像中的目标尺寸很大,那么就仅仅需要较低的分辨率就能够有效观察。若图像中的目标尺寸大小不一,进行多分辨率处理的效果更佳。图像金字塔(ImagePyramid)就是以多分辨率来解析图像而诞生的一种简单有效的方法,也是在图像中多尺度信息的表达方式之一[32]。简而言之,图像金字塔实际上是将图像进行按比例缩放。顾名思义,图像金字塔就是以图像的尺寸由底层最大,往上层依次降低类似金字塔状的形式,如图2.3所示,其是较高分辨率的原图像副本,而顶部则是较低分辨率的原图像副本。图2.3图像金字塔2.3图像上采样在卷积神经网络中,为了降低参数量使原图像分辨率快速下降,便于减少计算设备的计算量,会采取下采样的操作,即添加池化层于卷积层之后[29,33]。池化层的输入为卷积层的输出,将卷积层最大响应的特征结果进行压缩,并去除冗余的信息,可实现尺度、旋转和平移等多种特征不变性。池化操作有多种,常见的有两种:1.平均池化,计算的是特征图中规定范围内各值的平均;2.最大池化,计算的是特征图中规定范围内的最大值。可以从图2.4中看到两者之间的计算差异。
【参考文献】:
期刊论文
[1]改进的YOLO V3算法及其在小目标检测中的应用[J]. 鞠默然,罗海波,王仲博,何淼,常铮,惠斌. 光学学报. 2019(07)
[2]面向小目标的多尺度Faster-RCNN检测算法[J]. 黄继鹏,史颖欢,高阳. 计算机研究与发展. 2019(02)
[3]基于中粒度模型的视频人体姿态估计[J]. 史青宣,邸慧军,陆耀,田学东. 自动化学报. 2018(04)
[4]卷积神经网络研究综述[J]. 周飞燕,金林鹏,董军. 计算机学报. 2017(06)
[5]基于肢体调整的人体姿态估计[J]. 蔡鹏,孔德慧,尹宝才,霍奕. 系统仿真学报. 2015(10)
[6]基于视觉的人体动作识别综述[J]. 胡琼,秦磊,黄庆明. 计算机学报. 2013(12)
[7]图像和视频中基于部件检测器的人体姿态估计[J]. 苏延超,艾海舟,劳世竑. 电子与信息学报. 2011(06)
[8]人体运动捕捉及运动控制的研究[J]. 黄波士,陈福民. 计算机工程与应用. 2005(07)
硕士论文
[1]基于姿态估计的交警手势识别方法的研究[D]. 黄聚.吉林大学 2019
[2]基于深度卷积神经网络的人体姿势估计研究[D]. 王冉.电子科技大学 2016
本文编号:3099571
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3099571.html
最近更新
教材专著