基于深度学习的复杂场景下人头检测研究及实现
发布时间:2021-07-04 06:16
人体检测广泛应用于安防领域,具备很大的市场价值。但是安防场景常常比较复杂,人群的密集性和场景本身的复杂性导致人体目标很可能被遮挡,所以选择了人头这一遮挡可能性相对较小的人体特征作为检测目标。针对在目标密集、遮挡情况下检测性能下降的问题,设计了一种结合卷积神经网络和特定循环神经网络的人头检测算法YOLO-OFLSTM。人头检测算法YOLO-OFLSTM基于YOLO系列算法核心思想进行改进,首先利用Darknet19、MobileNet等卷积神经网络提取高层语义特征;然后利用一种只有遗忘门的变体长短期记忆单元OFLSTM来进行特征解码,以回归得到预测边界框信息;最后采用一种改进的非极大值抑制算法Union-NMS来去除冗余边界框,获得最终的人头检测结果。针对人头这一单一检测类别,Union-NMS算法同时考虑边界框置信度以及这些边界框之间的交叠率,这一改进有效提高了检测的准确性。针对YOLO-OFLSTM检测模型对于小尺度目标漏检率高的情况,设计出了特征提取骨干网络Darknet-PPM,该网络基于YOLO-v2的特征提取网络Darknet19,通过结合使用金字塔池化模块引入了多尺度特征,...
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
YOLO-v1网络模型
图 2.2 边框回归示例法的突出优点就是检测速度快,能够实全图信息,所以能有效减少背景误检。但于每个网格单元只检测一个目标。所以,漏检较多。RNN 的 YOLO-OFLSTM 算法设计思想是目标密集、遮挡情况下的人头检测,而为固定区域大小的一个个网格单元,在每一个网格单元中出现多个较为密集的目标目标的。所以我们参照 ReInspect 方法中入一种特定 RNN 网络,使其能够在一个够记住先前生成的预测,从而避免对同
图 2.3 YOLO-OFLSTM 模型架构我们构建的 YOLO-OFLSTM 模型架构如图 2.3 所示,首先利用 Darknet19 等 CNN网络模型将 640x480 的图像编码成 1024 维 20x15 的高层语义特征,高层语义特征图上的每个单元具有大小为 32x32 的感受野,即每个单元对应原始图像上 32x32 区域大小的网格单元,这样网络被训练以产生其中心与32x32的网格单元相交的所有边界框的集合,32x32 的区域大小足够捕获局部遮挡情况,同时 32x32 的区域中不会包含太多目标而导致不同网格单元上的目标分布太过失衡;然后使用特定 RNN 网络模型解码 CNN 网络模型提取到的特征回归得到预测框。模型中引入 RNN 是希望利用其对时间序列信息的记忆功能来检测出一个网格单元中的多个有遮挡的目标,本文使用的 RNN 是一种特定的只有遗忘门的 LSTM 变体结构[30],我们称之为 OFLSTM,它没有偏置项和非线性输出。在每一步,我们将 Darknet19 输出的(1,1024,15,20)维度的高层语义特性与前一步OFLSTM 单元的输出连接,并将其输入到下一步 OFLSTM 单元进行计算。这样每一步
【参考文献】:
期刊论文
[1]基于RPN与B- CNN的细粒度图像分类算法研究[J]. 赵浩如,张永,刘国柱. 计算机应用与软件. 2019(03)
[2]基于卷积神经网络的目标检测研究综述[J]. 李旭冬,叶茂,李涛. 计算机应用研究. 2017(10)
[3]基于深度信息的室内人数统计研究[J]. 何梦莹,方向忠,李伟,卢盼峰. 信息技术. 2016(10)
[4]基于深度卷积神经网络的行人检测[J]. 芮挺,费建超,周遊,方虎生,朱经纬. 计算机工程与应用. 2016(13)
[5]基于双目立体视觉的快速人头检测方法[J]. 顾骋,钱惟贤,陈钱,顾国华,任建乐. 中国激光. 2014(01)
[6]用二分图实现复杂参数类型匹配[J]. 王义锦,赵耀. 软件. 2012(11)
硕士论文
[1]基于深度学习的细胞谱系预测[D]. 王志丹.北京交通大学 2018
[2]基于机器视觉的纽扣缺陷检测算法研究[D]. 李帅.西安工程大学 2018
[3]基于位置的移动社交网络中兴趣点推荐算法的研究[D]. 王晓蕊.中国矿业大学 2018
[4]基于循环神经网络的推荐算法研究[D]. 李光.哈尔滨工程大学 2017
[5]基于卷积神经网络的人脸表情和性别识别[D]. 产文涛.安徽大学 2016
本文编号:3264210
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
YOLO-v1网络模型
图 2.2 边框回归示例法的突出优点就是检测速度快,能够实全图信息,所以能有效减少背景误检。但于每个网格单元只检测一个目标。所以,漏检较多。RNN 的 YOLO-OFLSTM 算法设计思想是目标密集、遮挡情况下的人头检测,而为固定区域大小的一个个网格单元,在每一个网格单元中出现多个较为密集的目标目标的。所以我们参照 ReInspect 方法中入一种特定 RNN 网络,使其能够在一个够记住先前生成的预测,从而避免对同
图 2.3 YOLO-OFLSTM 模型架构我们构建的 YOLO-OFLSTM 模型架构如图 2.3 所示,首先利用 Darknet19 等 CNN网络模型将 640x480 的图像编码成 1024 维 20x15 的高层语义特征,高层语义特征图上的每个单元具有大小为 32x32 的感受野,即每个单元对应原始图像上 32x32 区域大小的网格单元,这样网络被训练以产生其中心与32x32的网格单元相交的所有边界框的集合,32x32 的区域大小足够捕获局部遮挡情况,同时 32x32 的区域中不会包含太多目标而导致不同网格单元上的目标分布太过失衡;然后使用特定 RNN 网络模型解码 CNN 网络模型提取到的特征回归得到预测框。模型中引入 RNN 是希望利用其对时间序列信息的记忆功能来检测出一个网格单元中的多个有遮挡的目标,本文使用的 RNN 是一种特定的只有遗忘门的 LSTM 变体结构[30],我们称之为 OFLSTM,它没有偏置项和非线性输出。在每一步,我们将 Darknet19 输出的(1,1024,15,20)维度的高层语义特性与前一步OFLSTM 单元的输出连接,并将其输入到下一步 OFLSTM 单元进行计算。这样每一步
【参考文献】:
期刊论文
[1]基于RPN与B- CNN的细粒度图像分类算法研究[J]. 赵浩如,张永,刘国柱. 计算机应用与软件. 2019(03)
[2]基于卷积神经网络的目标检测研究综述[J]. 李旭冬,叶茂,李涛. 计算机应用研究. 2017(10)
[3]基于深度信息的室内人数统计研究[J]. 何梦莹,方向忠,李伟,卢盼峰. 信息技术. 2016(10)
[4]基于深度卷积神经网络的行人检测[J]. 芮挺,费建超,周遊,方虎生,朱经纬. 计算机工程与应用. 2016(13)
[5]基于双目立体视觉的快速人头检测方法[J]. 顾骋,钱惟贤,陈钱,顾国华,任建乐. 中国激光. 2014(01)
[6]用二分图实现复杂参数类型匹配[J]. 王义锦,赵耀. 软件. 2012(11)
硕士论文
[1]基于深度学习的细胞谱系预测[D]. 王志丹.北京交通大学 2018
[2]基于机器视觉的纽扣缺陷检测算法研究[D]. 李帅.西安工程大学 2018
[3]基于位置的移动社交网络中兴趣点推荐算法的研究[D]. 王晓蕊.中国矿业大学 2018
[4]基于循环神经网络的推荐算法研究[D]. 李光.哈尔滨工程大学 2017
[5]基于卷积神经网络的人脸表情和性别识别[D]. 产文涛.安徽大学 2016
本文编号:3264210
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3264210.html