基于注意力机制的狭小空间人群拥挤度分析
发布时间:2021-06-09 16:27
人群拥挤度的分析对维护公共安全极为重要,在空间狭窄的环境下,由于视角受到局限,人与人、人与物品的遮挡十分严重,并且人的尺度不一,密度不均匀,使得传统人群拥挤度监控方法较难直接统计出具体人数。为此,提出一种基于注意力机制的狭小空间人群拥挤度分析方法,旨在量化人群,通过卷积神经网络回归拥挤率分析当前空间内的人群拥挤程度。设计一个注意力模块作为网络的前端,通过生成对应尺度的注意力图区分背景和人群,保留精确的像素点位置信息,以减轻输入图像中各种噪声的影响。在此基础上,将注意图和原始图片通过对应像素点相乘,注入到微调的残差网络中训练得到人群拥挤率。实验结果表明,该方法能够预测出拥挤率,准确反映当前人群拥挤程度,实现人群的流量控制。
【文章来源】:计算机工程. 2020,46(09)北大核心CSCD
【文章页数】:8 页
【部分图文】:
整体网络结构
生成注意力图的工作流程如图2所示,网络结构采用的是微调过的GoogLeNet[12],该网络在图像分类和目标定位上都展现出了很好的性能。将GoogLeNet的Inception4e后面的层移除,保持图像分辨率为14像素×14像素,为使最后的注意力图和原始输入图片能够融合,保留图片像素点的位置信息,每个卷积层后面都利用padding对特征图进行填充,在卷积降低图像分辨率的同时,保持尺度不变。在卷积输出前,参照文献[17]的方法,使用全局平均池化(GAP)和Softmax层,将输出的每个类别的权重映射回卷积特征图,从而生成注意力图。本文将注意力模块设计为一个二分类的网络,并将图片内容分为背景和人群。如图2所示,Fb和Fc是最后一层卷积输出的两个通道的特征图,Fb(x,y)、Fc(x,y)分别表示背景和人群在坐标(x,y)上像素点的激活值,通过全局平均池化后(图2中的GAP),得到长度为2的向量,每个长度对应一个类别权重Wb、Wc,那么Softmax层的输入Sc、Sb如式(1)所示,Softmax层的输出Pc、Pb可根据式(2)得到,最后将每个像素点坐标的得分Pc,b(x,y)与特征图Fc,b(x,y)根据式(3)进行线性加权融合后,再利用向上采样(UpSample),得到与原始图片尺寸相同的注意力图。
本文构建一个新的数据集NS-DATASET,该数据集中共计17 800张图片,它们都是在狭小空间内,视角受到局限如图3所示,图3(a)为斜上方视角,如楼道、天桥隧道,图3(b)为正上方视角,如车厢的下车门通道,图3(c)为正前方视角,如前后车厢。3.2 网络真实值
【参考文献】:
期刊论文
[1]融合多层卷积特征的双视点手势识别技术研究[J]. 张哲,孙瑾,杨刘涛. 小型微型计算机系统. 2019(03)
[2]基于卷积神经网络和密度分布特征的人数统计方法[J]. 郭继昌,李翔鹏. 电子科技大学学报. 2018(06)
[3]基于卷积神经网络的实时人群密度估计[J]. 李白萍,韩新怡,吴冬梅. 图学学报. 2018(04)
[4]融合LBP与GLCM的人群密度分类算法[J]. 薛翠红,于洋,张朝,杨鹏,李扬. 电视技术. 2015(24)
硕士论文
[1]基于深度学习的人群密度估计算法研究[D]. 韩新怡.西安科技大学 2018
[2]基于卷积神经网络的人群密度分析[D]. 魏梦.中国科学技术大学 2018
[3]基于灰度共生矩阵的人群密度估计算法研究[D]. 王雅琳.西安科技大学 2013
本文编号:3220919
【文章来源】:计算机工程. 2020,46(09)北大核心CSCD
【文章页数】:8 页
【部分图文】:
整体网络结构
生成注意力图的工作流程如图2所示,网络结构采用的是微调过的GoogLeNet[12],该网络在图像分类和目标定位上都展现出了很好的性能。将GoogLeNet的Inception4e后面的层移除,保持图像分辨率为14像素×14像素,为使最后的注意力图和原始输入图片能够融合,保留图片像素点的位置信息,每个卷积层后面都利用padding对特征图进行填充,在卷积降低图像分辨率的同时,保持尺度不变。在卷积输出前,参照文献[17]的方法,使用全局平均池化(GAP)和Softmax层,将输出的每个类别的权重映射回卷积特征图,从而生成注意力图。本文将注意力模块设计为一个二分类的网络,并将图片内容分为背景和人群。如图2所示,Fb和Fc是最后一层卷积输出的两个通道的特征图,Fb(x,y)、Fc(x,y)分别表示背景和人群在坐标(x,y)上像素点的激活值,通过全局平均池化后(图2中的GAP),得到长度为2的向量,每个长度对应一个类别权重Wb、Wc,那么Softmax层的输入Sc、Sb如式(1)所示,Softmax层的输出Pc、Pb可根据式(2)得到,最后将每个像素点坐标的得分Pc,b(x,y)与特征图Fc,b(x,y)根据式(3)进行线性加权融合后,再利用向上采样(UpSample),得到与原始图片尺寸相同的注意力图。
本文构建一个新的数据集NS-DATASET,该数据集中共计17 800张图片,它们都是在狭小空间内,视角受到局限如图3所示,图3(a)为斜上方视角,如楼道、天桥隧道,图3(b)为正上方视角,如车厢的下车门通道,图3(c)为正前方视角,如前后车厢。3.2 网络真实值
【参考文献】:
期刊论文
[1]融合多层卷积特征的双视点手势识别技术研究[J]. 张哲,孙瑾,杨刘涛. 小型微型计算机系统. 2019(03)
[2]基于卷积神经网络和密度分布特征的人数统计方法[J]. 郭继昌,李翔鹏. 电子科技大学学报. 2018(06)
[3]基于卷积神经网络的实时人群密度估计[J]. 李白萍,韩新怡,吴冬梅. 图学学报. 2018(04)
[4]融合LBP与GLCM的人群密度分类算法[J]. 薛翠红,于洋,张朝,杨鹏,李扬. 电视技术. 2015(24)
硕士论文
[1]基于深度学习的人群密度估计算法研究[D]. 韩新怡.西安科技大学 2018
[2]基于卷积神经网络的人群密度分析[D]. 魏梦.中国科学技术大学 2018
[3]基于灰度共生矩阵的人群密度估计算法研究[D]. 王雅琳.西安科技大学 2013
本文编号:3220919
本文链接:https://www.wllwen.com/guanlilunwen/zhengwuguanli/3220919.html