基于深度学习的行人属性识别
发布时间:2021-02-28 22:19
行人属性识别可以将监控视频中的行人信息变成可以用于搜索的高级语义信息,其可以辅助完成行人检索、行人重识别等任务,所以,吸引了越来越多研究者的关注。早期的行人属性识别算法均是使用手工设计规则的方法提取图片特征进行行人属性识别,但实际场景复杂度较高,该类算法难以获得较好识别效果。因此,提出两种基于深度学习的改进算法:(1)为了减少背景对于属性识别的干扰,提出基于抑制背景干扰的行人属性识别算法。该算法通过强制网络提取到的特征集中于图像中的人体区域来提高属性识别效果。首先,增加两个分支,主干网络提取行人图像特征,增加的分支用于在特征图上分离行人人体区域与背景区域,得到不同区域的特征向量。然后,通过加权交叉熵损失函数计算网络预测的损失,通过区域对比损失函数计算由于背景干扰而产生错误的特征提取所造成的损失。最后,将两部分损失累加作为网络的总损失,对网络进行参数的更新。(2)为了通过定位各个属性的位置来提高识别效果,提出基于属性定位的行人属性识别算法。首先,算法设计了一个属性定位模块,有针对性地对每个属性进行区域级加权来提高网络的属性定位能力。然后,将属性定位模块应用到网络的多个层级,形成一个多分支...
【文章来源】:中国民航大学天津市
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
训练过程中区域对比损失函数变化趋势
中国民航大学硕士学位论文37否佩戴帽子提取类激活图的结果,可以看出定位存在一定的误差。如果直接利用存在误差的类激活图对中间层特征进行加权,然后将加权特征图用于属性分类,那么这种误差会导致训练的过程中属性的定位越来越远离正确的位置。为了防止这种现象的出现,本章算法将基础网络扩展为三个分支,主干分支不添加属性定位模块,只用作特征提取和属性分类,另外两个分支添加属性定位模块,如图4-1所示,将Block4延伸出的分支命名为分支一,将Block3分支延伸出的分支命名为分支二。最后增加一个特征融合操作,将主干网络的分类结果与分支网络的模块输出的特征向量进行线性加权融合,计算方法如式(4.4)所示。这样既保证了网络原本的属性分类正确性,又融合了包含位置信息的特征,使网络在保持原有性能的同时,进一步提高网络的分类能力。123yyyy(4.4)其中,1y为主干网络的输出,2y为分支一的输出,3y为分支二的输出,为分支一的加权系数,为分支二的加权系数。图4-4帽子属性的类激活图4.2.3属性定位模块本章算法设计了一个属性定位模块,该模块可以获取属性在图像中的位置信息,辅助属性识别任务,提高识别效果。模块的结构如图4-5所示,模块的输入为网络的中间层特征图和对应层级的类激活图。中间层特征图的维度为NCHW,其中N为网络一次输入的图片数量,C为特征图的通道数,H为特征图的高度,W为特征图的宽度。类激活图的维度为attNnumHW,其中N为BatchSize,attnum为数据集的标签数目,类激活图的高度和宽度均与模块输入的特征图维度一致。属性定位模块的实现细节包含以下三个步骤:
【参考文献】:
期刊论文
[1]深度学习技术在细胞形态学图像处理中的研究进展[J]. 赵天赐,王庚,连荷清,方喆君,王欣,陈倩,吴卫. 临床检验杂志. 2019(11)
[2]深度学习算法研究进展[J]. 田启川,王满丽. 计算机工程与应用. 2019(22)
[3]基于深度学习的图像语义分割技术研究综述[J]. 邝辉宇,吴俊君. 计算机工程与应用. 2019(19)
[4]基于卷积神经网络的目标检测模型综述[J]. 许必宵,宫婧,孙知信. 计算机技术与发展. 2019(12)
[5]深度学习在图像识别中的应用研究综述[J]. 郑远攀,李广阳,李晔. 计算机工程与应用. 2019(12)
[6]基于改进损失函数的多阶段行人属性识别方法[J]. 郑少飞,汤进,罗斌,王逍,王文中. 模式识别与人工智能. 2018(12)
[7]基于深度学习的行人属性多标签识别[J]. 李亚鹏,万遂人. 中国生物医学工程学报. 2018(04)
[8]基于深度学习的行人属性识别[J]. 陈萍,杨鸿波. 信息通信. 2018(04)
[9]A brief introduction to weakly supervised learning[J]. Zhi-Hua Zhou. National Science Review. 2018(01)
本文编号:3056538
【文章来源】:中国民航大学天津市
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
训练过程中区域对比损失函数变化趋势
中国民航大学硕士学位论文37否佩戴帽子提取类激活图的结果,可以看出定位存在一定的误差。如果直接利用存在误差的类激活图对中间层特征进行加权,然后将加权特征图用于属性分类,那么这种误差会导致训练的过程中属性的定位越来越远离正确的位置。为了防止这种现象的出现,本章算法将基础网络扩展为三个分支,主干分支不添加属性定位模块,只用作特征提取和属性分类,另外两个分支添加属性定位模块,如图4-1所示,将Block4延伸出的分支命名为分支一,将Block3分支延伸出的分支命名为分支二。最后增加一个特征融合操作,将主干网络的分类结果与分支网络的模块输出的特征向量进行线性加权融合,计算方法如式(4.4)所示。这样既保证了网络原本的属性分类正确性,又融合了包含位置信息的特征,使网络在保持原有性能的同时,进一步提高网络的分类能力。123yyyy(4.4)其中,1y为主干网络的输出,2y为分支一的输出,3y为分支二的输出,为分支一的加权系数,为分支二的加权系数。图4-4帽子属性的类激活图4.2.3属性定位模块本章算法设计了一个属性定位模块,该模块可以获取属性在图像中的位置信息,辅助属性识别任务,提高识别效果。模块的结构如图4-5所示,模块的输入为网络的中间层特征图和对应层级的类激活图。中间层特征图的维度为NCHW,其中N为网络一次输入的图片数量,C为特征图的通道数,H为特征图的高度,W为特征图的宽度。类激活图的维度为attNnumHW,其中N为BatchSize,attnum为数据集的标签数目,类激活图的高度和宽度均与模块输入的特征图维度一致。属性定位模块的实现细节包含以下三个步骤:
【参考文献】:
期刊论文
[1]深度学习技术在细胞形态学图像处理中的研究进展[J]. 赵天赐,王庚,连荷清,方喆君,王欣,陈倩,吴卫. 临床检验杂志. 2019(11)
[2]深度学习算法研究进展[J]. 田启川,王满丽. 计算机工程与应用. 2019(22)
[3]基于深度学习的图像语义分割技术研究综述[J]. 邝辉宇,吴俊君. 计算机工程与应用. 2019(19)
[4]基于卷积神经网络的目标检测模型综述[J]. 许必宵,宫婧,孙知信. 计算机技术与发展. 2019(12)
[5]深度学习在图像识别中的应用研究综述[J]. 郑远攀,李广阳,李晔. 计算机工程与应用. 2019(12)
[6]基于改进损失函数的多阶段行人属性识别方法[J]. 郑少飞,汤进,罗斌,王逍,王文中. 模式识别与人工智能. 2018(12)
[7]基于深度学习的行人属性多标签识别[J]. 李亚鹏,万遂人. 中国生物医学工程学报. 2018(04)
[8]基于深度学习的行人属性识别[J]. 陈萍,杨鸿波. 信息通信. 2018(04)
[9]A brief introduction to weakly supervised learning[J]. Zhi-Hua Zhou. National Science Review. 2018(01)
本文编号:3056538
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3056538.html