基于语义分割的行人属性识别技术的研究与实现

发布时间：2024-02-24 00:41

　　智慧城市是科技赋予给社会的一个新的名词,而摄像头是建设智慧城市一个重要的基础设备。高效,有效的利用好摄像头信息能够在人们日常生活和维护社会秩序中发挥重要的作用。行人信息在摄像头信息中占有很大的比例,通过摄像头中的行人信息,可以进行行人检索,行人识别和行人重识别。因此,对于行人信息的研究有着很强的现实意义。本文是对自然场景下行人属性信息进行识别。通过总结之前对于行人属性的研究工作,本文发现之前工作主要是探讨行人属性信息的存在性。然而,行人属性的位置信息在行人重识别等领域也有重要的作用,因此本文主要对如何获取行人属性位置信息进行研究。本文利用语义分割模型进行行人属性位置信息的获取。面对当前无可用行人属性语义分割数据集的状况,本文制作了第一个行人属性语义分割数据集。在此数据集基础上,本文利用不同语义分割框架进行实验,首先利用简单的语义分割模型进行可行性验证,验证了可以利用语义分割获取到行人属性的位置信息,之后利用精度更高更复杂的模型训练得出此数据集的miou基准值。针对得到的miou基准值,本文从属性类别、准确率、图片清晰度三个方面与miou进行了相关性分析,得出miou与属性数量占比、准确...

【文章页数】：68 页

【学位级别】：硕士

【部分图文】：

图2.2注意力模型网络拓扑

上部分模型由三个１＊１的卷积构成（每一个卷积都带有ｂａｔｃｈ?ｎｏｒｍａｌｉｚａｔｉｏｎ??和ＲｅＬＵ层），最后的输出为１＊１＊Ｃ?（Ｃ为属性的个数）。文中将该输出称作属??性注意力映射ｗ，之后忒，ｗ进行一个空间ｓｏｆｔｍａｘ运算，这步运算使得模型将??资源集中于图片中最相关的区....

图３－１全卷积网络实现图??将全连接层变为全卷积层一定程度上提升了运算效率

北京邮电大学工学硕士学位论文的创新：（１）将原始网络中最后几层全连接层全部变成了卷跃结构，进一步提升了识别准确率。??层??卷积神经网络包括ＡｌｅｘＮｅｔ、ＶＧＧ等网络，这些网络对于图的要求，这是因为卷积神经网络在判断图片物体类型时，需几层全连接层，以达到最后一层是一个大小为分类....

图３－３?ｄｅｅｐ】ａｂｖ３＋模型框架图??１）?Ａｔｒｏｕｓ?ｃｏｎｖｏｌｕｔｉｏｎ?原理??

％?２ｘ?ｃｏｎｖ?７??图３－２?ＦＣＮ跳跃结构??图中将Ｃ〇ｎｖ７使用二进制插值法进行二倍的上采样，之后与Ｐ〇〇１４的特征矩??阵进行融合，ＦＣＮ称这种结构为１６ｓ。同理，ＦＣＮ将ｃｏｎｖ７和ｐｏｏｌ４的特征分别??使用二进制插值法做４倍和２倍的上采样，将结果与ｐｏｏｌ３进行....

图３－２?ＦＣＮ跳跃结构??图中将Ｃ〇ｎｖ７使用二进制插值法进行二倍的上采样，之后与Ｐ〇〇１４的特征矩??

基于?Ａｔｒｏｕｓ?ｃｏｎｖｏｌｕｔｉｏｎ?的?Ａｔｒｏｕｓ?Ｓｐａｔｉａｌ?Ｐｙｒａｍｉｄ?Ｐｏｏｌｉｎｇ?（ＡＳＰＰ）。在此基础上，??为了提升运算效率，ｄｅｅｐｌａｂｖ３＋米取了?ｅｎｃｏｄｅｒ－ｄｅｃｏｄｅｒ结构，并且将Ｘｃｅｐｔｉｏｎ模??型加入到ｅｎｃｏｄｅｒ结构中。....

本文编号：3908241

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3908241.html

上一篇：新型电化学传感器的设计及其对细胞释放·OH监测的应用
下一篇：融合混合采样技术与Adaboost思想的不平衡数据分类学习算法的研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|