基于语义分割的行人属性识别技术的研究与实现
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
图2.2注意力模型网络拓扑
上部分模型由三个1*1的卷积构成(每一个卷积都带有batch?normalization??和ReLU层),最后的输出为1*1*C?(C为属性的个数)。文中将该输出称作属??性注意力映射w,之后忒,w进行一个空间softmax运算,这步运算使得模型将??资源集中于图片中最相关的区....
图3-1全卷积网络实现图??将全连接层变为全卷积层一定程度上提升了运算效率
北京邮电大学工学硕士学位论文的创新:(1)将原始网络中最后几层全连接层全部变成了卷跃结构,进一步提升了识别准确率。??层??卷积神经网络包括AlexNet、VGG等网络,这些网络对于图的要求,这是因为卷积神经网络在判断图片物体类型时,需几层全连接层,以达到最后一层是一个大小为分类....
图3-3?deep】abv3+模型框架图??1)?Atrous?convolution?原理??
%?2x?conv?7??图3-2?FCN跳跃结构??图中将C〇nv7使用二进制插值法进行二倍的上采样,之后与P〇〇14的特征矩??阵进行融合,FCN称这种结构为16s。同理,FCN将conv7和pool4的特征分别??使用二进制插值法做4倍和2倍的上采样,将结果与pool3进行....
图3-2?FCN跳跃结构??图中将C〇nv7使用二进制插值法进行二倍的上采样,之后与P〇〇14的特征矩??
基于?Atrous?convolution?的?Atrous?Spatial?Pyramid?Pooling?(ASPP)。在此基础上,??为了提升运算效率,deeplabv3+米取了?encoder-decoder结构,并且将Xception模??型加入到encoder结构中。....
本文编号:3908241
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3908241.html