当前位置:主页 > 科技论文 > 交通工程论文 >

基于语义分割的火车车厢位置检测研究

发布时间:2021-12-24 05:09
  为了实现在煤炭定量装车站装车过程中实时检测火车车厢位置,为溜槽升降提供触发信号,设计了一种基于语义分割的火车车厢位置检测模型。以FPN(feature pyramid networks,特征金字塔网络)和ResNet101(residual network,残差网络)为主干网络,提取并融合分辨率、语义强度不同的特征图;结合基于期望最大化(expectation maximization,EM)算法的注意力机制,构建车厢上边框语义分割模型,用于过滤特征图中的噪声,提高图像边界的语义分割精度;设计位置检测模块,计算语义分割后图像中各类别的面积及其比例和车厢上边框外接矩形高度,以获取火车车厢位置信息。结果表明,所构建的车厢上边框语义分割模型在测试集上的mIoU(mean intersection over union,均交并比)为81.21%,mPA(mean pixel accuracy,平均像素精度)为88.64%,相比未引入注意力机制的语义分割模型分别提升了3.91%和7.44%。在煤炭定量装车站现场进行的火车车厢位置检测试验结果表明,基于语义分割的火车车厢位置检测模型的检测精度满足煤... 

【文章来源】:工程设计学报. 2020,27(05)北大核心CSCD

【文章页数】:9 页

【部分图文】:

基于语义分割的火车车厢位置检测研究


基于语义分割的火车车厢位置检测模型总体框架

网络结构图,多尺度,特征提取,网络结构


多尺度特征提取与融合模块的网络结构如图2所示。首先,对输入图像自下往上逐层进行特征提取,在Res Net101最后一层输出{X2,X3,X4,X5},输出图像的像素分别为原输入图像的1/4,1/8,1/16和1/32。然后,通过1×1卷积(Conv 1×1)来减少高层强语义特征图的通道数量(此处将特征通道数量统一为256),并上采样至前一层特征图的像素,并与前一层高分辨率的特征图进行融合后得到新的特征图,表示为{P2,P3,P4,P5},这既利用了高层特征图的强语义信息,又利用了低层特征图的高分辨率信息。接着,分别将P2至P5层的特征图上采样到原输入图像像素的1/4,并将通道数量减少至128。最后,将4个层级的特征图进行拼接得到Xp,其中每个上采样阶段均包括3×3卷积(Conv 3×3)、Group Norm、Re LU(激活函数)和2倍双线性内插值上采样。多尺度特征提取与融合模块通过融合高层的低分辨率、强语义信息特征图和低层的高分辨率、弱语义信息特征图,恢复了在编码过程中因降低分辨率而丢失的信息,提高了多尺度目标的语义分割精度。1.3 注意力机制模块

特征图,注意力,特征图


基于注意力图与数据基重新估计得到新的特征图,采用式(4)和式(5)将重新估计后得到的特征图与原始特征图进行融合,以得到噪声更少、边缘信息更加丰富的特征图。式中:X"p表示注意力机制模块重新估计后得到的特征图;aT表示T次迭代后最终的权责;mT表示T次迭代后的数据基;⊕表示逐像素点相加的融合方式;P表示注意力机制模块输出的特征图。

【参考文献】:
期刊论文
[1]基于深度学习的图像语义分割方法综述[J]. 田萱,王亮,丁琪.  软件学报. 2019(02)
[2]一种基于视觉注意力机制的深度循环Q网络模型[J]. 刘全,翟建伟,钟珊,章宗长,周倩,章鹏.  计算机学报. 2017(06)
[3]一种基于期望最大化条件的电容层析成像图像重建算法[J]. 张云龙,陈德运,王莉莉.  哈尔滨理工大学学报. 2016(02)
[4]一种基于支持向量机和半监督期望最大化算法的分级图像标识方法(英文)[J]. 高彦宇,尹怡欣,UOZUMI Takashi.  自动化学报. 2010(07)

硕士论文
[1]基于语义分割的车载路面裂缝自动识别技术研究[D]. 魏芳.长安大学 2019
[2]基于高斯混合模型的图像分割的研究[D]. 欧垚江.北京交通大学 2015



本文编号:3549876

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jiaotonggongchenglunwen/3549876.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户aebdf***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com