交通标志检测算法及其应用研究
发布时间:2021-09-03 16:13
交通标志是交通系统中的一种重要设施,在无人驾驶系统的多个领域也发挥着作用。在感知中,需要准确地识别出交通标志的类别以辅助进行驾驶决策;在建图和定位中,需要稳定地检测出交通标志的图像分割。本文针对无人驾驶对交通标志的感知需求,分别提出了交通标志的检测与分割算法,并提出了一种使用交通标志进行车辆自定位的算法。对于交通标志检测任务,本文提出了一种细粒度的层次架构目标检测网络。交通标志通常具有上百个细粒度类别,很多类别形状颜色十分相似,而传统目标检测网络对细粒度类别常常识别不准,容易出现误分类。本文利用细粒度类别可以聚合为几个超类的特性,首先对超类进行目标检测,对检测结果共享超类网络的特征层,提出了带标签的RoIPooling操作,并到对应的超类分支上进行细粒度分类,从而实现了一个端对端的细粒度检测网络。实验显示提出的方法能获得很好的准确率,并对细粒度类别识别准确。对于交通标志分割任务,本文提出了一种基于边缘提取的分割算法。图像分割网络常常需要大量的图像标注数据,并占用很多计算资源,而交通标志具有明确的几何形状特征,可以通过直接提取边缘信息获得其分割结果。本文在目标检测结果的基础上,首先提取边...
【文章来源】:上海交通大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:84 页
【学位级别】:硕士
【部分图文】:
目标检测网络发展时间线
上海交通大学硕士学位论文4骤,使得整个流程分两个阶段。一阶段检测框架。不需要进行候选区域提取,直接使用滑动窗口进行检测。这是一种端对端的一阶段网络。1.基于候选区域的方法(两阶段框架)在基于候选区域的框架中,一般需要先从图像中提取出与类别无关的候选区域,然后使用卷积神经网络从这些区域提取特征,最后使用分类器来确定候选区域的类别。卷积神经网络(CNN)最早大显身手的就是图像特征提取,在早期OverFeat[2]和RCNN[3]几乎独立且同时提出使用CNN进行目标特征的提取,并实现目标检测。在这一阶段中,一般候选区域使用其他方法(比如SelectiveSearch)从图像中获得,而并没有将候选区域提取与卷积神经网络融合到一个统一的网络中,直到FasterR-CNN[1]的出现。图1-2FasterR-CNN网络结构Fig.1-2FasterR-CNNFrameworkFasterR-CNN:在FasterR-CNN[1]出现之前,尽管FastR-CNN已经显著地加快了检测过程,但它仍然依赖于外部提供的候选区域。候选区域成为了目标检测网络的瓶颈。因而,在FasterR-CNN中,提出了一个有效和准确的候选区域网络RPN(RegionProposalNetwork)来生成候选区域。RPN和FasterR-CNN共享前面的卷积层。最后一个共享卷积层的特征用于进行候选区域的提取和分类。RPN首先在每个特征图每个位置上初始化k种尺度和纵横比的n×n参考框(anchor)。每个n×n的anchor被映射到低维的向量矢量(例如ZF为256,VGG为512),它被送入两个相邻的全连接层:一个类别分类层和一个包围盒回归层。
上海交通大学硕士学位论文5与FastR-CNN不同,RPN中用于回归的特征具有相同的维度大校RPN与FasterR-CNN共享卷积层,从而实现高效的区域提取计算。事实上,RPN是一种完全卷积网络FCN(FullyConvolutionalNetwork)。也就是说,FasterR-CNN是纯粹基于CNN的框架,而不使用其他人工实现的算法。使用VGG16模型的FasterR-CNN可以在GPU上以5fps进行测试,每张图像生成300个候选区域,在PASCALVOC2007上获得了最好的目标检测精度。基于FasterR-CNN的改进网络众多,涌现了很多具有创造力和有效的方法。一般来说都是针对某个小方面,如多尺度目标检测、小目标检测等进行改进。针对特征融合进行改进的网络包括MS-CNN[4],HyperNet[5],RefineDet[6]和FPN[7],特征融合后对尺度变化大的目标,以及小目标的效果有所提升。除此之外,还有引入空间变换来辅助进行检测的STDN[8]。图1-3RFCN网络结构Fig.1-3RFCNframeworkRFCN(RegionbasedFullyConvolutionalNetwork):虽然FasterR-CNN比FastR-CNN快一个数量级,但是每个RoI仍然需要分别计算后续的特征,而每张图中基本上都有几百个RoI。在FasterR-CNN中,无法共享RoIPooling层之后的计算。一个自然的想法是尽量减少无法共享的计算量,即除了最后一层分类层之外,前面均共享特征。RFCN[9]提出了一种特殊的卷积层来引入位置信息,先在卷积层上完成预测,再做RoIPooling,最后直接进行分类和回归,这样大大减少了需要进行的计算量,而最大限度的共享了卷积特征。实验表明使用ResNet101的RFCN可以达到与FasterR-CNN相当的精度,并
【参考文献】:
期刊论文
[1]基于部分惯性传感器信息的单目视觉同步定位与地图创建方法[J]. 顾照鹏,董秋雷. 计算机辅助设计与图形学学报. 2012(02)
[2]基于全景视觉的移动机器人同步定位与地图创建研究[J]. 许俊勇,王景川,陈卫东. 机器人. 2008(04)
本文编号:3381438
【文章来源】:上海交通大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:84 页
【学位级别】:硕士
【部分图文】:
目标检测网络发展时间线
上海交通大学硕士学位论文4骤,使得整个流程分两个阶段。一阶段检测框架。不需要进行候选区域提取,直接使用滑动窗口进行检测。这是一种端对端的一阶段网络。1.基于候选区域的方法(两阶段框架)在基于候选区域的框架中,一般需要先从图像中提取出与类别无关的候选区域,然后使用卷积神经网络从这些区域提取特征,最后使用分类器来确定候选区域的类别。卷积神经网络(CNN)最早大显身手的就是图像特征提取,在早期OverFeat[2]和RCNN[3]几乎独立且同时提出使用CNN进行目标特征的提取,并实现目标检测。在这一阶段中,一般候选区域使用其他方法(比如SelectiveSearch)从图像中获得,而并没有将候选区域提取与卷积神经网络融合到一个统一的网络中,直到FasterR-CNN[1]的出现。图1-2FasterR-CNN网络结构Fig.1-2FasterR-CNNFrameworkFasterR-CNN:在FasterR-CNN[1]出现之前,尽管FastR-CNN已经显著地加快了检测过程,但它仍然依赖于外部提供的候选区域。候选区域成为了目标检测网络的瓶颈。因而,在FasterR-CNN中,提出了一个有效和准确的候选区域网络RPN(RegionProposalNetwork)来生成候选区域。RPN和FasterR-CNN共享前面的卷积层。最后一个共享卷积层的特征用于进行候选区域的提取和分类。RPN首先在每个特征图每个位置上初始化k种尺度和纵横比的n×n参考框(anchor)。每个n×n的anchor被映射到低维的向量矢量(例如ZF为256,VGG为512),它被送入两个相邻的全连接层:一个类别分类层和一个包围盒回归层。
上海交通大学硕士学位论文5与FastR-CNN不同,RPN中用于回归的特征具有相同的维度大校RPN与FasterR-CNN共享卷积层,从而实现高效的区域提取计算。事实上,RPN是一种完全卷积网络FCN(FullyConvolutionalNetwork)。也就是说,FasterR-CNN是纯粹基于CNN的框架,而不使用其他人工实现的算法。使用VGG16模型的FasterR-CNN可以在GPU上以5fps进行测试,每张图像生成300个候选区域,在PASCALVOC2007上获得了最好的目标检测精度。基于FasterR-CNN的改进网络众多,涌现了很多具有创造力和有效的方法。一般来说都是针对某个小方面,如多尺度目标检测、小目标检测等进行改进。针对特征融合进行改进的网络包括MS-CNN[4],HyperNet[5],RefineDet[6]和FPN[7],特征融合后对尺度变化大的目标,以及小目标的效果有所提升。除此之外,还有引入空间变换来辅助进行检测的STDN[8]。图1-3RFCN网络结构Fig.1-3RFCNframeworkRFCN(RegionbasedFullyConvolutionalNetwork):虽然FasterR-CNN比FastR-CNN快一个数量级,但是每个RoI仍然需要分别计算后续的特征,而每张图中基本上都有几百个RoI。在FasterR-CNN中,无法共享RoIPooling层之后的计算。一个自然的想法是尽量减少无法共享的计算量,即除了最后一层分类层之外,前面均共享特征。RFCN[9]提出了一种特殊的卷积层来引入位置信息,先在卷积层上完成预测,再做RoIPooling,最后直接进行分类和回归,这样大大减少了需要进行的计算量,而最大限度的共享了卷积特征。实验表明使用ResNet101的RFCN可以达到与FasterR-CNN相当的精度,并
【参考文献】:
期刊论文
[1]基于部分惯性传感器信息的单目视觉同步定位与地图创建方法[J]. 顾照鹏,董秋雷. 计算机辅助设计与图形学学报. 2012(02)
[2]基于全景视觉的移动机器人同步定位与地图创建研究[J]. 许俊勇,王景川,陈卫东. 机器人. 2008(04)
本文编号:3381438
本文链接:https://www.wllwen.com/kejilunwen/qiche/3381438.html