基于学习的运动目标检测与跟踪技术研究
发布时间:2022-02-04 17:11
基于计算机视觉的运动目标检测与跟踪,广泛应用于视频监控、人机交互、靶场判读等领域,是当前计算机视觉领域的研究热点之一。在工程场景中,二者密不可分,需要协同完成具体任务。目前相关研究进展迅速,但是其时效性、准确性、自动化程度仍然有提高的空间。针对运动目标检测问题,本文提出了一种光流辅助的运动目标检测网络。通过训练光流深度网络,计算部分帧间光流,并选择自适应阈值将运动目标分割出来,从而生成用于背景减除网络的样本,最后用生成的样本训练小型背景减除网络。该方法在检测时只需要运行背景减除网络,避免了光流计算的时间消耗,解决了现有的基于背景减除的运动目标检测网络对人工标注的依赖,提高了运动目标检测的自动化程度。针对运动目标跟踪问题,本文提出了基于支持向量回归的跟踪器和对应的在线求解方法,证明了支持向量回归方法的优势。此外,本文提出了一种融合结构支持向量机和相关滤波的跟踪方法,通过设计两类跟踪器串联型的融合结构和交替式更新策略,将结构支持向量机对遮挡目标的重检测优势和相关滤波的尺度估计优势结合起来,提高了目标检测的鲁棒性和精确性。
【文章来源】:国防科技大学湖南省211工程院校985工程院校
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
基于背景建模的运动目标检测流程
国防科技大学研究生院硕士学位论文图1.2基于前景建模的运动目标检测流程量的工程实践,而学习的特征从样本中训练得到,前者实现相对容易而后者表达能力更强。人工特征大致分为梯度特征、模式特征、形状特征及颜色特征。其中,梯度特征通过计算空间方向上的梯度分布来描述目标,包括尺度不变特征SIFT[8]、PCA-SIFT[9]、梯度位置方向直方图特征GLOH[10]、加速鲁棒特征SURF[11]、雏菊花特征DAISY[12]、梯度直方图特征HOG[13]、v-HOG[14]、CoHOG[15]和GIST[16]等;模式特征通过局部区域的相对差异来描述目标,通常用于表示纹理,包括Gabor滤波器[17]、局部而二值模式LBP[18]、及其变种CS-LBP[19]和NR-LBP[20]、Haar-like[21]等;形状特征用于描述目标轮廓,包括形状上下文特征[22]、角矩阵特征[23]、k近邻分割[24]、图形基元[25]等;颜色特征通过计算局部的颜色分布来描述目标,包括包括颜色共生矩阵CCM[26]、颜色自相似性CCS[27]、HSV-SIFT[28]、Hue-SIFT[29]等。基于学习的特征大致可分为基于限制玻尔兹曼机RBM[30]、基于自编码器AE[31]和基于卷积神经网络CNN[32]的特征。其中,RBM层内单元没有连接关系而层间为全连接,AE通过编码和解码有效去除信号中的冗余信息,而CNN采用层间局部连接的方式极大地减少了网络参数,且其高层特征具有明显的语义信息。分类器可以分为基于逻辑的方法、基于统计的方法、支持向量机方法和集成方法。基于逻辑的方法主要指决策树(DecisionTree)方法,如C4.5方法[33],决策树的节点代表对特征中某一属性划分,从上至下递归生成子节点,并通过减枝来防止过拟合,决策树方法通用性好但是训练耗时。基于统计的方法包括贝叶斯方法和基于实例的方法,贝叶斯方法通过建立特征与类别直接的条件概率模型进行分类,其?
国防科技大学研究生院硕士学位论文高维空间从而使得样本线性可分,是目标检测和跟踪领域最常用的分类器。随着特征维度增加,单个分类器很实现较好的分类效果,可以将多个分类器集成在一起,Bagging[38]、Boosting[39]和随机森林(RandomForest)[41]等集成方法将弱分类器组合为强分类器提升分类效果。图1.3给出了典型分类器的实例。图1.3典型分类器[40]1.2.1.3基于深度学习的目标检测基于深度学习的目标检测遵循前景建模的先特征提取再目标定位的思路,但不含有显式地分类模块,而是通过端到端(End-to-End)的卷积神经网络(ConvolutionNeuralNetwork,CNN)结构设计,通过训练同时提高网络的特征提取和目标分类能力。基于深度学习的目标检测分为基于分类的方法和基于回归的方法。基于分类的方法通过分类当前待检窗口(RegionofInterest,ROI)属于前景还是背景来定位目标。Girshick提出的R-CNN[42]方法首先通过选择性搜索(SelectiveSearch)策略产生一系列的ROI,并将ROI尺寸规则化输入特征提取网络提取其CNN特征,然后训练特征分类的SVM分类器,并通过BoundingBox回归进一步提高定位的准确性。He提出的SPP-Net[43]将R-CNN特征提取的最后一个卷积层后的池化层替换为空间金字塔池化层(SpatialPyramidPooling,SPP),生成长度固定的特征输入到全连接层,无需将ROI的尺寸规则化,提高网络的实用性和鲁棒性。考虑到R-CNN、SPP-Net对重叠的ROI存在冗余的特征提取,而且训练仍是多阶段的,Girshick提出FastR-CNN[44],只需对原始输入图像提取一次特征,经过ROIPooling层使得每个ROI用相同维度的特征描述之后,训练分类网络和区域第4页
本文编号:3613605
【文章来源】:国防科技大学湖南省211工程院校985工程院校
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
基于背景建模的运动目标检测流程
国防科技大学研究生院硕士学位论文图1.2基于前景建模的运动目标检测流程量的工程实践,而学习的特征从样本中训练得到,前者实现相对容易而后者表达能力更强。人工特征大致分为梯度特征、模式特征、形状特征及颜色特征。其中,梯度特征通过计算空间方向上的梯度分布来描述目标,包括尺度不变特征SIFT[8]、PCA-SIFT[9]、梯度位置方向直方图特征GLOH[10]、加速鲁棒特征SURF[11]、雏菊花特征DAISY[12]、梯度直方图特征HOG[13]、v-HOG[14]、CoHOG[15]和GIST[16]等;模式特征通过局部区域的相对差异来描述目标,通常用于表示纹理,包括Gabor滤波器[17]、局部而二值模式LBP[18]、及其变种CS-LBP[19]和NR-LBP[20]、Haar-like[21]等;形状特征用于描述目标轮廓,包括形状上下文特征[22]、角矩阵特征[23]、k近邻分割[24]、图形基元[25]等;颜色特征通过计算局部的颜色分布来描述目标,包括包括颜色共生矩阵CCM[26]、颜色自相似性CCS[27]、HSV-SIFT[28]、Hue-SIFT[29]等。基于学习的特征大致可分为基于限制玻尔兹曼机RBM[30]、基于自编码器AE[31]和基于卷积神经网络CNN[32]的特征。其中,RBM层内单元没有连接关系而层间为全连接,AE通过编码和解码有效去除信号中的冗余信息,而CNN采用层间局部连接的方式极大地减少了网络参数,且其高层特征具有明显的语义信息。分类器可以分为基于逻辑的方法、基于统计的方法、支持向量机方法和集成方法。基于逻辑的方法主要指决策树(DecisionTree)方法,如C4.5方法[33],决策树的节点代表对特征中某一属性划分,从上至下递归生成子节点,并通过减枝来防止过拟合,决策树方法通用性好但是训练耗时。基于统计的方法包括贝叶斯方法和基于实例的方法,贝叶斯方法通过建立特征与类别直接的条件概率模型进行分类,其?
国防科技大学研究生院硕士学位论文高维空间从而使得样本线性可分,是目标检测和跟踪领域最常用的分类器。随着特征维度增加,单个分类器很实现较好的分类效果,可以将多个分类器集成在一起,Bagging[38]、Boosting[39]和随机森林(RandomForest)[41]等集成方法将弱分类器组合为强分类器提升分类效果。图1.3给出了典型分类器的实例。图1.3典型分类器[40]1.2.1.3基于深度学习的目标检测基于深度学习的目标检测遵循前景建模的先特征提取再目标定位的思路,但不含有显式地分类模块,而是通过端到端(End-to-End)的卷积神经网络(ConvolutionNeuralNetwork,CNN)结构设计,通过训练同时提高网络的特征提取和目标分类能力。基于深度学习的目标检测分为基于分类的方法和基于回归的方法。基于分类的方法通过分类当前待检窗口(RegionofInterest,ROI)属于前景还是背景来定位目标。Girshick提出的R-CNN[42]方法首先通过选择性搜索(SelectiveSearch)策略产生一系列的ROI,并将ROI尺寸规则化输入特征提取网络提取其CNN特征,然后训练特征分类的SVM分类器,并通过BoundingBox回归进一步提高定位的准确性。He提出的SPP-Net[43]将R-CNN特征提取的最后一个卷积层后的池化层替换为空间金字塔池化层(SpatialPyramidPooling,SPP),生成长度固定的特征输入到全连接层,无需将ROI的尺寸规则化,提高网络的实用性和鲁棒性。考虑到R-CNN、SPP-Net对重叠的ROI存在冗余的特征提取,而且训练仍是多阶段的,Girshick提出FastR-CNN[44],只需对原始输入图像提取一次特征,经过ROIPooling层使得每个ROI用相同维度的特征描述之后,训练分类网络和区域第4页
本文编号:3613605
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3613605.html