基于多特征分类的目标检测算法研究
发布时间:2021-09-29 00:50
随着科技的发展和网络通讯的广泛应用,图像信息爆炸式的增长使人们对图像处理技术的需求日渐扩大,目标检测也随之成为当前机器视觉领域和计算机领域的研究重点。精确的目标检测是后续图像识别、跟踪、匹配、检索等智能分析处理过程顺利进行的必要条件。但在目标检测过程中往往存在检测场景复杂、阴影遮挡、光照变化以及单一特征信息利用不充分等问题。为有效避免外部干扰,提高复杂场景下目标检测的准确性,本文对基于多特征分类的目标检测算法进行了深入研究,主要研究内容如下:(1)对单一特征的提取方法进行了研究与分析,着重研究了纹理特征提取中的LBP(Local Binary Pattern)方法,边缘特征提取中的Canny算子和Sobel算子,以及颜色特征提取中的颜色直方图和颜色矩的相关概念。为方便后续图像预处理阶段的研究和分类算法的改进,对稀疏理论和支持向量机的基本理论进行了深入研究。(2)在图像预处理阶段,研究了噪声的分类、常见的几种噪声和去噪对比算法——Wiener滤波、LPG-PCA(Principal Component Analysis with Local Pixel Grouping)和K-SVD之后...
【文章来源】:山东理工大学山东省
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
基于模板匹配的目标检测方法流程示意图
山东理工大学硕士学位论文第一章绪论4模型对于平移和缩放都是不变的,但它们对旋转高度敏感[16]。解决旋转问题的最常用解决方案是通过添加旋转图像来增强训练数据,但是,对于大型数据集,数据扩充并不总是可行的方案。此外,通过向现有训练数据集添加更多数据,数据的大小会增加,并且系统需要在扩充的数据集上进行重新训练。考虑到这些问题,在训练数据有限的许多应用中或在测试集中的数据可能发生许多变化(例如旋转和噪声)的情况下,仍然需要手工制作的特征。因此,本文利用多特征融合的方式——多核学习(MKL)技术拓展手工制作的特征来克服单一特征的缺陷,并通过对SVM分类器参数的优化提高其分类性能,使目标检测效果达到实际需求。图1.2基于图像分类的目标检测方法流程示意图Fig.1.2Schematicdiagramofobjectdetectionmethodbasedonimageclassification1.2.2目标检测应用领域研究现状目标检测作为机器视觉领域的核心问题之一,在大规模图像检索、车辆自动驾驶、视觉人机交互、机器人环境感知、智能视频监控、医学图像分析等领域都有广泛的应用。(1)自动驾驶领域国外发达国家早在20世纪70年代就已经开始对无人驾驶技术的研究,Google公司就是其突出代表,随后各个企业也纷纷加入,特斯拉公司后来者居上,在自动化
山东理工大学硕士学位论文第二章相关理论和算法9第二章相关理论和算法2.1纹理特征提取图像纹理是区域具有的典型特征之一,是在图像计算中经过量化的图像特征。它体现的是物体表面的机构组织排列属性,描述了图像或者图像的区域所对应景物的表面性质。纹理特征提取分为基于统计数据和基于结构这两种方法,前者适用于人工合成的纹理识别,后者则是适用于交通图像的纹理识别。常用的特征描述子有LBP、HOG、Harris等,下面以LBP为例,介绍原始LBP及其变种。2.1.1原始的LBPLBP是Ojala等人[35]在1994年首次提出并于2002年进一步完善的特征提取方法,它是一个非常强大的局部纹理描述器。原始的LBP算子定义为在3*3的窗口内,通过比较窗口的中心像素的灰度值与相邻的8个像素的灰度值来标记位置,标记周围像素值大于中心像素值的位置为1,反之,标记为0。这样就可以得到一个8位的二进制数,为了方便表示,通常也会将其转化为10进制,即LBP码(共256种)。将得到的数值作为窗口中心像素点的LBP值以反映这个区域里的纹理信息。下图2.1是LBP算子的示意图。图2.1LBP算子示意图Fig.2.1SchematicdiagramofLBPoperator此时,窗口中心像素点的LBP值为10(01111100)124。81(,)(()())2pccpLBPxysIpIc(2.1)式中,p表示在3*3的窗口中除中心像素以外的第p个像素点,I(p)表示该邻域内的第p个像素点的灰度值,I(c)表示的是中心像素点的灰度值。s(x)由式(2.2)定义:
本文编号:3412870
【文章来源】:山东理工大学山东省
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
基于模板匹配的目标检测方法流程示意图
山东理工大学硕士学位论文第一章绪论4模型对于平移和缩放都是不变的,但它们对旋转高度敏感[16]。解决旋转问题的最常用解决方案是通过添加旋转图像来增强训练数据,但是,对于大型数据集,数据扩充并不总是可行的方案。此外,通过向现有训练数据集添加更多数据,数据的大小会增加,并且系统需要在扩充的数据集上进行重新训练。考虑到这些问题,在训练数据有限的许多应用中或在测试集中的数据可能发生许多变化(例如旋转和噪声)的情况下,仍然需要手工制作的特征。因此,本文利用多特征融合的方式——多核学习(MKL)技术拓展手工制作的特征来克服单一特征的缺陷,并通过对SVM分类器参数的优化提高其分类性能,使目标检测效果达到实际需求。图1.2基于图像分类的目标检测方法流程示意图Fig.1.2Schematicdiagramofobjectdetectionmethodbasedonimageclassification1.2.2目标检测应用领域研究现状目标检测作为机器视觉领域的核心问题之一,在大规模图像检索、车辆自动驾驶、视觉人机交互、机器人环境感知、智能视频监控、医学图像分析等领域都有广泛的应用。(1)自动驾驶领域国外发达国家早在20世纪70年代就已经开始对无人驾驶技术的研究,Google公司就是其突出代表,随后各个企业也纷纷加入,特斯拉公司后来者居上,在自动化
山东理工大学硕士学位论文第二章相关理论和算法9第二章相关理论和算法2.1纹理特征提取图像纹理是区域具有的典型特征之一,是在图像计算中经过量化的图像特征。它体现的是物体表面的机构组织排列属性,描述了图像或者图像的区域所对应景物的表面性质。纹理特征提取分为基于统计数据和基于结构这两种方法,前者适用于人工合成的纹理识别,后者则是适用于交通图像的纹理识别。常用的特征描述子有LBP、HOG、Harris等,下面以LBP为例,介绍原始LBP及其变种。2.1.1原始的LBPLBP是Ojala等人[35]在1994年首次提出并于2002年进一步完善的特征提取方法,它是一个非常强大的局部纹理描述器。原始的LBP算子定义为在3*3的窗口内,通过比较窗口的中心像素的灰度值与相邻的8个像素的灰度值来标记位置,标记周围像素值大于中心像素值的位置为1,反之,标记为0。这样就可以得到一个8位的二进制数,为了方便表示,通常也会将其转化为10进制,即LBP码(共256种)。将得到的数值作为窗口中心像素点的LBP值以反映这个区域里的纹理信息。下图2.1是LBP算子的示意图。图2.1LBP算子示意图Fig.2.1SchematicdiagramofLBPoperator此时,窗口中心像素点的LBP值为10(01111100)124。81(,)(()())2pccpLBPxysIpIc(2.1)式中,p表示在3*3的窗口中除中心像素以外的第p个像素点,I(p)表示该邻域内的第p个像素点的灰度值,I(c)表示的是中心像素点的灰度值。s(x)由式(2.2)定义:
本文编号:3412870
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3412870.html
最近更新
教材专著