基于感知哈希和自适应搜索的通用对象检测
发布时间:2019-10-01 23:23
【摘要】:针对数字图像中对象检测问题,提出一种基于感知哈希和搜索策略的通用对象检测算法,提取图像中有可能包含对象的子区域并以矩形的形式输出。算法首先对输入图像进行分割,并计算该图像的显著度信息;其次根据图像每个子区域显著度信息,自适应地确定搜索策略的起始子区域;最终利用选择性搜索策略,实现图像中通用对象检测。利用选择性搜索策略检测通用对象时,引入感知哈希算法实现相邻子区域的相似度计算,在保证准确度的基础上简化算法复杂度。实验结果显示,本文算法具有良好的图像对象检测准确度。
【图文】:
计算非常简单快速,同时又保持一定的准确率。因此,引入感知哈希计算图像不同子区域间的相似度。一般来说,感知哈希算法包含平均哈希和基于离散余弦变换(DCT)的哈希两种方法。所谓平均哈希指的是一个区域内的所有像素值与像素均值相比较的结果确定像素的哈希值:当像素值大于均值时,像素的哈希值设置为1,否则设置为0。该算法的优点是计算简单,缺点是易受噪声等因素影响。相比于平均哈希算法,基于DCT的哈希算法利用DCT代替像素均值,这使得算法更具鲁棒性。该算法的基本流程如图3所示。图像子区域经过DCT处理后会得到一个二维系数矩阵图如图4所示,系数矩阵从左上角到右下角频率由低到高。由图可以发现,经过DCT处理后的系数矩阵绝大多数数据都集中在左上角。换句话说,图像中绝大部分能量都集中于左上角低频区域。因此,只需利用该系数矩阵左上角的局部信息来进行二值化处理。基于DCT的哈希算法具体如下:1)输入图像子区域,并转换为灰度信息;2)调用DCT对图像子区域进行处理,计算得到系数矩阵;3)选取系数矩阵左上角子区域(左上角8×8的子矩阵),并计算该矩阵的均值;4)比较DCT系数矩阵8×8子矩阵与其均值,大于等于均值的被赋值为1,否则为0;5)输出64维的哈希值。一旦计算得到了不同图像子区域的64维哈希值,下一步就是如何根据哈希值确定它们之间的相似度。采用汉明距离(Hammingdistance)计算不同图像子区域间哈希值的相似度为d(H1,H2)=∑ni=1(h1鄽h2)(1)其中:H1和H2分别
图4基于DCT的感知哈希计算示意图:(a)原始图像;(b)待计算的子区域;(c)子区域的DCT矩阵;(d)DCT矩阵左上角8×8子集Fig.4SchematicdiagramsofDCTbasedperceptualhashingalgorithm:(a)Inputimage;(b)Asub-regionwithintheinputimage;(c)DCTmatrixofthesub-region;(d)Upper-left8×8subsetoftheDCTmatrix4性能测试4.1室验设计采用VOC2007图像数据库。该数据库包含20个类别共4952幅不同背景下获取的图像,如图5所示。较常见的衡量通用对象检测的性能指标是召回率(recall)。然而,如图6所示,检测的输出结果尽管覆盖了几乎全部的人工标注区域,召回率高达96.6%,但包含了过多的非标注区域,很明显召回率无法准确说明通用对象检测结果。因此,,采用(M-ABO,meanaveragebestoverlap)[2]测试通用对象检测的性能。M-ABO中,ABO为ABO=1|Gc|∑gc
本文编号:2544625
【图文】:
计算非常简单快速,同时又保持一定的准确率。因此,引入感知哈希计算图像不同子区域间的相似度。一般来说,感知哈希算法包含平均哈希和基于离散余弦变换(DCT)的哈希两种方法。所谓平均哈希指的是一个区域内的所有像素值与像素均值相比较的结果确定像素的哈希值:当像素值大于均值时,像素的哈希值设置为1,否则设置为0。该算法的优点是计算简单,缺点是易受噪声等因素影响。相比于平均哈希算法,基于DCT的哈希算法利用DCT代替像素均值,这使得算法更具鲁棒性。该算法的基本流程如图3所示。图像子区域经过DCT处理后会得到一个二维系数矩阵图如图4所示,系数矩阵从左上角到右下角频率由低到高。由图可以发现,经过DCT处理后的系数矩阵绝大多数数据都集中在左上角。换句话说,图像中绝大部分能量都集中于左上角低频区域。因此,只需利用该系数矩阵左上角的局部信息来进行二值化处理。基于DCT的哈希算法具体如下:1)输入图像子区域,并转换为灰度信息;2)调用DCT对图像子区域进行处理,计算得到系数矩阵;3)选取系数矩阵左上角子区域(左上角8×8的子矩阵),并计算该矩阵的均值;4)比较DCT系数矩阵8×8子矩阵与其均值,大于等于均值的被赋值为1,否则为0;5)输出64维的哈希值。一旦计算得到了不同图像子区域的64维哈希值,下一步就是如何根据哈希值确定它们之间的相似度。采用汉明距离(Hammingdistance)计算不同图像子区域间哈希值的相似度为d(H1,H2)=∑ni=1(h1鄽h2)(1)其中:H1和H2分别
图4基于DCT的感知哈希计算示意图:(a)原始图像;(b)待计算的子区域;(c)子区域的DCT矩阵;(d)DCT矩阵左上角8×8子集Fig.4SchematicdiagramsofDCTbasedperceptualhashingalgorithm:(a)Inputimage;(b)Asub-regionwithintheinputimage;(c)DCTmatrixofthesub-region;(d)Upper-left8×8subsetoftheDCTmatrix4性能测试4.1室验设计采用VOC2007图像数据库。该数据库包含20个类别共4952幅不同背景下获取的图像,如图5所示。较常见的衡量通用对象检测的性能指标是召回率(recall)。然而,如图6所示,检测的输出结果尽管覆盖了几乎全部的人工标注区域,召回率高达96.6%,但包含了过多的非标注区域,很明显召回率无法准确说明通用对象检测结果。因此,,采用(M-ABO,meanaveragebestoverlap)[2]测试通用对象检测的性能。M-ABO中,ABO为ABO=1|Gc|∑gc
本文编号:2544625
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2544625.html