大规模图像数据中相似图像的快速搜索
发布时间:2020-08-31 15:07
大规模图像数据中的相似图像搜索是计算机视觉研究中的经典内容,也是近年来有着广泛应用的一个课题。相似图像搜索所要解决的问题是,给定一个查询图像,需要从图像数据库中检索到与之内容相同或相似的图像。当数据库中图像的数据规模很大时,一个相似图像搜索系统面临着搜索速度、存储代价、返回结果准确性等诸方面的问题。其中,搜索的实时性往往是大规模图像搜索中的关键问题。本文围绕在大规模图像数据中快速搜索相似图像这一问题,首先介绍了目前在图像表达上的主流图像特征,然后介绍了作者所做的三个方面的研究工作。第一方面是图像数据集的高效创建。目前常用的深层图像特征,需要使用大量的图像数据进行训练。作者基于自动编码器中数据的重建误差对数据是否为杂质的指示性作用,提出了可以使重建误差具有更强的指示性的算法。用该算法可以自动去除图像集合中的杂质,得到干净的数据集用于深度学习的训练。另一方面是关于图像特征的倒排索引,作者提出了一种联合倒排索引方法。在传统的倒排索引方法中,对图像特征空间的多次划分都是随机的或独立的。而在联合倒排索引中,作者考虑了图像特征空间多次划分之间的互补性,并对之进行优化。通过联合倒排索引,从上亿图像中单机搜索出相似图像候选集仅需毫秒量级时间,并且返回结果的准确性较目前主流算法大大提高。还有一方面是在图像特征的快速排序中,作者提出了稀疏投影编码算法。在图像特征的快速排序的研究中,近年来主流的做法是将图像的特征进行哈希编码,通过计算哈希码之间的汉明距离来对候选图像进行排序。由于哈希码存储空间小并且汉明距离可以快速计算,因此这种方法被广泛采用。但是,在进行哈希编码时,目前主流方法均引入了一个稠密的正交矩阵对图像的特征进行投影,使得编码步骤耗费大量时间。尤其是当图像特征维度变大时,稠密投影将耗费更多时间。本文提出采用稀疏矩阵进行投影以减小计算代价,这样不仅可以加快哈希编码的速度,而且可以在一定程度上缓解优化模型中的过拟合问题。在以最小化编码误差为目标求解这个稀疏投影矩阵时,作者采用了分离变量法:引入辅助变量并惩罚该辅助变量与真实变量之间的差异。采用迭代法优化这个问题,最终求得一个稀疏的矩阵用于图像特征的投影和编码。作者在多个数据集上进行了各种定量实验,实验结果证明了以上工作相对于目前主流算法的优越性。另外,基于所提出的联合倒排索引算法和稀疏投影编码的算法,作者在大规模的图像数据上实现了一个相似图像搜索系统。在该系统上的定性实验的也证明了本文所提出算法的有效性和可行性。
【学位单位】:中国科学技术大学
【学位级别】:博士
【学位年份】:2015
【中图分类】:TP391.41
【部分图文】:
颜色空间的数值大小。当图像被进行拉伸、旋转、加滤镜等变化后,一个点的逡逑像素值会产生巨大的变化。而且,通过一些独立的像素点并不能描述图像的全逡逑局甚至局部。因此,图像的像素值并不具有语义区分性(如图2.1(a)所示)。逡逑实际上,图像可W被认为是由许多因素非线性结合而构成的。比如一副包逡逑含狗的图像,可认为它是由一只狗、狗的姿态、当前的光照、所在场景等因逡逑素共同构成。如果想要区分包含狗和猫的图像,就需要用来描述图像的特征具逡逑有区分里面所包含物体的能力,也就是具有非线性抽象的能力。对于送个狗和逡逑猫的例子,假如有一种图像特征的每个维度分别能区分狗和猫的不同特性,(如逡逑图2.1(b),两个维度分别能表示耳朵的尖锐程度和鼻子的相对大小),那么该特逡逑征便是一种在区分狗和猫的图像上有区分性的特征。逡逑S冒返耐枷皴濉ǖ耐枷皴义细龈鲥义蠠a逦令逡逑媻逦A逦K邋\逦▲逡逑▲逦?逦衣邋\邋▲邋A逡逑?逦巧逦\逡逑▲逦中逦\逦▲逡逑?逦?逦恤邋1:逦?逦\逡逑A邋?逦?逦▲逡逑S缅危苠义喜五濉危垮危苠义希垮澹苠义舷袼劐味浼馊穸儒义希ǎ幔┪耷中缘耐枷裉卣麇危ǎ猓┯星中缘耐枷裉卣麇义贤迹玻蓖枷裉卣魇欠窬哂杏镆迩中缘氖疽馔煎义先绾文艽油枷裰刑崛∮杏镆迩中缘奶卣髂兀孔陨鲜兰湍┲两瘢芯空呙清义咸岢隽烁髦址椒ɡ瓷杓坪脱巴枷裉卣鳌8萜渌弑傅姆窍咝猿橄竽芰
本文编号:2808971
【学位单位】:中国科学技术大学
【学位级别】:博士
【学位年份】:2015
【中图分类】:TP391.41
【部分图文】:
颜色空间的数值大小。当图像被进行拉伸、旋转、加滤镜等变化后,一个点的逡逑像素值会产生巨大的变化。而且,通过一些独立的像素点并不能描述图像的全逡逑局甚至局部。因此,图像的像素值并不具有语义区分性(如图2.1(a)所示)。逡逑实际上,图像可W被认为是由许多因素非线性结合而构成的。比如一副包逡逑含狗的图像,可认为它是由一只狗、狗的姿态、当前的光照、所在场景等因逡逑素共同构成。如果想要区分包含狗和猫的图像,就需要用来描述图像的特征具逡逑有区分里面所包含物体的能力,也就是具有非线性抽象的能力。对于送个狗和逡逑猫的例子,假如有一种图像特征的每个维度分别能区分狗和猫的不同特性,(如逡逑图2.1(b),两个维度分别能表示耳朵的尖锐程度和鼻子的相对大小),那么该特逡逑征便是一种在区分狗和猫的图像上有区分性的特征。逡逑S冒返耐枷皴濉ǖ耐枷皴义细龈鲥义蠠a逦令逡逑媻逦A逦K邋\逦▲逡逑▲逦?逦衣邋\邋▲邋A逡逑?逦巧逦\逡逑▲逦中逦\逦▲逡逑?逦?逦恤邋1:逦?逦\逡逑A邋?逦?逦▲逡逑S缅危苠义喜五濉危垮危苠义希垮澹苠义舷袼劐味浼馊穸儒义希ǎ幔┪耷中缘耐枷裉卣麇危ǎ猓┯星中缘耐枷裉卣麇义贤迹玻蓖枷裉卣魇欠窬哂杏镆迩中缘氖疽馔煎义先绾文艽油枷裰刑崛∮杏镆迩中缘奶卣髂兀孔陨鲜兰湍┲两瘢芯空呙清义咸岢隽烁髦址椒ɡ瓷杓坪脱巴枷裉卣鳌8萜渌弑傅姆窍咝猿橄竽芰
本文编号:2808971
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/2808971.html