当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于矩阵分解的在线哈希最近邻搜索方法研究

发布时间:2021-04-02 01:55
  互联网、多媒体技术的快速发展,使得数据呈现出爆炸式的增长,数据的模态也更加多样化,文本、图像、音频、视频等多种形式的数据都包含着丰富的信息。如何高效的管理和运用信息资源,挖掘出有价值的信息内容,推动社会进一步发展,成为了广泛关注的问题。基于哈希的最近邻搜索技术,由于其计算速度快,占用存储空间小等优点,为高效管理和运用大规模信息资源提供了有效方法,受到了国内外研究学者的关注。目前,基于哈希的最近邻搜索技术大多采用批处理模式进行哈希学习。批处理模式的哈希学习方法存在的问题是,当系统获得与历史数据特征不一致,或者分布不一致的新数据时,如果不进行哈希函数的更新,则哈希函数无法学习到新数据的特征,导致搜索精度下降;如果进行哈希函数的更新,则需要将新数据和历史数据全部重新训练,造成较大的计算和存储开销。针对上述问题,本文提出了基于矩阵分解的在线哈希最近邻搜索方法,使得哈希函数根据新数据进行模型增量更新,无需存储大量历史数据,有效降低了最近邻搜索任务的计算和存储开销,提高了搜索精度。主要研究内容概括如下:(1)针对采用批处理模式学习的哈希方法存在的问题,本文提出一种基于矩阵分解的单模态在线哈希方法。... 

【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校

【文章页数】:84 页

【学位级别】:硕士

【部分图文】:

基于矩阵分解的在线哈希最近邻搜索方法研究


单模态哈希方法流程示意图

示意图,哈希,多模态,方法流程


00010010/00010010返回检索结果图1.2 多模态哈希方法流程示意图跨视图哈希(Cross-View Hashing,CVH)[40]是一种无监督的多模态哈希方法。该方法是谱哈希在多模态数据下的推广,通过最小化具有相似性的样本间哈希编码的距离进行哈希学习。然而,CVH 并没有很好的考虑到不同模态数据分布的差异,使得算法性能难以令人满意。多媒体哈希(Inter-Media Hashing,IMH)[41]方法的提出更好的考虑了不同模态数据分布的差异。但是 IMH 需要对同一模态的数据构建相似图,因此对大数据集进行训练时,会产生计算复杂度过高的问题。为了解决该问题,学者们提出了线性跨模态哈希(Linear Cross-Model Hashing,LCMH)[42]方法

框图,哈希,矩阵分解,框图


因此有效降低了系统的存储压力,并且该方法采用过去时刻的矩阵计算结果和新数据共同进行哈希模型更新,提高了哈希模型的更新效率和搜索精度。图3.1 基于矩阵分解的单模态在线哈希方法框图3.2.2基于矩阵分解的单模态在线哈希框架矩阵分解[57]的含义是将一个矩阵拆分为两个或者多个矩阵相乘的形式,本章中采用矩阵分解方法如式(3-1)所示:X UV, (3-1)式(3-1)中,将原始数据矩阵 X 近似为矩阵U 和矩阵V 相乘。通过矩阵分解,原始数据矩阵 X 中的每一个向量可以看做是基矩阵U 中向量加权得到的,系数表示矩阵V 中的每一个向量则可以看做基矩阵U 中每一个向量对应的权重。为了衡量矩阵分解的近似误差,选择 Frobenius 范数如式(3-2)所示:


本文编号:3114367

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3114367.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0aaab***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com