当前位置:主页 > 科技论文 > 自动化论文 >

基于哈希学习的大规模媒体检索研究

发布时间:2021-07-05 23:40
  近年来,随着移动互联网技术和移动设备的大发展,媒体数据的规模越来越大,大规模媒体检索任务已经成为一个紧要的问题。因为其快速的检索速度以及十分低的存储消耗,所以哈希学习技术非常适合用来进行大规模媒体检索,已经获得越来越多的关注。并且研究表明,监督哈希方法在实际应用中比无监督哈希方法的效果更好。尽管基于监督哈希方法的媒体检索研究已经有一定的进展,但仍有一些问题需要去解决。比如,大部分的监督哈希方法因为使用了大小为数据量平方的成对相似性矩阵,使得其复杂度高,存储消耗大,不利于应用在大规模数据上。又比如,有一些哈希方法,在模型学习的时候先松弛掉哈希码二进制约束,优化一个松弛后的损失函数进而得到一个实值的解,最后把该解量化成最终的哈希码,这样的学习策略会引入大量的量化误差。本文在基于哈希学习的大规模媒体检索研究方面进行了深入研究。更具体的,我们设计了四种监督哈希模型来进行大规模媒体检索。本文的主要工作和贡献如下:(1)通过分析与观察之后,我们发现属于相同类别的数据的哈希码应相同。在此基础上,我们只需要为每一个类别学习出一个类别哈希码,并使之保持住类别之间的相似性即可。这样,训练的时候便无需考虑具... 

【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校

【文章页数】:158 页

【学位级别】:博士

【部分图文】:

基于哈希学习的大规模媒体检索研究


图2.1所有方法在MNIST数据集上的MAP结果,哈希码位数从8位到96位

数据集,哈希,码位,方法


??2.4.5?CIFAR-10数据集上的实验??图2.1中画出了所有方法在CIFAR-10数据集上运行的MAP结果。从图中我们??可以观察到如下的现象:??1〇??

曲线,准确率,码位,数据集


N?N??图3.3所有方法在CIFAR-IO数据集上的前N准确率曲线,哈希码位数在8位到64位之??间变化。??@8?bits?@16?bits??0.11?'?■?■?■??0.18[?>?????'???:???厂…:??:?0.12.1???????Q_?0.04^-,、.,,???M?i??LSH?Q.?I??■■■?LSH?????-*- ̄rro?0.06???u??*?u?il?ff ̄ ̄ ̄^?a?__,e?_KSH??言、KSH??一一:rr?〇.〇3r.??—e—?COSDISH?p- ̄ ̄一一二.???—9—?COSDISH?*??|?—A-?SSDH?—A—SSDH?[T??°0?400?800?1200?1600?2000?°0?400?800?1200?1600?2000??N?N??@32?bits?@64?bits??0.25?i????????0.3?■???'?1?????〇,i^x???Q_??—t—LSH?CL?—LSH?(,??'

【参考文献】:
期刊论文
[1]大数据哈希学习:现状与趋势[J]. 李武军,周志华.  Science Bulletin. 2015(Z1)



本文编号:3267063

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3267063.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4703d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com