面向图像特征标识的存储系统查询机制研究
本文关键词: 查询服务 局部灵敏哈希 MapReduce编程模型 存储系统 出处:《华中科技大学》2012年硕士论文 论文类型:学位论文
【摘要】:随着数据规模不断增加和处理难度增大,大数据(Big Data)变得非常重要。存储系统对图像文件等非结构化的大数据查询服务缺乏有力支持,传统的文件元数据信息没有表达图像文件内容,区分度低。图像文件作为存储系统中一类增长迅速的文件数据,面临数据规模增加和查询性能优化的双重挑战。从这一点出发,提出一种面向图像文件的分布式存储系统中的索引策略,能够有效地提高图像文件查询效率,并能保证查询准确率。 全文设计并实现面向图像文件的分布式查询系统,对用户的图像文件查询请求进行响应。采用执行速度快、具有良好稳定性的加速稳健特征算法提取图像的特征标识,对文件元数据进行辅助,增强对图像的表达力度。采用局部灵敏哈希方法(Locality Sensitive Hashing,LSH)解决高维的图像特征标识数据的最近邻居查询问题。研究的主要内容是结合局部灵敏哈希计算与MapReduce编程模型,提出一种分布式的索引策略,,在分布式环境的多节点上并行采集图像特征标识,并使用多节点并发的哈希计算生成索引记录,解决局部灵敏哈希方法在时间和空间上开销大的问题,提高存储系统中图像文件的查询效率。最后,为了将索引记录的生成和用户数据处理分离,采用关系型数据库存储结构化的图像文件索引信息,进一步缩短用户查询响应时间。 实验结果表明,分布式的索引构建和图像特征标识采集可以显著提高系统时间性能,对用户查询响应快,能够保证查询准确率。
[Abstract]:Big data Big data becomes very important as the size of the data grows and processing becomes more difficult. The storage system lacks support for unstructured big data query services such as image files. The traditional file metadata information does not express the image file content, and the distinction is low. The image file is a kind of fast growing file data in the storage system. Facing the dual challenges of increasing data scale and optimizing query performance, an index strategy for image file oriented distributed storage system is proposed, which can effectively improve the efficiency of image file query. And can ensure the query accuracy. A distributed query system for image files is designed and implemented in this paper. An accelerated robust feature algorithm with good stability extracts the feature identification of the image and assists the file metadata. The local sensitive hashing method was used to enhance the expression of the image. The localization Sensitive Hashing was used. LSH) is used to solve the problem of nearest neighbor query for high dimensional image feature identification data. The main content of this study is to combine local sensitive hash computation with MapReduce programming model. A distributed indexing strategy is proposed, in which image feature identification is collected in parallel on multi-nodes in distributed environment, and index records are generated by multi-node concurrent hash computation. To solve the problem that the local sensitive hashing method is expensive in time and space, and improve the query efficiency of image files in storage system. Finally, in order to separate the generation of index records from user data processing. The relational database is used to store the structured image file index information, which further shortens the response time of user query. The experimental results show that the distributed index construction and image feature identification collection can significantly improve the time performance of the system, respond quickly to the user query, and ensure the accuracy of the query.
【学位授予单位】:华中科技大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP333;TP391.41
【共引文献】
相关期刊论文 前10条
1 林琳;;基于C语言的存储资源管理系统的研究[J];才智;2011年13期
2 胡峰;张杰;刘静;肖大伟;;一种基于Rough集的海量数据属性约简方法[J];重庆邮电大学学报(自然科学版);2009年04期
3 刘霖;赵跃龙;李成艺;;一种新的存储解决方案——IND系统存储[J];电脑与信息技术;2006年05期
4 王丹玲;;虚拟化存储及其实现[J];电脑知识与技术;2006年05期
5 刘绍凯;;存储区域网(SAN)系统的管理及其实现研究[J];电脑知识与技术;2006年26期
6 蒋春曦;谢庆胜;王伟;;省级行业信息服务系统的设计与实现[J];电脑知识与技术;2008年17期
7 王宇;;网络存储面面观[J];电声技术;2008年05期
8 夏国远;;数据存储技术的应用分析[J];大众科技;2011年09期
9 黄晓武;;基于ISCSI的校园网络存储安全研究[J];福建电脑;2006年03期
10 王春建;;电视非编网素材的实时备份[J];广播电视信息;2011年11期
相关会议论文 前2条
1 刘景宁;王晓静;童薇;时洋;冯丹;;对象存储器中光纤通道驱动程序设计与优化[A];第15届全国信息存储技术学术会议论文集[C];2008年
2 王雪娇;钱军;温东新;张展;崔忠强;;基于Linux虚拟文件系统故障注入器的设计与实现[A];第六届中国测试学术会议论文集[C];2010年
相关博士学位论文 前10条
1 杨天明;网络备份中重复数据删除技术研究[D];华中科技大学;2010年
2 牛中盈;并行文件系统安全性研究[D];华中科技大学;2010年
3 林胜;存储系统容错及阵列编码[D];南开大学;2010年
4 陈俊健;面向对象存储系统安全技术研究[D];华中科技大学;2011年
5 彭涛;基于特征和实例的海量数据约简方法研究[D];华中科技大学;2011年
6 姜明华;基于冗余智能存储通道的存储系统关键技术研究[D];华中科技大学;2011年
7 魏青松;大规模分布式存储技术研究[D];电子科技大学;2004年
8 吴涛;虚拟化存储技术研究[D];华中科技大学;2004年
9 王烁;数字视频播放系统的研究[D];华中科技大学;2004年
10 邓玉辉;基于网络磁盘阵列的海量信息存储系统[D];华中科技大学;2004年
相关硕士学位论文 前10条
1 段莉娟;网络中间件数据采集系统的研究与实现[D];电子科技大学;2010年
2 胡永奎;对象存储设备中文件系统的设计与实现[D];解放军信息工程大学;2010年
3 王莉莉;基于DELTA压缩算法的大型数据库灾备关键技术研究[D];电子科技大学;2011年
4 柏宏斌;基于B/S架构的信息管理系统理论研究[D];电子科技大学;2010年
5 彭亮亮;基于IPv6的校园网络存储再生性的研究[D];西安电子科技大学;2010年
6 鲁昌龙;固态硬盘存储系统模型及存储管理层算法的研究[D];景德镇陶瓷学院;2011年
7 徐忠明;基于Hadoop的网络验证平台的研究[D];广东工业大学;2011年
8 蔡洪;智能网络存储系统(INSS)中负载均衡技术的研究[D];华南理工大学;2011年
9 王承才;小学校园Web网络硬盘应用系统的研究及实现[D];华南理工大学;2011年
10 罗浩;基于P2P的分布式存储研究与实现[D];电子科技大学;2011年
本文编号:1490118
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1490118.html