基于Hadoop的海量图像检索的设计与实现
发布时间:2021-11-28 23:28
近几年来,人民的生活水平日益提高,人民的生活质量不断增加,正在步入小康社会的大众,已经不满足于物质的要求,日益追求新的精神追求。人们日渐喜欢旅游、踏青等活动。现代各种数码相机、摄相机以及各种互联网设备软件的普及在很大程度上方便了人们的外出等照相的要求。不仅如此,近几年来蓬勃发展的网络,其图像数据也在无限的增长,比如众所周知的Facebook,图像的总容量已经达到1.5TB。图片作为最有感观的信息源之一,其数量呈指数增长,传统的相片检索技术已经不满足于快速增长的海量数码相片的处理需求。因此,从杂乱无章、数量庞大的数据中高效、快速的处理检索图片是当今社会的需求。随着数据量的无限增加,传统的技术框架不能满足快速增长的数据量,如淘宝网,天猫,唯品会,聚美优品等一系列网址,图片的存数量已经达到PB级别,并且不断的在扩大。Hadoop的海量数据的存储管理HDFS和并行框架MapReduce提供了处理海量数码相片的平台。Hadoop云平台的出现为海量图像检索技术提供了更高效、快速的技术支持。本文通过Hadoop云平台下,对海量的数码相片做分布式计算,提取图片的SURF特征,对图片的SURF特征进行K...
【文章来源】:东华理工大学江西省
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题研究背景及意义
1.2 国内外研究现状
1.2.1 Hadoop国内外研究现状
1.2.2 K-Means聚类国内外研究现状
1.3 论文研究内容
1.4 论文组织结构
第2章 云计算平台Hadoop
2.1 云计算
2.1.1 云计算的概念
2.1.2 云计算特点
2.2 Hadoop系统
2.2.1 Hadoop系统的简介
2.3 分布式文件系统HDFS
2.3.1 HDFS相关概念
2.3.2 HDFS的可靠性设计
2.4 并行计算框架Map Reduce
2.4.1 Map Reduce的工作流程
2.4.2 Mapreduce工作原理
2.5 Map Reduce对图像格式的处理
2.6 本章小结
第3章 图像检索所涉及的相关算法
3.1 图像特征提取
3.2 SIFT算法的概况
3.3 SURF算法的概况
3.4 K-Means算法
3.4.1 K-Means算法概况
3.4.2 K-Means聚类的距离计算
3.4.3 K-Means算法的Map Reduce实现
3.4.4 K-Means算法的缺点
3.5 基于抽样和K-dist图算法的K-Means算法改进
3.5.1 数据抽样
3.5.2 基于密度的聚类方法
3.5.3 k-dist图
3.6 LSH算法
3.7 小结
第4章 海量图像检索的设计与实现
4.1 图像检索的整体框架介绍
4.2 功能模块的设计
4.2.1 用户与计算机的交互模块
4.2.2 图片特征向量提取的模块
4.2.3 特征聚类和统一特征向量的模块
4.2.4 建立LSH索引模块
4.2.5 用户图像检索的模块
4.3 海量图像检索结果评估
4.3.1 图像特征提取模块的分析
4.3.2 聚类模块的分析
4.3.3 LSH索引模块的分析
4.4 本章小结
第5章 总结与展望
5.1 总结
5.2 展望
参考文献
【参考文献】:
期刊论文
[1]K-均值聚类算法的MapReduce模型实现[J]. 王鹏,王睿婕. 长春理工大学学报(自然科学版). 2015(03)
[2]中介相似性量度的图像匹配[J]. 周宁宁,吕文杰. 中国图象图形学报. 2012(09)
[3]基于底层视觉特征的语义图像检索[J]. 曾宪文,沈学东. 上海电机学院学报. 2010(06)
[4]一种改进的k-means初始聚类中心选取算法[J]. 韩凌波,王强,蒋正锋,郝志强. 计算机工程与应用. 2010(17)
[5]云计算和虚拟化网络硬件平台解决方案[J]. 于伟,丛欣. 信息安全与通信保密. 2010(04)
[6]基于半监督K-means的K值全局寻优算法[J]. 孙雪,李昆仑,胡夕坤,赵瑞. 北京交通大学学报. 2009(06)
[7]云计算及其关键技术[J]. 陈全,邓倩妮. 计算机应用. 2009(09)
[8]一种基于广度优先搜索的K-means初始化算法[J]. 张忠平,王爱杰,陈丽萍. 计算机工程与应用. 2008(27)
[9]基于内容的图像检索技术综述[J]. 陈洪生. 咸宁学院学报. 2008(03)
[10]DBSCAN聚类算法的研究与改进[J]. 冯少荣,肖文俊. 中国矿业大学学报. 2008(01)
硕士论文
[1]基于Hadoop的图像分类与匹配研究[D]. 王自昊.北京邮电大学 2015
[2]基于云计算的聚类挖掘算法及其应用研究[D]. 刘宇.南京邮电大学 2014
[3]基于Hadoop云平台的海量数字图像数据挖掘的研究[D]. 张良将.上海交通大学 2013
[4]基于改进聚类算法的数据挖掘系统的研究与实现[D]. 杨敏煜.电子科技大学 2012
[5]一种改进的kmeans聚类算法研究[D]. 刘振广.哈尔滨工程大学 2010
本文编号:3525363
【文章来源】:东华理工大学江西省
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题研究背景及意义
1.2 国内外研究现状
1.2.1 Hadoop国内外研究现状
1.2.2 K-Means聚类国内外研究现状
1.3 论文研究内容
1.4 论文组织结构
第2章 云计算平台Hadoop
2.1 云计算
2.1.1 云计算的概念
2.1.2 云计算特点
2.2 Hadoop系统
2.2.1 Hadoop系统的简介
2.3 分布式文件系统HDFS
2.3.1 HDFS相关概念
2.3.2 HDFS的可靠性设计
2.4 并行计算框架Map Reduce
2.4.1 Map Reduce的工作流程
2.4.2 Mapreduce工作原理
2.5 Map Reduce对图像格式的处理
2.6 本章小结
第3章 图像检索所涉及的相关算法
3.1 图像特征提取
3.2 SIFT算法的概况
3.3 SURF算法的概况
3.4 K-Means算法
3.4.1 K-Means算法概况
3.4.2 K-Means聚类的距离计算
3.4.3 K-Means算法的Map Reduce实现
3.4.4 K-Means算法的缺点
3.5 基于抽样和K-dist图算法的K-Means算法改进
3.5.1 数据抽样
3.5.2 基于密度的聚类方法
3.5.3 k-dist图
3.6 LSH算法
3.7 小结
第4章 海量图像检索的设计与实现
4.1 图像检索的整体框架介绍
4.2 功能模块的设计
4.2.1 用户与计算机的交互模块
4.2.2 图片特征向量提取的模块
4.2.3 特征聚类和统一特征向量的模块
4.2.4 建立LSH索引模块
4.2.5 用户图像检索的模块
4.3 海量图像检索结果评估
4.3.1 图像特征提取模块的分析
4.3.2 聚类模块的分析
4.3.3 LSH索引模块的分析
4.4 本章小结
第5章 总结与展望
5.1 总结
5.2 展望
参考文献
【参考文献】:
期刊论文
[1]K-均值聚类算法的MapReduce模型实现[J]. 王鹏,王睿婕. 长春理工大学学报(自然科学版). 2015(03)
[2]中介相似性量度的图像匹配[J]. 周宁宁,吕文杰. 中国图象图形学报. 2012(09)
[3]基于底层视觉特征的语义图像检索[J]. 曾宪文,沈学东. 上海电机学院学报. 2010(06)
[4]一种改进的k-means初始聚类中心选取算法[J]. 韩凌波,王强,蒋正锋,郝志强. 计算机工程与应用. 2010(17)
[5]云计算和虚拟化网络硬件平台解决方案[J]. 于伟,丛欣. 信息安全与通信保密. 2010(04)
[6]基于半监督K-means的K值全局寻优算法[J]. 孙雪,李昆仑,胡夕坤,赵瑞. 北京交通大学学报. 2009(06)
[7]云计算及其关键技术[J]. 陈全,邓倩妮. 计算机应用. 2009(09)
[8]一种基于广度优先搜索的K-means初始化算法[J]. 张忠平,王爱杰,陈丽萍. 计算机工程与应用. 2008(27)
[9]基于内容的图像检索技术综述[J]. 陈洪生. 咸宁学院学报. 2008(03)
[10]DBSCAN聚类算法的研究与改进[J]. 冯少荣,肖文俊. 中国矿业大学学报. 2008(01)
硕士论文
[1]基于Hadoop的图像分类与匹配研究[D]. 王自昊.北京邮电大学 2015
[2]基于云计算的聚类挖掘算法及其应用研究[D]. 刘宇.南京邮电大学 2014
[3]基于Hadoop云平台的海量数字图像数据挖掘的研究[D]. 张良将.上海交通大学 2013
[4]基于改进聚类算法的数据挖掘系统的研究与实现[D]. 杨敏煜.电子科技大学 2012
[5]一种改进的kmeans聚类算法研究[D]. 刘振广.哈尔滨工程大学 2010
本文编号:3525363
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3525363.html