Hadoop云平台下基于本体的图像检索系统研究
本文关键词:Hadoop云平台下基于本体的图像检索系统研究
【摘要】:随着大数据时代的到来,分布于因特网中各个节点上图像数据数量急剧增加,种类更加复杂,这一方面给人们带来了极大便利,另一方面也给海量图像的检索带来了极大的困难,如何从海量资源中有效检索图像等多媒体数据成为目前的研究热点和难点。现有的图像检索的方法中,基于文本的图像检索存在着主观性强、表达图像含义不完整的问题;基于内容的图像检索存在低层语义与高层语义的语义鸿沟;基于语义的图像检索由于是以单个概念为基础进行检索,因此并没有将概念之间的关系考虑在内。因此,如何从大规模图像数据库中准确地检索出目标图像是目前急需解决的问题。语义网技术能够减小语义鸿沟,充分考虑低层特征和高层语义之间关系。本体作为语义网的语义层,也是语义网的核心部分,能够将知识进行概念化表示和结构化组织。云计算运用其可靠性,可扩展性和廉价性的优势,能够处理和存储大规模数据。本课题主要研究云平台中基于本体的大规模图像检索方法,建立查全率、查准率高的图像检索系统。基于以上问题,本课题提出了基于本体的图像检索系统。首先,针对模糊C均值聚类FCM算法的不足,提出了结合空间信息的FCM算法对图像分割得到图像基元,并采用聚类算法对图像进行基元聚类,得到代表各类图像基元的低层信息;其次,根据运动领域图片训练集中的标注词,建立运动领域本体来标注图像;然后,采用传统的跨媒体相关模型CMRM对训练集图像进行第一次标注,获得基于概率模型的图像标注结果;最后,根据本体概念相似度,利用图学习算法对第一次标注结果进行优化,在每幅图像的概率关系表中选择概率最大的N个关键词作为最终的标注结果,完成第二次标注。实验结果表明,本文提出的结合空间信息的图像分割算法能够更好的对图像进行分割,而将领域本体引入图像标注过程中,通过本体定义了图像的语义概念之间的关系,既能充分利用图像本身的低层特征,又能符合人的图像视觉理解,提高了图像检索的查全率及查准率。
【关键词】:图像分割 聚类 图像标注 本体 图学习
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.41
【目录】:
- 摘要4-5
- Abstract5-9
- 第1章 绪论9-17
- 1.1 研究意义9-10
- 1.2 研究现状10-14
- 1.2.1 基于文本的图像检索11
- 1.2.2 基于内容的图像检索11-12
- 1.2.3 基于语义的图像检索12-14
- 1.2.4 基于本体的图像检索14
- 1.3 研究内容14-15
- 1.4 论文组织结构15-17
- 第2章 Hadoop相关技术研究17-24
- 2.1 Hadoop整体框架17-18
- 2.2 分布式文件系统HDFS18
- 2.3 并行编程模型MapReduce18-23
- 2.3.1 MapReduce技术分析18-21
- 2.3.2 MapReduce流程及任务调度21-23
- 2.4 本章小结23-24
- 第3章 基于本体的图像检索架构设计24-34
- 3.1 引言24
- 3.2 本体的基本概念24-26
- 3.2.1 本体的定义24-25
- 3.2.2 本体的建模元语25-26
- 3.2.3 本体中概念之间的关系26
- 3.3 基于本体的图像描述26-27
- 3.4 图像本体的构建27-30
- 3.4.1 运动领域图像本体的构建28-29
- 3.4.2 实验结果29-30
- 3.5 基于本体的图像检索框架30-33
- 3.5.1 图像基元提取32
- 3.5.2 图像语义标注32-33
- 3.5.3 基于本体的图像检索框架33
- 3.6 本章小结33-34
- 第4章 基于空间信息的FCM图像基元提取34-44
- 4.1 引言34-35
- 4.2 基于模糊C均值的图像分割方法35-37
- 4.3 融合彩色信息和空间信息的FCM图像分割算法37-41
- 4.3.1 引入RGB彩色空间的nFCM_S算法37-38
- 4.3.2 融合空间信息的nFCM_S算法38-41
- 4.4 图像基元提取实验结果与分析41-43
- 4.4.1 图像基元提取结果示例41-42
- 4.4.2 图像基元提取质量评价指标42-43
- 4.5 本章小结43-44
- 第5章 基于本体的图像语义标注44-52
- 5.1 引言44-45
- 5.2 基于本体的图像语义标注过程45-46
- 5.3 基于CMRM算法的第一次标注46-47
- 5.4 基于图学习算法的第二次标注47-48
- 5.4.1 本体概念相似度的图学习算法47-48
- 5.4.2 基于图学习的图像标注算法48
- 5.5 图像语义标注实验结果与分析48-51
- 5.5.1 图像语义标注结果示例49
- 5.5.2 图像语义标注质量评价指标49-51
- 5.6 本章小结51-52
- 第6章 总结与展望52-54
- 6.1 总结52
- 6.2 展望52-54
- 参考文献54-58
- 作者简介及在学期间所取得的科研成果58-59
- 致谢59
【相似文献】
中国期刊全文数据库 前10条
1 逄利华;张锦春;;基于Hadoop的分布式数据库系统[J];办公自动化;2014年05期
2 郑玮;;Hadoop释放大数据潜能[J];软件和信息服务;2012年10期
3 刘尔凯;崔振东;;基于HADOOP技术 实现银行历史数据线上化研究[J];金融电子化;2014年01期
4 邹群;;一种基于Hadoop的数字图书存储系统设计方案[J];黑龙江史志;2014年01期
5 谌章义;毕伟;向万红;王国安;吴爱国;;基于Hadoop的海量电费数据处理模型[J];计算机系统应用;2014年05期
6 ;大数据不等于Hadoop[J];办公自动化;2014年06期
7 ;保障Hadoop数据安全的十大措施[J];计算机与网络;2013年08期
8 王峰;雷葆华;;Hadoop分布式文件系统的模型分析[J];电信科学;2010年12期
9 苏小会;何婧媛;;Hadoop中任务调度算法的改进[J];电子设计工程;2012年22期
10 林伟伟;;一种改进的Hadoop数据放置策略[J];华南理工大学学报(自然科学版);2012年01期
中国重要报纸全文数据库 前8条
1 本报记者 郭涛;机器大数据也离不开Hadoop[N];中国计算机报;2013年
2 本报记者 王星;Hadoop引发大数据之战[N];电脑报;2012年
3 本报记者 邹大斌;Hadoop一体机降低大数据门槛[N];计算机世界;2012年
4 孙定;云计算、大数据与Hadoop[N];计算机世界;2011年
5 乐天 编译;Hadoop:打开大数据之门的金钥匙[N];计算机世界;2012年
6 范范 编译;Hadoop用户可以使用多种搜索引擎[N];网络世界;2013年
7 波波 编译;Hadoop、Web 2.0为磁带带来新商机[N];网络世界;2013年
8 本报记者 郭涛;让更多人能够使用Hadoop[N];中国计算机报;2012年
中国硕士学位论文全文数据库 前10条
1 刘君;基于Hadoop技术的气象数据采集及数据挖掘平台的研究[D];天津理工大学;2015年
2 谭旭;基于物流数据的快递网络分析与建模[D];浙江大学;2015年
3 赵伟;基于Hadoop的数据挖掘算法并行化研究[D];西南交通大学;2015年
4 赵振崇;基于Hadoop的决策树挖掘算法的研究[D];兰州大学;2015年
5 郭凯振;基于Hadoop的分布式计算系统的设计与实现[D];大连海事大学;2015年
6 白亮;基于Hadoop的民航高价值旅客发现方法研究[D];中国民航大学;2015年
7 席屏;基于Hadoop的视频大数据智能预警系统应用研究[D];江苏科技大学;2015年
8 董立明;基于HADOOP的分布式推荐引擎[D];复旦大学;2013年
9 陆艺达;基于Hadoop分布式计算框架的垃圾短信群发检测系统[D];复旦大学;2013年
10 沈德利;基于Hadoop的密文检索关键技术研究[D];西安电子科技大学;2014年
,本文编号:789540
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/789540.html