基于网页信息和图像特征的Web图像检索研究
本文关键词:基于网页信息和图像特征的Web图像检索研究,,由笔耕文化传播整理发布。
【摘要】:随着信息技术和互联网的飞速发展,网站数量激增,加上twitter,微信,微博等新媒体的广泛应用,信息资源已进入海量数据时代。在这些资源中,不仅包括易于处理的文本数据,还包括大量的图像、视频等多媒体数据。与文本相比,图像显得更为直观、生动,加上便携图像获取设备如智能手机的普及。数字图像的数量出现了飞速增长,几乎每年增加一倍。如何快速、准确地从海量网络资源中检索到感兴趣的Web图像成为迫切需要解决的问题。Web图像具有信息量高、数量巨大、非结构化、高层语义多样和不确定性的特点。使得信息检索领域的相关成果很难直接应用到Web图像检索领域。如何综合运用数字图像处理、模式识别、机器学习、信息检索等理论和技术,研究出性能高效的Web图像检索系统,为用户提供稳定可靠,准确度高的图像检索服务,具有重要的理论意义和现实价值。Web图像嵌入在网页中,不仅包含丰富的视觉信息,其所在网页的文本中也包含了大量与Web图像相关的信息。关于Web图像检索的研究主要基于这两类信息展开,包括三个方向:基于Web文本信息的检索模型TBIR、基于Web图像内容的检索模型CBIR和融合文本与图像信息的检索模型ABIR。TBIR从Web图像所在网页的文本中提取与Web图像相关的关键词用于Web图像的索引和检索。CBIR从Web图像的底层视觉信息中提取视觉特征用于Web图像的索引和检索。ABIR综合利用文本和图像信息用于Web图像的索引和检索。显然,同时使用文本和图像信息的ABIR具有更大的优势,但是这两种信息的结构不同(一个属于高层语义关键词信息,一个属于图像底层视觉特征信息),很难直接融合,怎样无缝地融合两者的信息依旧是Web图像检索领域的研究难点。直接使用图像视觉特征检索图像,需要用户提供样图或草图,给用户的图像检索造成极大的不便。而要将图像视觉特征转换为高层语义关键词,又存在“语义鸿沟”问题。因此,怎样将图像视觉特征映射为高层语义关键词是另一个要解决的难题。这两个难点导致ABIR的研究进展缓慢,还需要进行深入的研究。针对ABIR存在的问题,本文提出了一种基于网页信息和图像特征的Web图像检索模型,该模型将Web图像检索的信息源从两个(文本信息和图像特征)扩展到三个(文本信息、图像特征和图像中包含的文字),增加了Web图像索引的信息源。同时,通过图像自动标注解决“语义鸿沟”问题,将图像视觉特征映射为高层语义关键词。最后,利用贝叶斯推理网将三种信息源的关键词无缝地融合在一起,解决了异构信息的融合难题。词汇相似度计算是解决“语义鸿沟”问题的基础,也是本文提出图像检索模型中融合三种信息源的前提。因此,本文第四章详细介绍了基于知网的词汇相似度计算方法。图像中的文本分为场景文本和人工文本,这两种文本都与图像的内容和高层语义有很大的相关性。因此,将图像中包含的文本作为图像检索的信息源之一具有重要的意义。本文提出了基于笔画宽度检测的Web图像文本识别算法,将图像中的文字识别出来,增加了Web图像检索的信息源。图像自动标注是解决“语义鸿沟”问题的有效手段。本文提出的图像自动标注模型,通过三种经典的自动标注算法生成候选关键词集,然后通过词汇相似性计算候选关键词之间的内聚性和候选关键词与图像文本、Web文本关键词之间的一致性,将内聚性和一致性低于阈值的关键词作为“噪音”关键词从候选关键词中过滤掉。同时,将内聚性和一致性作为关键词的权重,为使用贝叶斯网络进行信息融合奠定基础。贝叶斯推理网络具有融合多种信息的能力,是一种基于概率的、不确定性推理网络。使用贝叶斯推理网的关键是如何确定各事件的初始概率和条件概率,本文引入了Page Rank(网页排名)确定初始概率,通过TF/IDF计算条件概率,构建了完备的贝叶斯网络图像检索网络。实验证明,本文提出的Web图像检索方法具有较高的图像检索质量。
【关键词】:Web图像检索 图像文本识别 图像自动标注 贝叶斯推理网 数字图像处理
【学位授予单位】:重庆大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.41
【目录】:
- 中文摘要3-5
- 英文摘要5-12
- 1 绪论12-22
- 1.1 研究背景12-13
- 1.2 研究意义13
- 1.3 国内外研究现状13-17
- 1.3.1 基于文本的图像检索TBIR14
- 1.3.2 基于内容的图像检索CBIR14-15
- 1.3.3 融合文本和图像信息的图像检索ABIR15-17
- 1.4 本文的研究内容与成果17-19
- 1.5 论文结构19-22
- 2 图像检索概述22-30
- 2.1 Web资源的特点22-23
- 2.1.1 Web数据的特点[58]22
- 2.1.2 Web页面的特点[59]22-23
- 2.1.3 Web图像的分类23
- 2.2 Web图像检索模型23-24
- 2.3 基于文本的图像检索TBIR24-25
- 2.4 基于内容的图像检索CBIR25-27
- 2.4.1 图像底层视觉特征25-26
- 2.4.2 图像相似性计算26-27
- 2.5 融合文本和图像信息的图像检索ABIR27
- 2.6 基于语义的图像检索27-29
- 2.6.1 图像语义特征28
- 2.6.2 图像语义映射28-29
- 2.7 图像检索结果评价29
- 2.8 小结29-30
- 3 基于网页信息和图像特征的检索模型概述30-34
- 3.1 词汇相似度计算31
- 3.2 文本关键词的提取31
- 3.3 图像关键词映射31-33
- 3.3.1 图像自动标注32-33
- 3.3.2 图像文本识别33
- 3.4 基于贝叶斯推理网的图像检索33
- 3.5 小结33-34
- 4 词汇相似度计算34-42
- 4.1 词汇相似度简介34
- 4.2 词汇相似度计算34-35
- 4.3 知网介绍35-38
- 4.3.1 知网的总体思想35-36
- 4.3.2 知网的结构36-38
- 4.4 基于知网的词汇相似度计算38-40
- 4.4.1 义原相似度计算38-39
- 4.4.2 虚词概念相似度计算39
- 4.4.3 实词概念相似度计算39-40
- 4.5 实验40-41
- 4.6 小结41-42
- 5 基于笔画宽度的Web图像文本识别42-62
- 5.1 图像文本识别概述43-46
- 5.1.1 图像文本的分类43-44
- 5.1.2 图像文本的特征44
- 5.1.3 图像文本识别模型44-45
- 5.1.4 图像文本定位算法45-46
- 5.1.5 图像文本定位结果的判定46
- 5.2 检测图像中的候选文本46-50
- 5.2.1 图像预处理47-49
- 5.2.2 检测候选文本区域49-50
- 5.3 过滤非文本区域50-55
- 5.3.1 形状规则过滤50-51
- 5.3.2 纹理规则过滤51-52
- 5.3.3 笔画宽度规则过滤52-55
- 5.3.4 文本区域合并55
- 5.4 文本识别55-60
- 5.4.1 文本图像二值化55-58
- 5.4.2 二值化图像去噪58-59
- 5.4.3 图像倾斜校正59
- 5.4.4 OCR图像文本识别59-60
- 5.5 实验结果与分析60-61
- 5.6 小结61-62
- 6 加权Web图像自动标注模型62-82
- 6.1 图像自动标注概述62-63
- 6.2 图像分割63-64
- 6.3 图像视觉特征64-65
- 6.3.1 颜色特征64
- 6.3.2 纹理特征64
- 6.3.3 形状特征64-65
- 6.4 图像自动标注模型65-77
- 6.4.1 机器翻译标注模型MTM66-69
- 6.4.2 机器分类标注模型MCM69-70
- 6.4.3 相关语言标注模型RLM70-73
- 6.4.4 噪音关键词过滤73-77
- 6.5 实验77-79
- 6.5.1 实验数据77
- 6.5.2 实验方法77-78
- 6.5.3 实验结果78-79
- 6.6 小结79-82
- 7 基于贝叶斯推理网的Web图像检索82-104
- 7.1 Web图像检索概述82-83
- 7.2 基于贝叶斯推理网的Web图像检索83-86
- 7.3 Web文本特征的提取86-88
- 7.4 Web图像文本识别88-90
- 7.4.1 Web图像文本关键词优化89-90
- 7.5 Web图像自动标注90-91
- 7.6 贝叶斯信息检索模型91-95
- 7.6.1 检索模型选择91-93
- 7.6.2 贝叶斯网络93-94
- 7.6.3 贝叶斯信息检索模型94-95
- 7.7 贝叶斯Web图像检索95-99
- 7.7.1 贝叶斯Web图像检索算法95-97
- 7.7.2 算法参数设置97-99
- 7.8 实验99-103
- 7.8.1 实验内容与方法99-100
- 7.8.2 实验数据100-101
- 7.8.3 实验结果101-103
- 7.9 小结103-104
- 8 总结与展望104-108
- 8.1 研究总结104-106
- 8.2 未来展望106-108
- 致谢108-110
- 参考文献110-122
- 附录122
- A. 作者在攻读学位期间发表的论文目录122
- B. 作者在攻读学位期间参加的科研项目122
【相似文献】
中国期刊全文数据库 前10条
1 李广洲,丁金芳,邓海山;基于Web的化学计算机化自适应测验系统的实现[J];计算机与应用化学;2002年05期
2 赵松林;基于Web服务的企业应用集成[J];微型机与应用;2003年08期
3 杜保华,刘弹,侯成刚,徐光华;XML WebService在基于Web远程分析工具集中的应用[J];仪器仪表用户;2004年02期
4 严毅,唐天兵,宁葵;Web服务实现开放式的企业应用集成[J];广西大学学报(自然科学版);2005年03期
5 邵文田;;去除使用Web服务寻找适当的程序项目[J];电脑迷;2007年15期
6 宋平;;基于Web服务的企业应用集成[J];福建电脑;2007年10期
7 邹丹;;基于Web服务的医院信息管理系统的设计与实现[J];大众科技;2007年06期
8 彭玉华;;基于Web的学生信息管理系统的设计与实现[J];民营科技;2010年09期
9 陈波;师惠忠;;一种新型Web应用安全漏洞统一描述语言[J];小型微型计算机系统;2011年10期
10 ;借会献技——国际软件博览会中心议题web计算及应用[J];每周电脑报;1997年43期
中国重要会议论文全文数据库 前10条
1 刘正涛;毛宇光;应毅;;基于Web服务的分布式Web应用框架研究[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
2 戴琦;;Web上的数据挖掘[A];全国计算机网络应用年会论文集(2001)[C];2001年
3 王卫;;基于Web的数据库应用[A];第十八届中国(天津)’2004IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2004年
4 张默;廖湖声;杜金莲;;基于Web服务的开放式地理信息系统的研究[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
5 郑菊艳;续爱民;;基于WEB模式的科研项目管理系统的设计与实现[A];第十四届中国科协年会第5分会场:绿色船舶与海洋装备创新发展及产业化论坛论文集[C];2012年
6 郑菊艳;续爱民;;基于WEB模式的科研项目管理系统的设计与实现[A];2012年MIS/S&A学术交流会议论文集[C];2012年
7 李勤;;基于WEB的计算机模拟病例考试系统在全科医师培训实践能力测试中应用研究[A];2012年浙江省全科医学学术年会论文汇编[C];2012年
8 黄海林;孙向阳;;基于Web的大学物理试题管理系统的设计[A];湖北省物理学会、武汉物理学会成立70周年庆典暨2002年学术年会论文集[C];2002年
9 于莉莉;张毅;;基于Web的人力资源管理系统研究与设计[A];2008全国制造业信息化标准化论坛论文集[C];2008年
10 李中华;;企业Web应用安全威胁与防护[A];创新·融合·发展——创新型煤炭企业发展与信息化高峰论坛论文集[C];2010年
中国重要报纸全文数据库 前10条
1 本报记者 刘继安;准备好了吗?WEB教师[N];中国教育报;2001年
2 张承东;Web智能考核广告[N];网络世界;2009年
3 科讯;WEB教师——一个全新职业的透析[N];科技日报;2001年
4 王雅丽;博客社区齐上阵 银行借Web 2.0拉拢未来客户[N];中国计算机报;2008年
5 本报记者 黄智军;Web应用呼唤新型安全系统[N];计算机世界;2009年
6 居易;WEB教师热门起来[N];组织人事报;2001年
7 本报记者 赵晓涛;四问“Web防御与云安全”[N];网络世界;2008年
8 本报记者 徐恒;手机浏览器:竞争不断加剧 Web大势所趋[N];中国电子报;2009年
9 电脑商报记者 张戈;Web应用安全正当时[N];电脑商报;2010年
10 李晨;Web应用安全应贯穿生命周期[N];人民邮电;2009年
中国博士学位论文全文数据库 前10条
1 万志远;Web应用程序漏洞检测关键技术研究[D];浙江大学;2014年
2 黄治虎;基于网页信息和图像特征的Web图像检索研究[D];重庆大学;2015年
3 张璞;Web评论文本情感分类方法研究[D];重庆大学;2015年
4 孙慧峰;基于协同过滤的个性化Web推荐[D];北京邮电大学;2012年
5 何儒汉;Web图像的多模融合检索研究[D];华中科技大学;2007年
6 张建武;面向Web应用的安全评测技术研究[D];北京邮电大学;2012年
7 龙慧云;基于进程代数的Web服务数据和组合的形式化方法研究[D];贵州大学;2009年
8 孙涛;面向市场情报分析的Web实体事件融合问题研究[D];山东大学;2014年
9 谢琪;基于协同过滤与QoS的个性化Web服务推荐研究[D];重庆大学;2012年
10 刘方方;Web服务合成与可用性的若干关键技术研究[D];复旦大学;2007年
中国硕士学位论文全文数据库 前10条
1 李林蓉;基于Restful和OSGI的Web应用转换容器的研究与实现[D];华南理工大学;2015年
2 陈彬彬;基于QoS随机性的Web服务质量偏离监测方法研究与实现[D];昆明理工大学;2015年
3 徐超;机顶盒中基于Web交互方式的设计与实现[D];西南交通大学;2015年
4 张锐;基于Web技术下的出差管理系统[D];西安工业大学;2015年
5 游维;基于Rest的Web业务系统日志采集与分析系统的研究与开发[D];山东大学;2015年
6 陶莹昌;基于Web的校园二手图书拍卖平台的设计与实现[D];西华师范大学;2015年
7 周赢;基于WEB的绩效管理系统的设计与实现[D];电子科技大学;2015年
8 宋平亮;基于MongoDB的航道数据Web服务研究[D];大连海事大学;2015年
9 汪洋;基于web的普通话新闻检索技术研究[D];电子科技大学;2014年
10 吴朝云;基于eyeOS的Web操作系统云存储研究[D];电子科技大学;2014年
本文关键词:基于网页信息和图像特征的Web图像检索研究,由笔耕文化传播整理发布。
本文编号:386244
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/386244.html