改进的超像素和Graph cuts的图像分割方法研究
发布时间:2017-07-29 16:31
本文关键词:改进的超像素和Graph cuts的图像分割方法研究
【摘要】:在自然图像中存在大量的文本信息,如交通指示标志,广告宣传牌,商家招牌,建筑物标示,街道编号等,这些文本信息属于高层视觉元素,为场景的理解、分析提供丰富而关键的线索,因此研究出一种自动识别文本信息的工具,进而对文本进行后续的相关检索、分析有重要意义。可应用于图像检索,智能监控,盲人导航等领域。图像分割作为计算机视觉领域基础但是关键的一个步骤,实现文本的自动识别自然离不开对图像中的文本进行分割。自然场景图像由于背景较为复杂,且图像易受拍摄角度及光线的影响而产生变形、模糊、断裂等现象,因此传统的文档分割技术应用于复杂自然场景文本分割时效果不佳,更有效的针对复杂自然场景的文本分割技术仍是目前计算机视觉和文档分析领域的研究热点之一。本文针对复杂背景图像中的文本分割进行相关研究,主要工作有以下几部分:受超像素这一概念的启发,为了减少图像局部信息冗余,提高图模型效率,本文用超像素区域代替像素点构建加权图模型。因此本文首先介绍了超像素这一新近概念的发展背景和历史,通过梳理各种超像素的生成方法,评价其适用各种场景的优缺点后,选择出适用于本文的基于SLIC超像素生成算法并进行适当改进。在简要介绍图割基本原理的基础上,分析能量函数的构造,归纳出基于图割的图像分割步骤。其次,针对场景文本的复杂性,提出一种基于改进的超像素和Graph Cuts的场景文本分割方法。该方法用预分割后的超像素代替像素点构件图模型,运用两种模型(GMMs模型和基于SVM的后验概率模型)代替单一GMMs模型构建文本和背景模型,并采用EM算法自适应学习GMMs模型的参数。最后在Matlab R2010软件环境中使用实验室数据库进行了文本图像分割测试,并结合使用光学字符识别软件(OCR)对分割后的识别效果进行实验,结果表明:本文设计的算法可以获得较好的分割效果,有一定的应用价值。
【关键词】:超像素 图割 文本分割 自然场景
【学位授予单位】:山东师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.41
【目录】:
- 摘要6-7
- ABSTRACT7-9
- 第一章 绪论9-19
- 1.1 课题背景和意义9-13
- 1.2 国内外研究现状13-17
- 1.3 本文的主要工作17
- 1.4 本文的内容安排17-19
- 第二章 超像素概念及算法发展19-34
- 2.1 常用超像素生成算法评价标准21-24
- 2.1.1 直观角度评价标准21-22
- 2.1.2 定量评价标准22-24
- 2.2 几种典型的超像素生成算法24-30
- 2.2.1 基于图论的超像素分割算法24-28
- 2.2.2 基于梯度下降的超像素分割算法28-30
- 2.3 改进的SLIC超像素生成算法30-33
- 2.3.1 纹理特征选取30
- 2.3.2 局部特征融合及超像素分割30-32
- 2.3.3 实验结果及分析32-33
- 2.4 本章小结33-34
- 第三章 图割理论在图像分割中的应用34-42
- 3.1 图割的基本理论34-37
- 3.1.1 图的基本概念34-36
- 3.1.2 最大流/最小割定理36-37
- 3.2 基于Graph cuts的图像分割原理37-40
- 3.2.1 图的构造37-38
- 3.2.2 能量函数的构造38-40
- 3.3 基于图割的图像分割步骤40-41
- 3.4 本章小结41-42
- 第四章 改进的超像素和Graph Cuts的自然图像文本内容的分割42-51
- 4.1 基于超像素区域的图割模型42-47
- 4.1.1 区域代价函数的定义43-46
- 4.1.2 邻域代价函数的定义46-47
- 4.1.3 本文算法步骤47
- 4.2 实验结果及分析47-50
- 4.3 本章小结50-51
- 第五章 总结与展望51-53
- 5.1 工作总结51
- 5.2 研究展望51-53
- 参考文献53-56
- 攻读硕士学位期间的论文发表情况56-57
- 致谢57
【参考文献】
中国期刊全文数据库 前9条
1 邱娟;谢昊;张传林;;基于优化Gabor滤波器和GMRF的笔迹特征提取方法[J];计算机工程与应用;2015年17期
2 王春瑶;陈俊周;李炜;;超像素分割算法研究综述[J];计算机应用研究;2014年01期
3 刘毅;黄兵;孙怀江;夏德深;;结合CS-LBP纹理特征的快速图割算法[J];计算机科学;2013年05期
4 曾峦;顾大龙;;一种基于扇形区域分割的SIFT特征描述符[J];自动化学报;2012年09期
5 钟金琴;辜丽川;檀结庆;李莹莹;;基于分裂EM算法的GMM参数估计[J];计算机工程与应用;2012年34期
6 陈树越;张世林;;基于灰度差分和二维最大熵阈值的新闻字幕检测[J];计算机应用研究;2011年08期
7 韩守东;赵勇;陶文兵;桑农;;基于高斯超像素的快速Graph Cuts图像分割方法[J];自动化学报;2011年01期
8 李敏花;王春恒;肖柏华;柏猛;;一种基于条件随机场的复杂背景图像文本抽取方法[J];模式识别与人工智能;2009年06期
9 王欢良;韩纪庆;郑铁然;;高斯混合分布之间K-L散度的近似计算[J];自动化学报;2008年05期
,本文编号:590091
本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/590091.html