基于自适应行聚类的自然场景文字检测算法研究
本文选题:自然场景文字检测 + 文本行级别特征 ; 参考:《中国科学技术大学》2017年硕士论文
【摘要】:自然场景中的文字通常蕴含了大量有价值的信息,为理解和分析场景提供了重要线索。而且对于很多视觉应用来说,自然场景中的文字检测算法是其中的关键性技术。因而几十年来,该研究领域引起了国内外大量学者的关注,算法的性能也日益提高。典型的文字检测算法一般由四个步骤组成,分别是字符候选域提取、非字符域滤除、候选文本行生成和候选文本行验证。然而,这种处理流程存在着错误传播问题,一旦真正的字符域在第二阶段中被系统错误地滤除,将会影响到后续的候选行生成和候选行验证阶段,导致系统的最终召回率较低。针对这一问题,本文提出了基于自适应行聚类的自然场景中文字检测算法。该算法没有基于字符级别的特征对非字符域做滤除操作,而是为每个候选域赋予了一个文本/非文本的字符概率值。接着,在算法生成候选文本行集合后,系统充分利用文本行级别的特征,将每个候选行映射为三维空间中的一个点。最后,系统在当前图像中采用级联的聚类策略区分开真假文本行,得到最终的输出结果。另一方面,为了使算法能够完成自然场景中任意方向的中英文文本行的检测任务,本文提出了新的字符候选域提取算法和候选文本行生成算法。在字符候选域提取算法中,我们基于中文字符"方正"的特性,设计了连通分量提取+滑动窗组合的策略。该策略在不影响英文文本行检测效果的同时,解决了中文字符被提取成多个字符候选域的问题。而在候选文本行生成算法中,本文则充分利用了文本行的方向一致性,以图分割的方式来提取候选文本行。本文基于ICDAR-13和MSRA-TD500这两个国际标准数据集,对提出的算法进行了评估。实验结果表明,对于自然场景中任意方向的中英文文本行,算法能很好地完成检测任务,其性能达到了国际一流水平。
[Abstract]:The text in the natural scene usually contains a lot of valuable information, which provides important clues for understanding and analyzing the scene. For many visual applications, text detection algorithm in natural scene is the key technology. Therefore, in recent decades, the research field has attracted the attention of a large number of scholars at home and abroad, and the performance of the algorithm has been improved day by day. A typical text detection algorithm consists of four steps: character candidate field extraction, non-character field filtering, candidate text line generation and candidate text line validation. However, there is a problem of error propagation in this process. Once the real character field is error-filtered in the second stage, it will affect the subsequent candidate row generation and the candidate row validation phase, resulting in a low system final recall rate. To solve this problem, an adaptive line clustering algorithm for text detection in natural scenes is proposed. The algorithm does not filter non-character fields based on character-level features, but assigns a text / non-text character probability value to each candidate field. Then, after the algorithm generates the set of candidate text lines, the system makes full use of the characteristics of the text line level to map each candidate line into a point in the three-dimensional space. Finally, the concatenated clustering strategy is used to distinguish the true and false text lines in the current images, and the final output results are obtained. On the other hand, in order to make the algorithm complete the task of detecting Chinese and English text lines in any direction in natural scene, this paper proposes a new algorithm of character candidate field extraction and candidate text line generation algorithm. In the algorithm of character candidate domain extraction, based on the characteristic of Chinese character "square", we design the strategy of connected component extraction sliding window combination. The strategy solves the problem that Chinese characters are extracted into multiple character candidate fields without affecting the effect of line detection in English text. In the algorithm of generating candidate text line, this paper makes full use of the direction consistency of text line, and extracts candidate text line by graph segmentation. Based on two international standard data sets ICDAR-13 and MSRA-TD500, the proposed algorithm is evaluated. The experimental results show that the algorithm can complete the task of detecting Chinese and English text lines in any direction of the natural scene, and its performance reaches the international first-class level.
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41;TP391.1
【相似文献】
相关期刊论文 前10条
1 程彩娟;“八后问题”的算法与程序设计[J];天津职业技术师范学院学报;1991年02期
2 葛磊;武芳;王鹏波;张冬林;;3维建筑综合中基于最小特征的面平移算法[J];测绘科学技术学报;2009年02期
3 骆雯,孙延明,陈振威,陈锦昌;判断点与封闭多边形相对关系的改进算法[J];机械;1999年03期
4 李林;卢显良;;一种基于切割映射的规则冲突消除算法[J];电子学报;2008年02期
5 刘巧玲;张红英;林茂松;;一种简单快速的图像去雾算法[J];计算机应用与软件;2013年07期
6 林亚平,杨小林;快速概率分析进化算法及其性能研究[J];电子学报;2001年02期
7 章郡锋;吴晓红;黄晓强;何小海;;基于暗原色先验去雾的改进算法[J];电视技术;2013年23期
8 杨铁军;靳婷;;一种动态整周模糊值求解算法及其仿真分析[J];系统工程与电子技术;2007年01期
9 周秀玲;郭平;陈宝维;王静;;几种计算超体积算法的比较研究[J];计算机工程;2011年03期
10 吴一戎,胡东辉,彭海良;Chirp Scaling SAR成象算法及其实现[J];电子科学学刊;1995年03期
相关会议论文 前10条
1 尹冀锋;;一种新的图象自适应增强算法[A];四川省通信学会一九九二年学术年会论文集[C];1992年
2 宁春平;田家玮;郭延辉;王影;张英涛;郑桂霞;刘研;;计算机辅助增强、分割算法在鉴别乳腺良、恶性肿块中的应用价值[A];中华医学会第十次全国超声医学学术会议论文汇编[C];2009年
3 谢丽聪;;SVB查询改写算法的改进[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
4 郑存红;;复杂背景下相关跟踪算法研究及DSP实现[A];中国光学学会2010年光学大会论文集[C];2010年
5 杨文杰;吴军;;RFID抗冲突算法研究[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
6 高山;毕笃彦;魏娜;;一种基于UPF的小目标TBD算法[A];第十四届全国图象图形学学术会议论文集[C];2008年
7 周磊;张卫华;王晓奇;张军;;基于流水算法的智能路障机器人设计[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年
8 潘巍;李战怀;陈群;索博;李卫榜;;面向MapReduce的非对称分片复制连接算法优化技术研究[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
9 李伟伟;蔡康颖;郑新;王文成;;3D模型中重复结构的多尺度快速检测算法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
10 杨任尔;陈恳;励金祥;;基于棱边方向检测的运动自适应去隔行算法[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
相关重要报纸文章 前1条
1 国泰君安资产管理部;“算法交易”是道指暴跌罪魁祸首?[N];上海证券报;2010年
相关博士学位论文 前10条
1 冯辉;网络化的并行与分布式优化算法研究及应用[D];复旦大学;2013年
2 许玉杰;云计算环境下海量数据的并行聚类算法研究[D];大连海事大学;2014年
3 李琰;基于猫群算法的高光谱遥感森林类型识别研究[D];东北林业大学;2015年
4 陈加顺;海洋环境下聚类算法的研究[D];南京航空航天大学;2014年
5 王洋;基于群体智能的通信网络告警关联规则挖掘算法研究[D];太原理工大学;2015年
6 雷雨;面向考试时间表问题的启发式进化算法研究[D];西安电子科技大学;2015年
7 熊霖;大数据下的数据选择与学习算法研究[D];西安电子科技大学;2015年
8 周雷;基于图结构的目标检测与分割算法研究[D];上海交通大学;2014年
9 王冰;人工蜂群算法的改进及相关应用的研究[D];北京理工大学;2015年
10 周旭;复杂网络中社区发现算法研究[D];吉林大学;2016年
相关硕士学位论文 前10条
1 姚鑫宇;EMD去噪与MUSIC算法在DOA估计中的联合应用[D];昆明理工大学;2015年
2 陆进;面向含噪数据聚类相关算法的研究[D];复旦大学;2014年
3 李家昌;基于能量约束的超声图像自动分割算法[D];华南理工大学;2015年
4 陈坚;基于密度和约束的数据流聚类算法研究[D];兰州大学;2015年
5 高健;基于Zynq7000平台的去雾算法研究及实现[D];南京理工大学;2015年
6 顾磊;基于Hadoop的聚类算法的数据优化及其应用研究[D];南京信息工程大学;2015年
7 杨燕霞;基于Hadoop平台的并行关联规则挖掘算法研究[D];四川师范大学;2015年
8 王羽;基于MapReduce的社区发现算法的设计与实现[D];南京理工大学;2015年
9 许振佳;流式数据的并行聚类算法研究[D];曲阜师范大学;2015年
10 董琴;人工蜂群算法的改进与应用[D];大连海事大学;2015年
,本文编号:2032020
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2032020.html