当前位置:主页 > 科技论文 > 软件论文 >

最大稳定极值区域与笔画宽度变换的自然场景文本提取方法

发布时间:2019-05-09 22:31
【摘要】:针对从背景复杂、视角多变、语言形式多样的场景图像中难以准确提取文本信息的问题,提出了一种基于最大稳定极值区域(MSER)和笔画宽度变换(SWT)场景文本提取方法。该方法结合MSER、SWT算法的优点,采用MSER算法的准确检测文字区域,建立文本候选区域,利用SWT算法计算文本候选区域笔画宽度得到候选文本区域的笔画宽度;根据笔画宽度图,利用连通域标记建立笔画宽度连通图,然后根据笔画宽度连通图,建立笔画连通图的启发性规则,删除非文本候选区域,并根据文本的几何特征分析及局部自适应窗口最大类间方差(Otsu)分割,有效提取出自然场景图像中的文本,文本提取的准确率、召回率及综合性能分别为0.74、0.64及0.68。仿真实验结果表明,在文本视角多变,字符大小、尺寸、字体各异的复杂条件下,所提方法具有较好的鲁棒性,适用于多语言和多字体混合的场景文本提取。
[Abstract]:In order to solve the problem that it is difficult to extract text information accurately from scene images with complex background, changeable visual angles and diverse language forms, a (SWT) scene text extraction method based on maximum stable extremum region (MSER) and stroke width transformation is proposed. Combined with the advantages of MSER,SWT algorithm, this method uses MSER algorithm to detect the text region accurately, establishes the text candidate region, and calculates the stroke width of the candidate text region by using SWT algorithm to obtain the stroke width of the candidate text region. According to the stroke width diagram, the stroke width connection map is established by using the connected domain mark, and then the enlightening rules of the stroke connection graph are established according to the stroke width connection graph, and the non-text candidate regions are deleted. According to the geometric feature analysis of the text and the (Otsu) segmentation of the maximum variance between classes of local adaptive windows, the text in the natural scene image is effectively extracted, and the accuracy of the text extraction is achieved. The recall rate and comprehensive performance were 0.74, 0.64 and 0.68, respectively. The simulation results show that the proposed method has good robustness under the complex conditions of variable text perspective, character size, size and font, and is suitable for multi-language and multi-font mixed scene text extraction.
【作者单位】: 西安交通大学电子与信息工程学院;
【基金】:国家自然科学基金资助项目(61306111)
【分类号】:TP391.41

【相似文献】

相关期刊论文 前10条

1 彭浩;陈继锋;刘琼;王海涛;高海波;;一种面向聚焦爬虫的自然场景文本定位技术[J];小型微型计算机系统;2014年09期

2 戴津;;自然场景中文本检测技术研究综述[J];计算机光盘软件与应用;2013年18期

3 古辉;芦亚亚;丁维龙;王杰;张维统;;自然场景下果实目标的识别和定位[J];浙江工业大学学报;2007年03期

4 皮学贤;李思昆;宋君强;;一种新的离散格子气模型及其在自然场景仿真中的应用[J];计算机工程与科学;2006年10期

5 杨丹;李博;赵红;;鲁棒视觉词汇本的自适应构造与自然场景分类应用[J];电子与信息学报;2010年09期

6 刘宏;普杰信;;一种改进的自然场景特征提取方法[J];计算机工程;2011年21期

7 张冬梅;张全元;郑达;郑蔚;李晖;戴光明;;一种新的自然场景标志牌文本提取算法[J];计算机工程与应用;2007年24期

8 常莹;何东健;李宗儒;;基于聚类与边缘检测的自然场景文本提取方法[J];计算机工程与设计;2010年18期

9 徐琼;干宗良;刘峰;陈昌红;;基于提升树的自然场景中文文本定位算法研究[J];南京邮电大学学报(自然科学版);2013年06期

10 陆培源;王建中;施家栋;;基于纹理基元与颜色的室外自然场景分类[J];北京理工大学学报;2011年11期

相关会议论文 前1条

1 霍静萍;杜建政;;自然场景视觉记忆中颜色的作用途径[A];第十一届全国心理学学术会议论文摘要集[C];2007年

相关博士学位论文 前5条

1 王润民;自然场景文字检测方法研究[D];华中科技大学;2015年

2 吴锐;自然场景中文本识别技术研究及实现[D];哈尔滨工业大学;2010年

3 黄剑华;自然场景中文本信息提取方法[D];哈尔滨工业大学;2007年

4 孙雷;自然场景图像中的文字检测[D];中国科学技术大学;2015年

5 刘晓佩;自然场景文本信息提取关键技术研究[D];西安电子科技大学;2014年

相关硕士学位论文 前10条

1 闫鹏;基于级联卷积网络的自然场景下的车牌检测[D];郑州大学;2015年

2 陈帅;自然场景下基于局部模型的车体检测及其并行化方法研究[D];郑州大学;2015年

3 江彤;层次化的自然场景文本检测算法研究[D];大连海事大学;2015年

4 李敏强;自然场景维吾尔文本区域检测[D];新疆大学;2015年

5 罗龙润;多标注源多标记排序研究[D];东南大学;2015年

6 王毅;自然场景下文本区域定位方法的研究[D];哈尔滨工业大学;2016年

7 杨帆;基于脑电的自然场景下目标的快速识别研究[D];云南大学;2014年

8 王炜;基于角点和颜色的自然场景文字定位技术研究[D];西安电子科技大学;2011年

9 葛巧瑞;自然场景下的文字分割及识别研究[D];西安电子科技大学;2012年

10 刘宏;基于双目视觉的自然场景感知[D];河南科技大学;2011年



本文编号:2473134

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2473134.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b9ba1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com