当前位置:主页 > 科技论文 > 软件论文 >

自然场景中文本检测识别系统的设计与实现

发布时间:2019-05-17 00:51
【摘要】:随着智能手机等移动互联网设备以及4G网络等无线高速上网方式的普及,使得人们获得信息的途径越发的丰富、广泛和便捷。图像在传播信息媒介中所占的比例越来越大,已经远远超过传统的文本形式。图像中的文本包含着很多有价值的信息。在图像中可被获取的信息中,人眼的注意力尤其会被文本所吸引[17]。传统的文本检测识别技术专注于扫描文档、票据以及格式统一的文本检测,很少涉及自然场景图片中的文本检测。准确检测和识别自然场景中的文本对于图像的语义理解具有重要意义。本论文的工作内容是基于该作者的实习单位的研究项目进行的。研究重点为移动通信中违规图像的过滤。作者独立完成了以下工作内容:自然场景中文本检测识别系统的设计与实现。作者利用计算机视觉领域的相关知识,采用模式识别和深度学习中的一些算法,从自然场景图片中检测出标识文本,并且通过实验验证了其有效性。系统包括图像的预处理、文本位置检测、文本识别等功能模块。其中,图片的预处理模块对输入数据进行灰度化、增强文本对比度。文本检测模块利用最大稳定极值区域(Maximally Stable Extremal Regions,MSER)算法提取候选区域,并通过深度神经网络提取深度特征。文本识别模块利用识别神经网络进行文本识别,并通过语言模型修正识别结果。自然场景中文本检测识别系统被应用于检测和识别网络图像中的文本信息,提供文本信息线索给违规图像过滤系统。测试结果表明,融合了自然场景文本检测识别系统的违规图像过滤取得了更好的性能,从而达到了设计目标。
[Abstract]:With the popularity of mobile Internet devices such as smartphones and 4G networks, people's access to information is becoming more and more abundant, extensive and convenient. The proportion of images in the communication information media is more and more large, which has far exceeded the traditional text form. The text in the image contains a lot of valuable information. In the information that can be obtained in the image, the attention of the human eye is especially attracted to the text [17]. The traditional text detection and recognition technology focuses on scanning documents, bills and uniform format text detection, and rarely involves text detection in natural scene pictures. Accurate detection and recognition of text in natural scenes is of great significance for semantic understanding of images. The content of this paper is based on the research project of the author's internship unit. The research focuses on the filtering of illegal images in mobile communication. The author completes the following work independently: the design and implementation of the natural scene Chinese text detection and recognition system. Based on the relevant knowledge in the field of computer vision, the author uses some algorithms in pattern recognition and deep learning to detect the identification text from the natural scene picture, and verifies its effectiveness through experiments. The system includes image preprocessing, text position detection, text recognition and other functional modules. Among them, the preprocessing module of the picture grays the input data to enhance the text contrast. The text detection module uses the maximum stable extremum region (Maximally Stable Extremal Regions,MSER algorithm to extract the candidate region, and the depth feature is extracted by the depth neural network. Text recognition module uses recognition neural network for text recognition, and modifies the recognition results through language model. The natural scene Chinese text detection and recognition system is used to detect and recognize the text information in the network image, and to provide the text information clue to the illegal image filtering system. The test results show that the illegal image filtering combined with the natural scene text detection and recognition system achieves better performance, thus achieving the design goal.
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41

【相似文献】

相关期刊论文 前10条

1 陈庆荣;蒋志杰;;自然场景信息提取和验证加工的眼动研究(英文)[J];Journal of Southeast University(English Edition);2010年03期

2 彭浩;陈继锋;刘琼;王海涛;高海波;;一种面向聚焦爬虫的自然场景文本定位技术[J];小型微型计算机系统;2014年09期

3 戴津;;自然场景中文本检测技术研究综述[J];计算机光盘软件与应用;2013年18期

4 古辉;芦亚亚;丁维龙;王杰;张维统;;自然场景下果实目标的识别和定位[J];浙江工业大学学报;2007年03期

5 皮学贤;李思昆;宋君强;;一种新的离散格子气模型及其在自然场景仿真中的应用[J];计算机工程与科学;2006年10期

6 杨丹;李博;赵红;;鲁棒视觉词汇本的自适应构造与自然场景分类应用[J];电子与信息学报;2010年09期

7 刘宏;普杰信;;一种改进的自然场景特征提取方法[J];计算机工程;2011年21期

8 张冬梅;张全元;郑达;郑蔚;李晖;戴光明;;一种新的自然场景标志牌文本提取算法[J];计算机工程与应用;2007年24期

9 常莹;何东健;李宗儒;;基于聚类与边缘检测的自然场景文本提取方法[J];计算机工程与设计;2010年18期

10 徐琼;干宗良;刘峰;陈昌红;;基于提升树的自然场景中文文本定位算法研究[J];南京邮电大学学报(自然科学版);2013年06期

相关会议论文 前1条

1 霍静萍;杜建政;;自然场景视觉记忆中颜色的作用途径[A];第十一届全国心理学学术会议论文摘要集[C];2007年

相关博士学位论文 前5条

1 吴锐;自然场景中文本识别技术研究及实现[D];哈尔滨工业大学;2010年

2 王润民;自然场景文字检测方法研究[D];华中科技大学;2015年

3 黄剑华;自然场景中文本信息提取方法[D];哈尔滨工业大学;2007年

4 孙雷;自然场景图像中的文字检测[D];中国科学技术大学;2015年

5 刘晓佩;自然场景文本信息提取关键技术研究[D];西安电子科技大学;2014年

相关硕士学位论文 前10条

1 闫鹏;基于级联卷积网络的自然场景下的车牌检测[D];郑州大学;2015年

2 陈帅;自然场景下基于局部模型的车体检测及其并行化方法研究[D];郑州大学;2015年

3 江彤;层次化的自然场景文本检测算法研究[D];大连海事大学;2015年

4 李敏强;自然场景维吾尔文本区域检测[D];新疆大学;2015年

5 罗龙润;多标注源多标记排序研究[D];东南大学;2015年

6 王毅;自然场景下文本区域定位方法的研究[D];哈尔滨工业大学;2016年

7 江瑶;结合对立颜色理论与多核学习的场景文字检测方法研究[D];江西师范大学;2016年

8 章成全;自然场景文本与非文本图片分类算法研究[D];华中科技大学;2016年

9 师军;自然场景中文本检测识别系统的设计与实现[D];北京交通大学;2017年

10 杨帆;基于脑电的自然场景下目标的快速识别研究[D];云南大学;2014年



本文编号:2478677

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2478677.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户41433***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com