基于深度学习的文本识别与检索应用研究

发布时间:2021-12-11 10:39
  随着智能手机等便携式拍摄设备的不断普及,图像正越来越多的被人们当作信息载体的首选,计算机视觉技术的不断革新,使得无人驾驶、人机交互、智能安防的等新兴人工智能应用场景也不断增加。海量图片信息时代的到来和不断增加的人工智能应用场景,如何让计算机准确的理解图像信息正受到人们越来越多的关注。而文本元素因为其丰富的语义信息,对自然场景图像中文本的检测识别可以帮助计算机更准确的理解图像信息。另一方面,传统的文本识别技术仅适用于各类字符大小规范、字体统一以及文本间隔固定的印刷体文档识别,如各类证件、票据、文档等。而对于存在于自然场景中的文本信息,由于背景复杂、字体字号多变以及噪声多样等原因,使得传统的文本识别方式难以进行有效的精准识别。同时,带有文本信息的图像数据量的不断扩大,对图像数据的分类、编码、存储、检索和维护等过程也提出了更高的要求,特别是图像数据的检索,针对图像理解中的文本元素和证件、车牌、票据等文本载体中的文本内容,构建一个通过检索文本信息从海量的图像数据中得到包含文本信息的目标图像的检索应用也是一个新兴的应用方向。随着近年来深度学习技术的不断发展,区别于依靠人工经验提取的特征,深度学习... 

【文章来源】:大连海事大学辽宁省 211工程院校

【文章页数】:90 页

【学位级别】:硕士

【部分图文】:

基于深度学习的文本识别与检索应用研究


图1.1文本区域噪音严重??Fig.?1.1?A?lot?of?noise?in?the?text?area??-2?-??

彩色图像,文本,样式,现状


?大连海事大学硕士学位论文???(3)文本样式多样、分布随机。文档图像中文本信息布局相对固定,文本按行排??列,且行与行、字符与字符之间的间隔相对均匀,但在自然场景中的文本,文本位置、??文字大小与间隔甚至文字排列都十分随意,有些广告文本为了吸引眼球,一段文本内容??常常结合多种文字大小和排列方式。一些手写体或者艺术体文本中还常常通过字符与字??符黏连、对字符进行扭曲、变形和增加阴影边框等方式产生各式各样的文字效果,如图??1.2所示。??图1.2文本样式多样、分布随机??Fig.?1.2?Variety?of?text?styles?and?random?text?positions??1.2.?2文本检测识别技术研究现状??传统的文本检测识别一般分为三个步骤:图像预处理、文木区域检测、文本识别。??其中文本识别又可以细分为特征提娶字符识别、结果矫正等[3]。??图像预处理过程主要是为减少图像中的无用信息,以便后续进行文本特征提取和学??习,预处理通常包括灰度化、降噪、二值化、文本尺度归一化、倾斜校正等。灰度化主??要针对彩色图像,二值化处理使得图像只保留黑白两种色彩,降噪是为了去除二值化后??留下的噪声数据,文本尺度归一化是为了将文字图像规整到统一的尺寸下方便进行文字??识别,对倾斜图像还需要进行倾斜校正。??传统的文本检测算法主要根据两类文本特征进行检测:文本的节_特征和文木的颜??色亮度特征。由于文本笔画的宽度、纹理、颜色和强度等都与背景饤较人的差异,所以??笔画信息常作为文本检测一个重要特征。自然场景中的文本颜色和亮度信息也常作为区??分背景和文本的一大依据,其中自然场景屮文木信息,常常令边缘颜色与

绪论,文本


在相似度阈值为0.8的情况下在人工标注图像上达到了?70.6%的识别准确率。??(4)实现了一个基于文本识别的图像检索应用。通过python扩展包Piexif操作图??像Exif信息,在基于python的Web开发微框架Flask上构建了一个图像检索应用,应??用通过文本检测识别模型得到图像中文本信息并写入图像Exif信息,并利用检索词匹配??Exif信息的方式得到目标图像,最后介绍了应用实现的流程和方法,并对应用各个功能??进行了展示。??1.3.2本文结构安排??文本结构安排如图1.4所示,章节具体内容如下:??广?1绪论?、??自然场杲下传统OCR?|图?检索应用仍是??技术准确率急剧下降1新兴方向??L?!?)??^?|??3基于CTPN的文本?^?'??习??卜基于文本识别??鱗理^?4;;二:二'…1的图像检素应用j??L?J?^的文本识别模型」??I?I??6总结与展望??图1.4结构安排??Fig.?1.4?Chapter?structure??第一章绪论。本章首先讲述了课题的研宄背景和意义。基于现实背景,着重强调??了文本检测识别与图像检索研宄的价值与意义。分析与调研了文本检测识别相关技术的??-8-??

【参考文献】:
期刊论文
[1]自然场景图像中的文本检测方法研究[J]. 李东勤,王芳,周万怀.  重庆科技学院学报(自然科学版). 2016(06)
[2]汉字识别方法综述[J]. 孙华,张航.  计算机工程. 2010(20)
[3]用于手写汉字识别的级联MQDF分类器[J]. 付强,丁晓青,刘长松.  清华大学学报(自然科学版)网络.预览. 2008(10)

硕士论文
[1]基于深度学习的图像文本识别系统研究与实现[D]. 吴晓玮.北京邮电大学 2018
[2]基于深度学习的自然场景文字识别[D]. 黄攀.浙江大学 2016



本文编号:3534528

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3534528.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户9f71c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com