基于SSD算法的自然场景文字检测研究

发布时间：2021-09-02 17:39

　　计算机视觉领域一直吸引着研究人员不断的探究,该领域技术可应用于生产控制、智慧城市、信息提取等诸多方面,其中对自然场景中文字的检测是提取出图像中高级文字信息的关键技术之一。近年来伴随着深度学习技术的发展,大量自然场景文字检测方法被提出,如何融合这些方法的优点达到更好的检测效果,是该领域的研究热点。本文在研究多种自然场景文字检测模型的基础上,提出一种基于SSD算法的自然场景文字检测模型。该模型利用本文提出的外部交互校正方法,融合了语义分割和目标检测这两种经典文字检测框架。所提出的融合方法同时运行语义分割算法和目标检测算法分别获得文字检测结果,再将两种方法的检测结果进行相互修正。为了改进现有文字检测方法,本文首先对SSD算法进行改造,引入多层Inception结构,同时根据自然场景文字特点修改默认文字边界框的尺寸。在分别获得改进后SSD算法和语义分割算法的检测结果后,使用本文提出的边界框增强模块,逐项利用语义分割结果计算SSD检测结果的区域中值概率,并根据概率值判断该文字边界框保留状态。为了进一步使用语义分割结果,本文提出了一个语义边界框模块,该模块使用全连接条件随机场处理语义分割结果中的文...

【文章来源】：西安电子科技大学陕西省 211工程院校教育部直属院校

【文章页数】：82 页

【学位级别】：硕士

【部分图文】：

基于SSD算法的自然场景文字检测研究

自然场景图像中包含文字信息文字检测技术是诸如文字识别技术等诸多技术的一个基础技术，它有着丰富的应

示意图,文字检测,自然场景,难点

文字检测技术对其进行识别，并在工厂的生产数据库中判定是否组装和连接正确，对所生产的产品进行自动化检测。图1.2 自然场景文字检测难点示意图图像是以二维矩阵的形式存储在存储设备当中，通常使用红、绿、蓝即 RGB 来表示所拍摄对象的形状、颜色等底层信息。与人不同的是，计算机需要从图像的像素矩阵这种底层信息中，通过一定的处理手段获取图像中的目标信息，如何赋予计算机这种能力是一件繁琐且困难的事情。自然场景图像中的文字具有极大的多样性，例如全球共有 4000 多种文字，其中使用人口较多的就有几百种，这么多文字种类的样式迥异，同时在自然场景图像中的文字大小、所处的位置、字体和颜色、图像中文字与背景的对比度、图像明暗程度、受到不均匀光照等等都有所不同；同时由于拍摄的随意性和文字本身的特性，文本行可能是以各种角度甚至是弯曲排列的；由于是自然场景中的文字

框图,框图,算法,文字检测

达到文字检测的目标。]提出了一种新的自然图像文本检测方法，该方法 3D 自然场景文字；其次，使用合成的图像训练络在图像中的所有位置和多个尺度上都能有效地法框图如图 1.3 所示。

【参考文献】：
博士论文
[1]自然场景图像中的文字检测[D]. 孙雷.中国科学技术大学 2015
[2]自然图像中文字检测与识别研究[D]. 姚聪.华中科技大学 2014

硕士论文
[1]自然场景图像中的文字检测关键算法研究[D]. 田彪.南京邮电大学 2016

本文编号：3379442

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/shengwushengchang/3379442.html

上一篇：基于区块链的医疗数据访问控制与共享方案研究
下一篇：单幅图像超分辨率重建方法及其视觉位移测量应用研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|