基于深度卷积神经网络的不规则形状文字行检测方法研究

发布时间:2021-01-02 00:14
  基于场景图像的自动文字检测是光学字符识别系统的第一步,是光学字符识别系统可以应用于各行各业的重要保证。自然场景文字检测技术已经成为计算机视觉和模式识别领域的研究热点,在日常生活和工作中如场景理解、产品检索、自动驾驶、地图制作、图像视频监控和文档检索系统等领域都有着广泛的应用,给人们的生活和工作提供了极大的便利。此外,随着大数据的爆发和计算机计算能力的提高,深度学习得到了快速的发展,并从学术研究领域迅速落地到工业界。深度学习的优势是不需要手工设计特定任务的特征,可以根据任务自动的从大量数据中学习特征,同时学到的特征有较好的鲁棒性和识别性能。由于深度学习具有上述优势,因此基于深度学习的场景文字检测方法取得了很大的进步,对于形状和长度比较规则的场景文字已经取得了不错的检测效果。但是由于卷积神经网络的感受野以及矩形框、四边形等简单的文字目标表达方式的限制,过去的场景文字行检测方法在遇到很长的文字行和不规则形状的文字行时,其检测性能还不够好,极端场景的文字检测还存在不少挑战。为了解决以上问题,本文针对性地设计了一个原创的文字检测器,该检测器包括了一个初级文字检测器、一个迭代修正模块和一个形状表达... 

【文章来源】:厦门大学福建省 211工程院校 985工程院校 教育部直属院校

【文章页数】:69 页

【学位级别】:硕士

【部分图文】:

基于深度卷积神经网络的不规则形状文字行检测方法研究


图1.1文字行检测中遇到的两种挑战

基于深度卷积神经网络的不规则形状文字行检测方法研究


对称邻城涟波字符提取算法流程

基于深度卷积神经网络的不规则形状文字行检测方法研究


图2.3基于RGB-D的字符提取算法流程丨圳

【参考文献】:
期刊论文
[1]一种基于SWT面向RGB-D图像的高效字符检测算法[J]. 宋云涛,刘烨,王源彬,陈雁秋.  微型电脑应用. 2015(09)
[2]复杂彩色图像中的字符提取算法[J]. 刘新星,汪增福.  模式识别与人工智能. 2006(06)



本文编号:2952262

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2952262.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5f887***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com