基于MSER的自然场景下多方向文本检测算法研究

发布时间:2024-06-03 02:54
  自然场景中的文本蕴含着与周围环境相关的高层语义信息,这些语义信息在无人驾驶、即时翻译系统和安防监控等领域具有指导意义。文本检测是进行图像内容分析的必要步骤,同时也是进行文本识别的基础,然而提取自然场景图像中的文本仍然面临巨大挑战。一方面,场景图像中的文本大小、排列方向、语言类型不同。另一方面,场景图像中不仅存在许多与字符结构相似的背景,而且模糊、低对比度、遮挡、光照等因素,都会对提取文本造成影响。针对以上问题,本文从自然场景下水平方向和任意方向文本检测算法展开研究,主要研究工作如下:1.针对自然场景中水平方向上的文本区域,本文提出基于最大稳定极值区域(Maximally Stable Extremal Regions,MSER)自适应学习的文本检测算法,该算法主要分为两个阶段。在候选区域提取阶段,为解决MSER算法对模糊、光照敏感导致算法召回率和准确率较低的问题,首先采用边缘增强MSER算法提取文本候选区域,然后为提升整体算法检测速度,利用多机制抑制策略粗滤除非文本。在非文本精滤除阶段,提出基于支持向量机(Support Vector Machine,SVM)自适应学习的候选区域验证算...

【文章页数】:92 页

【学位级别】:硕士

【部分图文】:

图3.6嵌套区域滤除结果图

图3.6嵌套区域滤除结果图

重庆邮电大学硕士学位论文第3章基于MSER自适应学习的水平方向文本检测方法34如图3.6所示,通过该方法处理,嵌套区域被全部剔除。(a)嵌套区域(b)处理结果图3.6嵌套区域滤除结果图3.2.4多机制抑制策略边缘增强MSER算法能够提取到自然场景图像中很多文本区域,在带来文本定位....


图3.13基于SVM自适应学习候选区域验证效果图

图3.13基于SVM自适应学习候选区域验证效果图

重庆邮电大学硕士学位论文第3章基于MSER自适应学习的水平方向文本检测方法42通过对训练样本筛选,一共选择6220张图片作为正样本,5330张图片作为负样本,然后提取样本融合特征并结合最佳参数c和g训练SVM分类器,通过训练好的模型完成对候选区域中非文本的精滤除。如图3.13所示....


图4.14倾斜文如表4.6所示为本章所提算法

图4.14倾斜文如表4.6所示为本章所提算法

重庆邮电大学硕士学位论文第4章基于MSER和卷积神经网络的任意方向文本检测方法67建与图像文本行角度近似的最小外接矩形框,较为准确地定位到文本区域。图4.14倾斜文本正确提取效果图如表4.6所示为本章所提算法与当前存在的任意方向文本检测方法在ICDAR2015多方向数据集上进行文....


图4.15本章算法检测不准确示意图

图4.15本章算法检测不准确示意图

重庆邮电大学硕士学位论文第4章基于MSER和卷积神经网络的任意方向文本检测方法68于其中的一些对比算法,可以较好地满足实时性。表4.7算法检测速度对比结果Methods分辨率FPS本文方法72012808.25RRPN[55]72012803.70SWT+Randomforest....



本文编号:3988063

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3988063.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户1aeb9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com