基于稀疏表示与形态成分分析的场景图像文本检测方法研究
发布时间:2019-09-11 12:27
【摘要】:随着互联网和智能手机的快速发展,图像和视频数据急剧增加,图像检索和图像分类成为计算机视觉领域中重要的研究点。由于图像和视频中往往含有大量的文本,这些文本携带的语意信息在图像检索和分类中很可能起着重要的作用,因而对于图像中文字识别的研究成为一项重要的任务。对于场景图像,文字识别的好坏严重依赖于文本区域的检测,因而文本区域检测技术也吸引了大量研究者的关注。场景图像文本检测受复杂背景、噪声污染和文字的多种形态的干扰,检测的准确率偏低,漏检误检的现象非常普遍。本文针对这些问题展开研究,主要完成了以下研究工作:(1)针对复杂背景与噪声干扰的影响,本文做了相关研究,提出了基于稀疏表示与形态成分分析的场景图像文本检测的方法。该方法首先利用形态成分分析与稀疏表示的方法学习具有判别性的文字和背景字典,然后通过学习的字典重构出待检测图像中的文字部分,最后在重构的图像上进行文本检测。该方法通过学习的过完备字典把文字检测问题转化成稀疏和鲁棒表示的问题。(2)对于基于稀疏表示与形态成分分析的场景图像文本检测方法中字典学习速度慢及适应能力不足的缺点,本文提出了基于在线判别字典学习的场景图像文本检测方法。在线判别字典学习的方法每次更新字典时只随机选择一个训练样本进行训练,可以用于动态样本库的训练,与前一种字典学习方法相比较减少了字典学习的计算量并提高了字典的适应性。(3)本文在公开数据库ICDAR2003/2011/2013和MSRA-TD500上进行实验,结果表明,本文提出的方法与当下流行的方法相比,对于场景图像文本检测问题具有较好的鲁棒性,取得较高的准确率和召回率;本文还对提出的两种方法进行对比,结果表明基于在线判别字典学习的文本检测方法与第一种方法相比不管是在字典学习准确率上还是在检测效果方面,均取得了较好的结果。
【图文】:
提出的方法中,单独训练的两个冗余字典即文字字典和背景字典,,其中,逡逑文字字典能够稀疏地表示图像中的文字部分,不能稀疏地表示图像中的背景部分,逡逑反之亦然;方法流程如图1.2所示,橘红框中的流程图表示字典学习流程,绿框逡逑中的内容为稀疏系数求解流程,深红框为文本检测流程图。逡逑典-学7逦J逦j逦|逡逑_邋_邋^逦?
本文编号:2534413
【图文】:
提出的方法中,单独训练的两个冗余字典即文字字典和背景字典,,其中,逡逑文字字典能够稀疏地表示图像中的文字部分,不能稀疏地表示图像中的背景部分,逡逑反之亦然;方法流程如图1.2所示,橘红框中的流程图表示字典学习流程,绿框逡逑中的内容为稀疏系数求解流程,深红框为文本检测流程图。逡逑典-学7逦J逦j逦|逡逑_邋_邋^逦?
本文编号:2534413
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2534413.html