基于CNN的任意分布的场景文本检测与识别方法研究
发布时间:2024-04-14 20:00
对自然场景中的文本区域进行检测,是计算机视觉方面的一个重要应用,同时也为许多应用提供了一部分技术支持,如对视觉障碍者的计算机辅助系统、城市环境中的机器人导航系统、自动驾驶系统等等。目前对扫描文档的检测已经可以满足各种应用场景,但对于自然场景中的文本检测和识别,由于文本只占图像的一小部分,而且自然场景的背景较复杂,自然场景中的文本也有各种颜色、尺寸、形状的区别,同时还有光照、遮挡等因素的影响,因此是一项具有挑战意义的课题。目前针对自然场景文本的检测方法,大多是基于通用目标检测方法,并针对文本的特点进行了相应的改进。本文通过图像处理、模式分类、深度学习、序列处理等方法,对自然场景中的文本检测与识别的方法进行了如下研究,主要分为三个部分:(1)基于文字轮廓的自然场景文本检测方法,本文所提出的候选区域提取方法相较之前的提取方法,采用了基于多通道的弱约束的MSER方法,能够得到更多的候选区域。并在后续的识别工作中提出了将高置信度文本区域与低置信度文本区域相融合的方法,来进一步过滤非文本区域,并自然的将字符区域进行分组,结合成最终所需的文本行区域。定量的实验结果表明,该方法的检测速度优于其他基于笔...
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
本文编号:3955145
【文章页数】:60 页
【学位级别】:硕士
【部分图文】:
图1–1文章结构
图1–1文章结构基于上述的研究内容,本文以下几章节的具体内容安排如下:在第二章中,通过考虑以下的文本自身的特性进行检测,利用字符的边到一些候选区域,可以视为其轮廓,轮廓内的区域一般具有很多相似如颜色、笔画宽度、位置信息等等。通过这些特征来得到最终的字符区用深度神经网络对候....
图2–1基于字符的文本检测方法流程图
得到最终的文本区域,将其结合成单词或文本行。图2–1基于字符的文本检测方法流程图2.2.2候选字符提取大多数图像具有可重复检测并且没有变形的一些局部特征。这些局部特征实际上是具有某些数据依赖性的某些特征区域,因此也被称为重要区域。作为特征区域的必要条件,这些区域中包....
图2-2抑制之前的结果示例
值抑制的方法,抑制重复的极值区域。通过实验,发现在具会产生大量的重复极值区域,为了识别重复的极值区域,采区域组成的ER树进行筛选。如公式(2-2)所示。其中|R|表像素数量。对于每个节点Rt,可以得到一条从Rt到根节点的Rt对于路径上每个父节点的重叠率O(....
图2–3检测及合并示意图
图2–3检测及合并示意图经过上述操作后,可以将低置信度区域分为文本区域和非文本区域。接下来将每个通道的文本区域进行合并。由于是在多个色彩通道上进行分别检测的,所以存在很多相同或相覆盖的区域。这里简单的将重叠区域大于50%的区域进行合并,保留较大的区域。通过神经网络分....
本文编号:3955145
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3955145.html