基于深度学习的场景汉字识别问题研究
发布时间:2021-03-16 05:02
文字识别是一种通用的图像理解技术,对信息检索、自动驾驶等应用的研究有着重要意义,基于自然场景图像的文字识别逐渐成为计算机视觉研究中的热点问题,而其中中文场景文字识别是图像识别中最重要和最具挑战的任务之一。与英文字符相比,中文字符结构复杂且种类繁多,识别难度大。随着神经网络的复兴,场景文字检测和识别任务得到了很大推动,近年来涌现了许多基于深度学习的场景文字检测和识别的算法,但大部分都是面向英文数据集的,针对中文场景图像的研究相对欠缺。本文对当前文字检测和识别领域的代表性算法进行研究。鉴于场景汉字识别的研究和实际应用需求,本文主要做了以下三个方面的工作:首先,对于在英文数据集上表现出色的场景文字检测和识别算法分别在英文数据集和中文数据集上进行了大规模的实验和性能对比分析,总结中文场景文字检测和识别问题面临的挑战;其次,对于自然场景中的非水平文本行不易识别的问题,通过在原始图像上根据四边形坐标点进行透视变换,从中裁剪出文本行区域进行识别;最后,根据当前的文字检测和识别算法在中文场景图像中存在的问题,设计了一个基于字符检测的中文场景文字识别算法。一、场景文本检测和识别算法在各个英文和中文数据集...
【文章来源】:河南大学河南省
【文章页数】:83 页
【学位级别】:硕士
【部分图文】:
扫描文档图像
公开数据集发展历程
EAST网络结构图[31]
本文编号:3085458
【文章来源】:河南大学河南省
【文章页数】:83 页
【学位级别】:硕士
【部分图文】:
扫描文档图像
公开数据集发展历程
EAST网络结构图[31]
本文编号:3085458
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3085458.html