自然场景文字鉴别和检测算法研究
发布时间:2021-10-12 11:33
随着多媒体信息时代的来临,每天都会有各种各样的信息在大量产生并传播,而文字则是这些信息最重要的载体之一。因此,能够有效地检测到在自然场景条件下的文字,对于计算机理解图像中包含的高层语义信息十分重要,具有巨大的研究和应用价值。自然场景文字检测在车辆自动驾驶、智能导航、可视化交互、智能机器人等诸多应用场景有着广阔的前景和需求。目前,虽有大量算法应用于自然场景文字检测,但是大多数算法模型基于传统的人工设计特征和浅层模型,往往无法有效地学习到高层的语义特征并很好地对它们之间的关系进行建模。随着深度学习(Deep Learning)的提出和广泛应用,得益于深度卷积神经网络强大的自动学习特征能力和特征建模能力,深度学习在很多领域取得了成功,学术界与工业界开始着手将深度学习应用到自然场景文字检测算法里。本文针对自然场景下的文字所具有的几种特性如:尺寸变化大、宽高比例变化大、背景复杂易混淆、图片模糊、变形、光照不足等,以及根据现有算法模型的不足,在已有的相关理论和技术的基础上,提出与构建了一个基于深度卷积神经网络的自然场景下文字检测系统,并用实验对模型的文字检测效果进行验证。本文的主要工作包括以下几个...
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:93 页
【学位级别】:硕士
【部分图文】:
本文提出的文字检测系统总体流程图
图 2-2 Faster RCNN 算法流程示意图[39]出使得物体检测任务进入了端到端的时代,时 RPN 的提出使得网络能够在几乎不花费取物体候选框,大大提升了物体检测算法的迅速成为最为流行的物体检测算法框架之一检测算法的检测效果非常好,然而由于其为N 提取区域候选框和候选框的分类回归两阶以做到实时检测。而 SSD 作为一阶段(On的同时,很好地解决了物体检测算法检测速
图 2-4 YOLO 算法检测结果生成示意图[41]虽然检测速度很快,但 YOLO 也有其缺点,一般来说,YOLO 对于尺寸较的效果较差,对于宽高比例不寻常的物体泛化能力不够强,并且定位也不够体检测算法准确。 自然场景文字检测算法相关工作在本章中,首先会对自然场景文字检测任务作总体的概述,介绍该任务的定价值和需要达到的目标。然后对学术界为研究相关问题所提出的数据集进介绍。最后阐述该领域近年来提出的一些最新研究成果并介绍其中的典型算.1 任务概述在早期阶段,OCR 的概念被定义为将印刷体的字符从纸质文档中识别出来发展至今,识字,已不再仅限于识别书本上的文字,而是要识别真实世界开
【参考文献】:
期刊论文
[1]《新一代人工智能发展规划》解读[J]. 陈震. 科学中国人. 2017(30)
硕士论文
[1]自然场景文字检测方法研究[D]. 徐海良.南京大学 2016
本文编号:3432497
【文章来源】:华中科技大学湖北省 211工程院校 985工程院校 教育部直属院校
【文章页数】:93 页
【学位级别】:硕士
【部分图文】:
本文提出的文字检测系统总体流程图
图 2-2 Faster RCNN 算法流程示意图[39]出使得物体检测任务进入了端到端的时代,时 RPN 的提出使得网络能够在几乎不花费取物体候选框,大大提升了物体检测算法的迅速成为最为流行的物体检测算法框架之一检测算法的检测效果非常好,然而由于其为N 提取区域候选框和候选框的分类回归两阶以做到实时检测。而 SSD 作为一阶段(On的同时,很好地解决了物体检测算法检测速
图 2-4 YOLO 算法检测结果生成示意图[41]虽然检测速度很快,但 YOLO 也有其缺点,一般来说,YOLO 对于尺寸较的效果较差,对于宽高比例不寻常的物体泛化能力不够强,并且定位也不够体检测算法准确。 自然场景文字检测算法相关工作在本章中,首先会对自然场景文字检测任务作总体的概述,介绍该任务的定价值和需要达到的目标。然后对学术界为研究相关问题所提出的数据集进介绍。最后阐述该领域近年来提出的一些最新研究成果并介绍其中的典型算.1 任务概述在早期阶段,OCR 的概念被定义为将印刷体的字符从纸质文档中识别出来发展至今,识字,已不再仅限于识别书本上的文字,而是要识别真实世界开
【参考文献】:
期刊论文
[1]《新一代人工智能发展规划》解读[J]. 陈震. 科学中国人. 2017(30)
硕士论文
[1]自然场景文字检测方法研究[D]. 徐海良.南京大学 2016
本文编号:3432497
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3432497.html