当前位置:主页 > 科技论文 > 自动化论文 >

基于深度学习的文本检测识别算法研究及应用

发布时间:2024-04-11 21:32
  文本检测和文本识别作为计算机视觉领域中的热点研究问题备受关注,这两个领域在工作和生活中都有着广泛的应用,如证件中信息的识别、文档中文字的识别、车牌号识别和工业生产自动化技术等。这两个领域相辅相成,构成一个完整的光学字符识别(Optical Character Recognition,OCR)系统。其中,文本检测部分是文本识别部分的前提和基础,用来从一张大图中找到文本行所在位置,文字识别部分用来对找到的文本行进行识别,输出系统的最后结果,二者共同决定了一个OCR系统的最终性能。在过去,文本检测和文本识别算法基本都是基于人工设计的特征和传统的图像处理方法完成的,这类特征和算法设计困难,需要大量的专业知识和经验支撑,因此精度不高,不具有泛化性。近年来,深度学习技术快速发展,在图像分类、目标检测、语义分割等计算机视觉领域取得了突破性的进展和成果。深度学习类算法是数据驱动型算法,基于深度学习的算法通过迭代训练,自动发现和学习到大量数据中隐含的特征规律,无需过多的人为干预,因此相较于传统的图像处理相关算法具有更好的泛化性。本论文针对雷管编码字符的检测与识别这一具体的工程问题,对基于深度学习的文本检...

【文章页数】:61 页

【学位级别】:硕士

【部分图文】:

图2-1雷管实物图

图2-1雷管实物图

图2-1雷管实物图Fig.2-1Thephotoofdetonator所示为雷管图像采集系统,文中提及的所有雷管图像均由包括一个防爆盒、一个线阵CCD(ChargeCoupledDevice)ghtEmittingDiode)光源和一个旋转电机。由于雷管的形状,....


图2-2雷管编码图像采集系统示意图

图2-2雷管编码图像采集系统示意图

图2-1雷管实物图Fig.2-1Thephotoofdetonator示为雷管图像采集系统,文中提及的所有雷管图像均括一个防爆盒、一个线阵CCD(ChargeCoupledDevitEmittingDiode)光源和一个旋转电机。由于雷管的形所以采用传统的CCD....


图2-3采集到的雷管图像

图2-3采集到的雷管图像

第二章雷管图像采集系统及标注工具免有一些雷管字符不能被完整地捕捉到,电机带动相机旋转的通过控制旋转电机转动的速度和时间,我们可以获得固定高度本文中,所有获取到的雷管图像的大小均为320像素×640像素(明图像大小的单位均为像素值)。虽然这样能保证雷管表面所捉到,但是可能会....


图2-4雷管图像定位标注工具运行界面

图2-4雷管图像定位标注工具运行界面

广东工业大学硕士学位论文仅需要关注雷管图像中较难检测的特例,这样的做法可以大大提高雷度。因此,本文提出两种雷管图像自动标注工具,分别为定位标注工具。种为雷管图像定位标注工具,本标注工具采用Qt程序开发框架开发编写,依次完成图片读取、图片显示、图像检测、坐标操作和坐标保存4所....



本文编号:3951176

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3951176.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ea3b2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com