基于深度学习的中文OCR算法与系统实现

发布时间：2021-08-23 10:58

　　近年来随着图像处理技术的突飞猛进,特别是深度学习和卷积神经网络的出现,越来越多传统方法被基于深度学习的方法所替代,可是仍有许多应用性问题没有很好的解决方法。在OCR的研究领域里,基于深度学习的方法常被用来解决自然场景中的复杂问题,却少有人关注在真实文本场景中,中文字符的检测和识别的性能差强人意。针对有干扰背景下的中文检测与识别算法的系统实现。本论文主要内容包括以下几个方面:1.提出了中文干扰背景数据集的合成方法:预处理真实背景纹理素材,采用旋转、倾斜变形、Image Matting等图像处理方法,合成中文仿真数据集,增加了识别算法的泛化效果。2.提出了基于CTPN+CRNN的复杂背景下的中文检测与识别方法:CTPN适合检测水平文字的特性,将合成的数据集与真实场景的数据集结合,继续扩充检测训练集的丰富性,再对检测模型进行训练。使用合成的中文数据集对CRNN模型进行训练,解决了部分中文无法识别的问题,降低部分字符因背景干扰引起的识别错误率。3.研发了基于嵌入式的中文检测和识别系统:将本文的方法在嵌入式端上实现,进行测试和分析,设计并实现整个应用系统。本文研究传统OCR技术和深度学习应用场景...

【文章来源】：中国科学院大学(中国科学院深圳先进技术研究院)广东省

【文章页数】：83 页

【学位级别】：硕士

【部分图文】：

基于深度学习的中文OCR算法与系统实现

（a）文本场景（b）自然场景来源https://www.baidu.com/

中文文本,场景图,背景,自然场景

场景中的字数多，但是排布规范，虽然是手机简单拍摄，文字。自然场景中的标语牌，同样是手机随意的一拍，虽然字数不却很丰富，不同的大小、字体、角度、颜色等。图 1.1（a）文本场景（b）自然场景来源 https://www.baidu.com/

示意图,神经网络,示意图,定制化

应用市场上已经有许多提供图像文字检测和识别服务的服务百度、腾讯、阿里、谷歌、微软、亚马逊等大型云服务互联了一些活跃在视频直播、教育、电子商务、电子政务、安全体细分的行业服务企业。这些企业一般都是向使用者提供一，直接进行场景文本识别、证件数字的文本识别、扫描文档。也有的企业通过出售或定制扫描仪、读卡器、智能设备提供的特定的数据集训练定制化模型，以及提供定制化 AI 定制化的服务模型，一般只针对应用场景的特定本文有用身份证件等小范围场景。习及相关技术网络

【参考文献】：
期刊论文
[1]一种用于文本检测和文本识别的单一神经网络[J]. 张秀杰,董超俊.  工业控制计算机. 2018(08)
[2]深度学习在手写汉字识别中的应用综述[J]. 金连文,钟卓耀,杨钊,杨维信,谢泽澄,孙俊.  自动化学报. 2016(08)
[3]试论黑体字的发展源流及特征[J]. 吴卫,李婧.  设计. 2015(09)
[4]自然场景下基于连通域检测的文字识别算法研究[J]. 刘新瀚,钱侃,王宇飞,朱向霄,孙知信.  计算机技术与发展. 2015(05)
[5]深度学习研究综述[J]. 孙志军,薛磊,许阳明,王正.  计算机应用研究. 2012(08)
[6]自适应最小误差阈值分割算法[J]. 龙建武,申铉京,陈海鹏.  自动化学报. 2012(07)
[7]支持向量机理论与算法研究综述[J]. 丁世飞,齐丙娟,谭红艳.  电子科技大学学报. 2011(01)
[8]利用改进的Retinex进行人脸图像光照处理[J]. 葛微,李桂菊,程宇奇,薛陈,朱明.  光学精密工程. 2010(04)
[9]图像特征点提取及匹配技术[J]. 杨晓敏,吴炜,卿粼波,华骅,何小海.  光学精密工程. 2009(09)
[10]一种基于字词联合解码的中文分词方法[J]. 宋彦,蔡东风,张桂平,赵海.  软件学报. 2009(09)

博士论文
[1]Web文本挖掘中若干问题的研究[D]. 王占一.北京邮电大学 2012
[2]文本检索中若干问题研究[D]. 王秀娟.北京邮电大学 2006

硕士论文
[1]基于深度学习的自然场景文字识别[D]. 黄攀.浙江大学 2016
[2]基于Tesseract-OCR的名片识别系统的研究与实现[D]. 万松.华南理工大学 2014
[3]论宋体字的形成与特征[D]. 杨艳芳.南京艺术学院 2011
[4]隶书的产生及其审美价值研究[D]. 杨艳.曲阜师范大学 2010

本文编号：3357736

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/shengwushengchang/3357736.html

上一篇：面向组织工程的生物三维打印复合成型系统开发及实验研究
下一篇：基于卷积边缘增强的HER2图像分级算法的研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|