基于深度学习的中文OCR算法与系统实现
发布时间:2021-08-23 10:58
近年来随着图像处理技术的突飞猛进,特别是深度学习和卷积神经网络的出现,越来越多传统方法被基于深度学习的方法所替代,可是仍有许多应用性问题没有很好的解决方法。在OCR的研究领域里,基于深度学习的方法常被用来解决自然场景中的复杂问题,却少有人关注在真实文本场景中,中文字符的检测和识别的性能差强人意。针对有干扰背景下的中文检测与识别算法的系统实现。本论文主要内容包括以下几个方面:1.提出了中文干扰背景数据集的合成方法:预处理真实背景纹理素材,采用旋转、倾斜变形、Image Matting等图像处理方法,合成中文仿真数据集,增加了识别算法的泛化效果。2.提出了基于CTPN+CRNN的复杂背景下的中文检测与识别方法:CTPN适合检测水平文字的特性,将合成的数据集与真实场景的数据集结合,继续扩充检测训练集的丰富性,再对检测模型进行训练。使用合成的中文数据集对CRNN模型进行训练,解决了部分中文无法识别的问题,降低部分字符因背景干扰引起的识别错误率。3.研发了基于嵌入式的中文检测和识别系统:将本文的方法在嵌入式端上实现,进行测试和分析,设计并实现整个应用系统。本文研究传统OCR技术和深度学习应用场景...
【文章来源】:中国科学院大学(中国科学院深圳先进技术研究院)广东省
【文章页数】:83 页
【学位级别】:硕士
【部分图文】:
(a)文本场景(b)自然场景来源https://www.baidu.com/
场景中的字数多,但是排布规范,虽然是手机简单拍摄,文字。自然场景中的标语牌,同样是手机随意的一拍,虽然字数不却很丰富,不同的大小、字体、角度、颜色等。图 1.1(a)文本场景(b)自然场景来源 https://www.baidu.com/
应用市场上已经有许多提供图像文字检测和识别服务的服务百度、腾讯、阿里、谷歌、微软、亚马逊等大型云服务互联了一些活跃在视频直播、教育、电子商务、电子政务、安全体细分的行业服务企业。这些企业一般都是向使用者提供一,直接进行场景文本识别、证件数字的文本识别、扫描文档。也有的企业通过出售或定制扫描仪、读卡器、智能设备提供的特定的数据集训练定制化模型,以及提供定制化 AI 定制化的服务模型,一般只针对应用场景的特定本文有用身份证件等小范围场景。习及相关技术网络
【参考文献】:
期刊论文
[1]一种用于文本检测和文本识别的单一神经网络[J]. 张秀杰,董超俊. 工业控制计算机. 2018(08)
[2]深度学习在手写汉字识别中的应用综述[J]. 金连文,钟卓耀,杨钊,杨维信,谢泽澄,孙俊. 自动化学报. 2016(08)
[3]试论黑体字的发展源流及特征[J]. 吴卫,李婧. 设计. 2015(09)
[4]自然场景下基于连通域检测的文字识别算法研究[J]. 刘新瀚,钱侃,王宇飞,朱向霄,孙知信. 计算机技术与发展. 2015(05)
[5]深度学习研究综述[J]. 孙志军,薛磊,许阳明,王正. 计算机应用研究. 2012(08)
[6]自适应最小误差阈值分割算法[J]. 龙建武,申铉京,陈海鹏. 自动化学报. 2012(07)
[7]支持向量机理论与算法研究综述[J]. 丁世飞,齐丙娟,谭红艳. 电子科技大学学报. 2011(01)
[8]利用改进的Retinex进行人脸图像光照处理[J]. 葛微,李桂菊,程宇奇,薛陈,朱明. 光学精密工程. 2010(04)
[9]图像特征点提取及匹配技术[J]. 杨晓敏,吴炜,卿粼波,华骅,何小海. 光学精密工程. 2009(09)
[10]一种基于字词联合解码的中文分词方法[J]. 宋彦,蔡东风,张桂平,赵海. 软件学报. 2009(09)
博士论文
[1]Web文本挖掘中若干问题的研究[D]. 王占一.北京邮电大学 2012
[2]文本检索中若干问题研究[D]. 王秀娟.北京邮电大学 2006
硕士论文
[1]基于深度学习的自然场景文字识别[D]. 黄攀.浙江大学 2016
[2]基于Tesseract-OCR的名片识别系统的研究与实现[D]. 万松.华南理工大学 2014
[3]论宋体字的形成与特征[D]. 杨艳芳.南京艺术学院 2011
[4]隶书的产生及其审美价值研究[D]. 杨艳.曲阜师范大学 2010
本文编号:3357736
【文章来源】:中国科学院大学(中国科学院深圳先进技术研究院)广东省
【文章页数】:83 页
【学位级别】:硕士
【部分图文】:
(a)文本场景(b)自然场景来源https://www.baidu.com/
场景中的字数多,但是排布规范,虽然是手机简单拍摄,文字。自然场景中的标语牌,同样是手机随意的一拍,虽然字数不却很丰富,不同的大小、字体、角度、颜色等。图 1.1(a)文本场景(b)自然场景来源 https://www.baidu.com/
应用市场上已经有许多提供图像文字检测和识别服务的服务百度、腾讯、阿里、谷歌、微软、亚马逊等大型云服务互联了一些活跃在视频直播、教育、电子商务、电子政务、安全体细分的行业服务企业。这些企业一般都是向使用者提供一,直接进行场景文本识别、证件数字的文本识别、扫描文档。也有的企业通过出售或定制扫描仪、读卡器、智能设备提供的特定的数据集训练定制化模型,以及提供定制化 AI 定制化的服务模型,一般只针对应用场景的特定本文有用身份证件等小范围场景。习及相关技术网络
【参考文献】:
期刊论文
[1]一种用于文本检测和文本识别的单一神经网络[J]. 张秀杰,董超俊. 工业控制计算机. 2018(08)
[2]深度学习在手写汉字识别中的应用综述[J]. 金连文,钟卓耀,杨钊,杨维信,谢泽澄,孙俊. 自动化学报. 2016(08)
[3]试论黑体字的发展源流及特征[J]. 吴卫,李婧. 设计. 2015(09)
[4]自然场景下基于连通域检测的文字识别算法研究[J]. 刘新瀚,钱侃,王宇飞,朱向霄,孙知信. 计算机技术与发展. 2015(05)
[5]深度学习研究综述[J]. 孙志军,薛磊,许阳明,王正. 计算机应用研究. 2012(08)
[6]自适应最小误差阈值分割算法[J]. 龙建武,申铉京,陈海鹏. 自动化学报. 2012(07)
[7]支持向量机理论与算法研究综述[J]. 丁世飞,齐丙娟,谭红艳. 电子科技大学学报. 2011(01)
[8]利用改进的Retinex进行人脸图像光照处理[J]. 葛微,李桂菊,程宇奇,薛陈,朱明. 光学精密工程. 2010(04)
[9]图像特征点提取及匹配技术[J]. 杨晓敏,吴炜,卿粼波,华骅,何小海. 光学精密工程. 2009(09)
[10]一种基于字词联合解码的中文分词方法[J]. 宋彦,蔡东风,张桂平,赵海. 软件学报. 2009(09)
博士论文
[1]Web文本挖掘中若干问题的研究[D]. 王占一.北京邮电大学 2012
[2]文本检索中若干问题研究[D]. 王秀娟.北京邮电大学 2006
硕士论文
[1]基于深度学习的自然场景文字识别[D]. 黄攀.浙江大学 2016
[2]基于Tesseract-OCR的名片识别系统的研究与实现[D]. 万松.华南理工大学 2014
[3]论宋体字的形成与特征[D]. 杨艳芳.南京艺术学院 2011
[4]隶书的产生及其审美价值研究[D]. 杨艳.曲阜师范大学 2010
本文编号:3357736
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3357736.html
最近更新
教材专著