基于图像的印刷体表格识别系统

发布时间:2021-03-02 15:25
  书刊以及报表等印刷体文档图像的识别,是模式识别的一个重要分支。字符识别的技术已经较为成熟,在市场上已有比较多的商业产品。而对于印刷体表格图像的识别技术还有待进一步完善。现有的方法在识别时对图片的规整度要求高、鲁棒性差,并且多数识别系统是基于PC端。随着移动互联网的发展,PC端的系统已经不能满足需求。本文在分析研究国内外的相关技术以及产品现状的基础上,针对表格图像的预处理方法、闭合印刷体表格的识别、印刷体表格中汉字的识别以及基于Android的表格识别软件设计展开研究,最终实现了鲁棒性较高的表格识别系统,并完成了移动端系统的开发。论文完成的主要工作如下:1.对表格图像的预处理算法进行了研究,通过优化的二值化算法对文档图像进行二值化;根据表格不同的倾斜情况,对文档图像分别进行倾斜校正和透视校正;应用基于形态学的图像算法对表格区域进行识别定位,并将得到的表格框线进行细化。2.提出了基于轮廓互斥筛选的单元格定位算法,该算法能够准确地找出每一个细分单元格的具体位置,并将该部分ROI送到识别器进行识别,提高了单元格识别定位的效率。3.设计基于深度神经网络的印刷体汉字识别算法,对提取后的表格单元格整... 

【文章来源】:湖南大学湖南省 211工程院校 985工程院校 教育部直属院校

【文章页数】:78 页

【学位级别】:硕士

【部分图文】:

基于图像的印刷体表格识别系统


均值滤波前后对比图:(a)滤波前图像;(b)滤波后图像

基于图像的印刷体表格识别系统


掩模平滑滤波前后对比图:(a)滤波前图像;(b)滤波后图像

基于图像的印刷体表格识别系统


中值滤波前后对比图:(a)去噪前图像;(b)去噪后图像

【参考文献】:
期刊论文
[1]图像文字识别中的预处理技术研究综述[J]. 弓耀辉.  信息通信. 2017(09)
[2]深度学习在手写汉字识别中的应用综述[J]. 金连文,钟卓耀,杨钊,杨维信,谢泽澄,孙俊.  自动化学报. 2016(08)
[3]一种基于改进Canny的边缘检测算法[J]. 许宏科,秦严严,陈会茹.  红外技术. 2014(03)
[4]基于MQDF的车牌字符识别[J]. 周明辉,刘辉,曹刚.  信息技术. 2013(07)
[5]一种基于自适用结构元素的表格框线去除形态学算法[J]. 刘艳顺,邱泽阳.  贵州大学学报(自然科学版). 2008(04)
[6]基于改进Hough变换的文本图像倾斜校正方法[J]. 周冠玮,平西建,程娟.  计算机应用. 2007(07)
[7]光学字符识别技术与展望[J]. 荆涛,王仲.  计算机工程. 2003(02)
[8]基于有向单连通链的表格框线检测算法[J]. 郑冶枫,刘长松,丁晓青,潘世言.  软件学报. 2002(04)

博士论文
[1]文档图像中图形分析与识别关键技术研究[D]. 张自力.哈尔滨工业大学 2015
[2]中文版面分析关键技术的研究[D]. 靳从.南京理工大学 2007

硕士论文
[1]基于图像处理和模式识别的身份证识别系统设计与实现[D]. 宋韧.电子科技大学 2015
[2]基于.NET的健康调查问卷系统的设计与实现[D]. 张亚楠.大连理工大学 2012
[3]印刷体文字识别系统的研究与实现[D]. 李俊.电子科技大学 2011
[4]印刷体中文文档中表格和汉字的识别研究[D]. 于伯峰.哈尔滨工程大学 2011
[5]表格手写内容识别系统的设计与实现[D]. 王淞.华中科技大学 2011
[6]车牌图像二值化效果的改进算法研究[D]. 魏诚.浙江大学 2006
[7]印刷体汉字识别系统的研究与实现[D]. 梁涌.西北工业大学 2006



本文编号:3059499

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3059499.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8aa50***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com