自然场景文字检测方法研究

发布时间:2017-06-26 23:06

  本文关键词:自然场景文字检测方法研究,由笔耕文化传播整理发布。


【摘要】:图像中包含大量的文字信息,对基于内容的图像应用而言,准确高效地从图像中提取文字信息是一项非常有意义的工作。但是由于图像中的文字自身的多变性和文字背景的复杂性,自然场景中的文字检测仍然是一项极具挑战的任务。本文提出了两个文字检测方法:基于笔划宽度变换和深度信念网络的文字检测方法和基于最大稳定极值区域和卷积神经网络的文字检测方法。对于前者,本文首先使用笔划宽度变换算法对场景图像做笔划宽度变换,生成笔划宽度图。然后结合边缘梯度信息,将笔划宽度图中笔划宽度相似的像素连通起来,组成候选字符。接着使用启发式的过滤规则以及借助深度信念网络预训练的神经网络分类器,从候选字符中筛选出种子字符。然后使用种子字符生长在笔划宽度、高度、颜色等属性上近似的非种子字符,进而得到字符集合。最后将字符聚合成文本行,得到最终的文字检测结果。对于后者,本文使用最大稳定极值区域算法提取候选字符。然后借助一个级联的卷积神经网络分类器,从候选字符中提取种子字符。接着,使用一个迭代的渐进的生长算法从种子字符生长周围的非种子字符。本文设计了一个同时考虑组件几何特征和外观特征的相似度测量方法,用来评价一个非种子字符是否可以被一个种子字符生长。本文在多个公开数据集上测试了提出的两个方法。实验表明,基于笔划宽度和深度信念网络的文字检测方法,在多个数据集上表现良好。但受限于笔划宽度变换算法无法在复杂背景图像中生成高质量的笔划宽度图,因此该方法并不能取得最好的效果。而基于最大稳定极值区域和卷积神经网络的文字检测方法,在多个数据集上取得了最好的效果,尤其表现在更高的召回率上。这表示使用卷积神经网络作为种子字符分类模型的文字生长机制是非常有效的。
【关键词】:自然场景文字检测 笔划宽度变换 最大稳定极值区域 深度信念网络 卷积神经网络
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.41
【目录】:
  • 摘要4-5
  • Abstract5-12
  • 第一章 绪论12-17
  • 1.1 本文研究背景和意义12
  • 1.2 现有自然场景文字检测方法12-16
  • 1.2.1 通用对象检测方法13-14
  • 1.2.2 基于窗口的文字检测方法14
  • 1.2.3 基于连通组件的文字检测方法14-15
  • 1.2.4 基于混合方法的文字检测方法15-16
  • 1.3 本文主要工作及安排16-17
  • 第二章 相关工作17-32
  • 2.1 笔划宽度变换17-18
  • 2.2 深度信念网络18-19
  • 2.3 最大稳定极值区域19-22
  • 2.4 卷积神经网络22-32
  • 2.4.1 多层感知器22-25
  • 2.4.2 卷积运算25-27
  • 2.4.3 卷积神经网络27-31
  • 2.4.4 本章小结31-32
  • 第三章 基于笔划宽度变换和深度信念网络的文字检测方法32-42
  • 3.1 文字边缘检测32-35
  • 3.2 候选字符提取35-37
  • 3.2.1 增强SWT算法35-36
  • 3.2.2 边缘增强连通组件提取算法36-37
  • 3.3 候选字符过滤37-39
  • 3.4 种子字符提取及文字生长39-40
  • 3.5 文本行聚合40-41
  • 3.6 本章小结41-42
  • 第四章 基于最大稳定极值区域和卷积神经网络的文字检测方法42-51
  • 4.1 种子字符定位42-45
  • 4.1.1 基于MSER的组件过滤42-43
  • 4.1.2 种子字符过滤43-45
  • 4.2 文字生长45-48
  • 4.2.1 相似度测量45-48
  • 4.2.2 迭代式的文字生长48
  • 4.3 文本行验证48-49
  • 4.4 本章小结49-51
  • 第五章 实验结果与分析51-60
  • 5.1 实验平台51
  • 5.2 数据集与评价协议51-53
  • 5.3 ICDAR数据集实验结果53-57
  • 5.4 SVT数据集实验结果57-59
  • 5.5 本章小结59-60
  • 第六章 总结与展望60-62
  • 6.1 总结60
  • 6.2 展望60-62
  • 参考文献62-67
  • 简历与科研成果67-68
  • 致谢68-69

【相似文献】

中国期刊全文数据库 前10条

1 云中客;新的神经网络来自于仿生学[J];物理;2001年10期

2 唐春明,高协平;进化神经网络的研究进展[J];系统工程与电子技术;2001年10期

3 李智;一种基于神经网络的煤炭调运优化方法[J];长沙铁道学院学报;2003年02期

4 程科,王士同,杨静宇;新型模糊形态神经网络及其应用研究[J];计算机工程与应用;2004年21期

5 王凡,孟立凡;关于使用神经网络推定操作者疲劳的研究[J];人类工效学;2004年03期

6 周丽晖;从统计角度看神经网络[J];统计教育;2005年06期

7 赵奇 ,刘开第 ,庞彦军;灰色补偿神经网络及其应用研究[J];微计算机信息;2005年14期

8 袁婷;;神经网络在股票市场预测中的应用[J];软件导刊;2006年05期

9 尚晋;杨有;;从神经网络的过去谈科学发展观[J];重庆三峡学院学报;2006年03期

10 杨钟瑾;;神经网络的过去、现在和将来[J];青年探索;2006年04期

中国重要会议论文全文数据库 前10条

1 徐春玉;;基于泛集的神经网络的混沌性[A];1996中国控制与决策学术年会论文集[C];1996年

2 周树德;王岩;孙增圻;孙富春;;量子神经网络[A];2003年中国智能自动化会议论文集(上册)[C];2003年

3 罗山;张琳;范文新;;基于神经网络和简单规划的识别融合算法[A];2009系统仿真技术及其应用学术会议论文集[C];2009年

4 郭爱克;马尽文;丁康;;序言(二)[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

5 钟义信;;知识论:神经网络的新机遇——纪念中国神经网络10周年[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

6 许进;保铮;;神经网络与图论[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

7 金龙;朱诗武;赵成志;陈宁;;数值预报产品的神经网络释用预报应用[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

8 田金亭;;神经网络在中学生创造力评估中的应用[A];第十二届全国心理学学术大会论文摘要集[C];2009年

9 唐墨;王科俊;;自发展神经网络的混沌特性研究[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年

10 张广远;万强;曹海源;田方涛;;基于遗传算法优化神经网络的故障诊断方法研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年

中国重要报纸全文数据库 前10条

1 美国明尼苏达大学社会学博士 密西西比州立大学国家战略规划与分析研究中心资深助理研究员 陈心想;维护好创新的“神经网络硬件”[N];中国教师报;2014年

2 卢业忠;脑控电脑 惊世骇俗[N];计算机世界;2001年

3 葛一鸣 路边文;人工神经网络将大显身手[N];中国纺织报;2003年

4 中国科技大学计算机系 邢方亮;神经网络挑战人类大脑[N];计算机世界;2003年

5 记者 孙刚;“神经网络”:打开复杂工艺“黑箱”[N];解放日报;2007年

6 本报记者 刘霞;美用DNA制造出首个人造神经网络[N];科技日报;2011年

7 健康时报特约记者  张献怀;干细胞移植:修复受损的神经网络[N];健康时报;2006年

8 刘力;我半导体神经网络技术及应用研究达国际先进水平[N];中国电子报;2001年

9 ;神经网络和模糊逻辑[N];世界金属导报;2002年

10 邹丽梅 陈耀群;江苏科大神经网络应用研究通过鉴定[N];中国船舶报;2006年

中国博士学位论文全文数据库 前10条

1 杨旭华;神经网络及其在控制中的应用研究[D];浙江大学;2004年

2 李素芳;基于神经网络的无线通信算法研究[D];山东大学;2015年

3 石艳超;忆阻神经网络的混沌性及几类时滞神经网络的同步研究[D];电子科技大学;2014年

4 王新迎;基于随机映射神经网络的多元时间序列预测方法研究[D];大连理工大学;2015年

5 付爱民;极速学习机的训练残差、稳定性及泛化能力研究[D];中国农业大学;2015年

6 李辉;基于粒计算的神经网络及集成方法研究[D];中国矿业大学;2015年

7 王卫苹;复杂网络几类同步控制策略研究及稳定性分析[D];北京邮电大学;2015年

8 陈辉;多维超精密定位系统建模与控制关键技术研究[D];东南大学;2015年

9 闫淑霞;基于神经网络的微波射频器件建模[D];天津大学;2015年

10 胡文凭;基于深层神经网络的口语发音检测与错误分析[D];中国科学技术大学;2016年

中国硕士学位论文全文数据库 前10条

1 陈少吉;基于神经网络血压预测研究与系统实现[D];华南理工大学;2015年

2 张韬;几类时滞神经网络稳定性分析[D];渤海大学;2015年

3 邵雪莹;几类时滞不确定神经网络的稳定性分析[D];渤海大学;2015年

4 胡婷;改进QGA-BP模型及其在弥苴河总氮量预测中的应用[D];昆明理工大学;2015年

5 刘俊辉;基于数据清洗方法的河道水位预测研究[D];昆明理工大学;2015年

6 刘波;短期风电功率预测方法研究[D];南京信息工程大学;2015年

7 蔡邦宇;人脸识别中单次ERP时空特征分析及其快速检索的应用[D];浙江大学;2015年

8 郑川;垃圾评论检测算法的研究[D];西南交通大学;2015年

9 李菊;BP神经网络在房地产批量评估中的应用研究[D];昆明理工大学;2015年

10 马亮;降水点分类预测方法研究[D];中国地质大学(北京);2015年


  本文关键词:自然场景文字检测方法研究,由笔耕文化传播整理发布。



本文编号:487827

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/487827.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d08ca***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com