面向自然场景汉字识别的非平衡性与抗攻击性研究
发布时间:2022-12-05 00:34
光学文字识别(Optical Character Recognition,简称OCR)是计算机视觉领域的基础课题之一。自然场景下的汉字识别至今仍然存在着一定的提升空间,尤其在不平衡、稀缺训练集上的汉字识别效果并不理想。近些年随着深度学习的飞速发展,自然场景中的文字识别取得了巨大的成就。特别对于文字符号偏少的语种(如英文仅有26个字母),深度学习已经能够达到甚至超越人眼的识别性能。然而对于文字符号复杂并且数量偏大的语种(如中文常用字就有3000多字),受样本不均衡,训练样本稀缺等因素的影响,深度学习方法仍然不能达到理想的识别性能。本文以中文汉字识别为研究对象,针对现有的汉字识别算法在实际应用中所面临的关键技术难题进行了深入的研究与讨论。本文的主要贡献包括以下四个方面:第一,提出了基于聚焦CTC损失的非平衡汉字识别方法。深度学习模型在汉字识别任务的训练过程中不可避免的面临训练数据不平衡的问题,导致低频文字无法得到充分的训练,从而影响模型的整体性能。本文提出的聚焦CTC是一种新型的序列分类损失函数,该方法能够在不对训练数据做人为调整的情况下,使模型在训练过程中自动地向未充分学习的样本倾斜,有...
【文章页数】:117 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题背景及研究的目的和意义
1.2 文字识别以及相关深度学习技术研究现状
1.2.1 文字识别相关研究现状
1.2.2 文字识别骨干网络结构研究现状
1.2.3 小样本学习研究现状
1.2.4 对抗攻击研究现状
1.3 汉字识别领域内所存在的主要问题
1.4 本文的内容安排
第2章 基于聚焦CTC损失的非平衡汉字识别方法
2.1 引言
2.2 基于聚焦CTC的非平衡汉字识别算法
2.2.1 基于聚焦CTC的文字识别网络结构
2.2.2 聚焦CTC函数
2.3 基于聚焦CTC的非平衡汉字识别的实验结果与分析
2.3.1 实验数据描述
2.3.2 训练策略以及评价标准
2.3.3 基于聚焦CTC的非平衡汉字识别的实验结果
2.3.4 基于聚焦CTC的非平衡汉字识别的实验分析
2.4 本章小结
第3章 基于精简稠密网络的汉字识别方法
3.1 引言
3.2 基于精简稠密网络的汉字识别模型
3.2.1 精简稠密网络
3.2.2 基于精简稠密网络的汉字识别模型
3.3 基于精简稠密网络的汉字识别实验结果与分析
3.3.1 实验数据描述
3.3.2 分类数据集实验结果与分析
3.3.3 基于精简稠密网络的汉字识别实验结果
3.3.4 基于精简稠密网络的汉字识别实验分析
3.4 本章小结
第4章 基于LSTM-Reptile元学习手写汉字识别方法
4.1 引言
4.2 基于LSTM-Reptile元学习的手写汉字识别算法
4.2.1 LSTM-Reptile元学习
4.2.2 基于LSTM-Reptile元学习的手写汉字识别
4.3 基于LSTM-Reptile元学习的手写汉字识别实验结果与分析
4.3.1 实验数据描述
4.3.2 学习器模型与元学习器模型
4.3.3 分类数据集实验结果与分析
4.3.4 合成汉字识别数据集上的实验结果与分析
4.3.5 真实汉字识别数据集上的实验结果与分析
4.4 本章小结
第5章 基于提升迭代法的汉字识别抗攻击方法
5.1 引言
5.2 基于提升迭代法的汉字识别抗攻击算法
5.2.1 对抗样本的生成方法
5.2.2 基于提升迭代法的对抗样本生成方法
5.2.3 基于提升迭代法的汉字识别模型的抗攻击方法
5.3 基于提升迭代法的汉字识别抗攻击实验结果与分析
5.3.1 实验数据与模型描述
5.3.2 基于提升迭代法的汉字识别抗攻击实验结果
5.3.3 基于提升迭代法的汉字识别抗攻击实验分析
5.4 本章小结
结论
参考文献
攻读博士学位期间发表的论文及其他成果
致谢
个人简历
【参考文献】:
期刊论文
[1]深度学习在手写汉字识别中的应用综述[J]. 金连文,钟卓耀,杨钊,杨维信,谢泽澄,孙俊. 自动化学报. 2016(08)
本文编号:3709305
【文章页数】:117 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题背景及研究的目的和意义
1.2 文字识别以及相关深度学习技术研究现状
1.2.1 文字识别相关研究现状
1.2.2 文字识别骨干网络结构研究现状
1.2.3 小样本学习研究现状
1.2.4 对抗攻击研究现状
1.3 汉字识别领域内所存在的主要问题
1.4 本文的内容安排
第2章 基于聚焦CTC损失的非平衡汉字识别方法
2.1 引言
2.2 基于聚焦CTC的非平衡汉字识别算法
2.2.1 基于聚焦CTC的文字识别网络结构
2.2.2 聚焦CTC函数
2.3 基于聚焦CTC的非平衡汉字识别的实验结果与分析
2.3.1 实验数据描述
2.3.2 训练策略以及评价标准
2.3.3 基于聚焦CTC的非平衡汉字识别的实验结果
2.3.4 基于聚焦CTC的非平衡汉字识别的实验分析
2.4 本章小结
第3章 基于精简稠密网络的汉字识别方法
3.1 引言
3.2 基于精简稠密网络的汉字识别模型
3.2.1 精简稠密网络
3.2.2 基于精简稠密网络的汉字识别模型
3.3 基于精简稠密网络的汉字识别实验结果与分析
3.3.1 实验数据描述
3.3.2 分类数据集实验结果与分析
3.3.3 基于精简稠密网络的汉字识别实验结果
3.3.4 基于精简稠密网络的汉字识别实验分析
3.4 本章小结
第4章 基于LSTM-Reptile元学习手写汉字识别方法
4.1 引言
4.2 基于LSTM-Reptile元学习的手写汉字识别算法
4.2.1 LSTM-Reptile元学习
4.2.2 基于LSTM-Reptile元学习的手写汉字识别
4.3 基于LSTM-Reptile元学习的手写汉字识别实验结果与分析
4.3.1 实验数据描述
4.3.2 学习器模型与元学习器模型
4.3.3 分类数据集实验结果与分析
4.3.4 合成汉字识别数据集上的实验结果与分析
4.3.5 真实汉字识别数据集上的实验结果与分析
4.4 本章小结
第5章 基于提升迭代法的汉字识别抗攻击方法
5.1 引言
5.2 基于提升迭代法的汉字识别抗攻击算法
5.2.1 对抗样本的生成方法
5.2.2 基于提升迭代法的对抗样本生成方法
5.2.3 基于提升迭代法的汉字识别模型的抗攻击方法
5.3 基于提升迭代法的汉字识别抗攻击实验结果与分析
5.3.1 实验数据与模型描述
5.3.2 基于提升迭代法的汉字识别抗攻击实验结果
5.3.3 基于提升迭代法的汉字识别抗攻击实验分析
5.4 本章小结
结论
参考文献
攻读博士学位期间发表的论文及其他成果
致谢
个人简历
【参考文献】:
期刊论文
[1]深度学习在手写汉字识别中的应用综述[J]. 金连文,钟卓耀,杨钊,杨维信,谢泽澄,孙俊. 自动化学报. 2016(08)
本文编号:3709305
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3709305.html
最近更新
教材专著