基于深度神经网络的自然场景文本识别
发布时间:2022-08-09 09:33
文字,作为记录思想、承载语言的工具,在人类社会的发展中发挥着举足轻重的作用。自然场景下的文本含有丰富的信息,利用现代化技术获取这些信息可以给人类的工作和生活带来极大的便利。自然场景下的文本复杂多变,与排版标准、分辨率高的印刷文本相比,具有字体多样、背景复杂、分布随意、干扰因素多的特点,用传统的光学字符识别技术(OCR技术)对其进行识别达到的识别率低,不能满足实际使用需求。本文在对国内外自然场景文本识别及深度学习领域的相关文献研究的基础上,提出了基于深度学习的自然场景文本识别方法,以实现自然场景下的文本识别,达到一定的识别准确率和识别效率。本文的主要创新点和研究成果如下:(1)提出了一个卷积神经网络(CNN)和递归神经网络(RNN)相结合的端到端深度神经网络框架。自然场景下的文本识别分为特征提取和特征识别两部分,该模型采用编码器-译码器结构,将卷积神经网络作为模型的编码器,完成特征提取部分的功能。递归神经网络作为模型的译码器,结合前后输入进行识别,完成特征识别部分的功能。将训练后得到的最终模型在4个当下流行且具有代表性的数据集IC03、IC13、IIIT5K、SVT上进行测试。结果表明,...
【文章页数】:64 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 基于字符的识别
1.2.2 基于整个单词的识别
1.3 本文主要研究内容
1.3.1 主要研究内容
1.3.2 论文的组织结构
第2章 深度学习基本理论
2.1 深度学习概述
2.2 卷积神经网络
2.2.1 卷积层
2.2.2 池化层
2.2.3 激活函数
2.2.4 损失函数
2.3 循环神经网络
2.3.1 LSTM
2.3.2 GRU
2.4 神经网络的训练
2.4.1 训练策略
2.4.1.1 标准梯度下降法
2.4.1.2 随机梯度下降法
2.4.1.3 小批量梯度下降法
2.4.2 优化器
2.4.2.1 动量
2.4.2.2 Adagrad
2.4.2.3 AdaDelta
2.4.2.4 Adam
2.4.3 过拟合解决办法
2.4.3.1 提前终止
2.4.3.2 数据集增广
2.4.3.3 Dropout
2.5 小结
第3章 深度神经网络
3.1 引言
3.2 深度神经网络
3.2.1 模型结构
3.2.2 卷积神经网络层
3.2.3 双向LSTM网络层
3.2.4 转录层
3.3 网络训练
3.4 实验与分析
3.4.1 软硬件环境配置
3.4.2 深度学习框架TensorFlow
3.4.3 数据集
3.4.3.1 训练集
3.4.3.2 测试集
3.4.4 实验结果分析
3.5 小结
第4章 基于注意力机制的深度神经网络
4.1 引言
4.2 注意力机制
4.2.1 软注意力机制
4.2.2 硬注意力机制
4.3 基于软注意力机制的深度神经网络
4.4 实验结果分析
4.5 小结
结论
参考文献
附录 A (攻读硕士学位期间所发表的学术论文)
附录 B (攻读硕士学位期间所参加的学术科研活动)
致谢
本文编号:3672313
【文章页数】:64 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 基于字符的识别
1.2.2 基于整个单词的识别
1.3 本文主要研究内容
1.3.1 主要研究内容
1.3.2 论文的组织结构
第2章 深度学习基本理论
2.1 深度学习概述
2.2 卷积神经网络
2.2.1 卷积层
2.2.2 池化层
2.2.3 激活函数
2.2.4 损失函数
2.3 循环神经网络
2.3.1 LSTM
2.3.2 GRU
2.4 神经网络的训练
2.4.1 训练策略
2.4.1.1 标准梯度下降法
2.4.1.2 随机梯度下降法
2.4.1.3 小批量梯度下降法
2.4.2 优化器
2.4.2.1 动量
2.4.2.2 Adagrad
2.4.2.3 AdaDelta
2.4.2.4 Adam
2.4.3 过拟合解决办法
2.4.3.1 提前终止
2.4.3.2 数据集增广
2.4.3.3 Dropout
2.5 小结
第3章 深度神经网络
3.1 引言
3.2 深度神经网络
3.2.1 模型结构
3.2.2 卷积神经网络层
3.2.3 双向LSTM网络层
3.2.4 转录层
3.3 网络训练
3.4 实验与分析
3.4.1 软硬件环境配置
3.4.2 深度学习框架TensorFlow
3.4.3 数据集
3.4.3.1 训练集
3.4.3.2 测试集
3.4.4 实验结果分析
3.5 小结
第4章 基于注意力机制的深度神经网络
4.1 引言
4.2 注意力机制
4.2.1 软注意力机制
4.2.2 硬注意力机制
4.3 基于软注意力机制的深度神经网络
4.4 实验结果分析
4.5 小结
结论
参考文献
附录 A (攻读硕士学位期间所发表的学术论文)
附录 B (攻读硕士学位期间所参加的学术科研活动)
致谢
本文编号:3672313
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3672313.html
最近更新
教材专著