基于卷积神经网络的手写数字识别算法研究与应用
发布时间:2024-04-14 22:02
手写数字识别属于基本的图像分类问题,在云计算、金融和邮政等领域具有很高的实用价值。由于手写数字在书写时存在无限制性问题,实现快速有效识别的难度相对较大。随着深度学习相关算法的出现和计算机硬件技术的快速发展,基于卷积神经网络的图像分类方法逐渐成为了研究热点。由于卷积神经网络具有较强的函数表示能力和网络泛化能力,识别率往往能超过传统图像分类方法,因此应用卷积神经网络实现手写数字识别的研究具有重要的意义。本文针对现有的卷积神经网络实现手写数字识别方法中存在的问题进行了研究分析,具体内容包括:(1)卷积神经网络训练时,针对卷积核随机初始化导致的收敛速度慢和识别率低的问题,提出一种主成分分析初始化卷积核的卷积神经网络手写数字识别算法。实验结果表明:算法在应用MNIST数据库训练时收敛速度快,在迭代次数受限时识别率高,性能优于随机初始化卷积核的卷积神经网络手写数字识别算法。(2)空间金字塔池化网络进行多尺度训练时,针对空间金字塔池化层到卷积层反向传播非常低效的问题,提出了一种最大值位置映射的反向传播方法。实验结果表明:该方法在应用MNIST数据库分别进行单尺度和多尺度训练时,均方误差曲线均收敛,实...
【文章页数】:77 页
【学位级别】:硕士
【文章目录】:
致谢
摘要
Abstract
1 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 卷积神经网络的研究现状
1.2.2 手写数字识别的基本流程
1.3 研究难点及关键问题
1.3.1 手写数字识别研究的难点
1.3.2 卷积神经网络存在的问题
1.4 本文主要工作及结构安排
1.4.1 本文主要工作
1.4.2 本文的结构安排
2 卷积神经网络基本原理
2.1 数据集介绍
2.2 卷积神经网络的基本结构及前向传播过程
2.2.1 卷积层
2.2.2 池化层
2.2.3 Flatten层、全连接层与输出层
2.2.4 激活函数
2.2.5 损失函数
2.3 卷积神经网络反向传播过程
2.4 本章小结
3 基于PCA初始化卷积核的CNN手写数字识别算法
3.1 CNN的卷积核初始化方法概述
3.2 PCA特征提取方法分析
3.3 改进的PCA初始化卷积核原理
3.3.1 基于PCA的卷积核初始化方法
3.3.2 学习速率影响分析
3.4 仿真结果与分析
3.4.1 仿真环境的设置以及样本集选取
3.4.2 仿真结果及分析
3.5 本章小结
4 基于最大值位置映射的SPPNet多尺度手写数字训练方法
4.1 基于空间金字塔池化的Le Net-5 网络
4.2 SPPNet训练概述
4.3 卷积层到SPP层正向传播
4.3.1 Feature Map填充
4.3.2 获取不同Bin中最大值及其相应位置
4.4 SPP层到卷积层反向传播方法
4.5 实验仿真验证
4.5.1 单尺度训练测试验证
4.5.2 多尺度训练测试验证
4.6 本章小结
5 基于卷积神经网络的试卷分数识别应用系统设计
5.1 试卷分数识别系统流程
5.2 试卷模板设计
5.2.1 试卷卷头基本定义
5.2.2 试卷卷头功能单元的分类
5.2.3 试卷卷头对象之间的逻辑关系
5.3 图像预处理
5.3.1 试卷分数区域提取
5.3.2 试卷分数区域倾斜矫正
5.3.3 试卷分数区域分割
5.4 卷积神经网络识别
5.4.1 Caffe卷积神经网络框架介绍
5.4.2 卷积神经网络模型设计与参数配置
5.4.3 系统权值微调
5.5 本章小结
6 总结与展望
6.1 总结
6.2 展望
参考文献
作者简介
学位论文数据集
本文编号:3955293
【文章页数】:77 页
【学位级别】:硕士
【文章目录】:
致谢
摘要
Abstract
1 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.2.1 卷积神经网络的研究现状
1.2.2 手写数字识别的基本流程
1.3 研究难点及关键问题
1.3.1 手写数字识别研究的难点
1.3.2 卷积神经网络存在的问题
1.4 本文主要工作及结构安排
1.4.1 本文主要工作
1.4.2 本文的结构安排
2 卷积神经网络基本原理
2.1 数据集介绍
2.2 卷积神经网络的基本结构及前向传播过程
2.2.1 卷积层
2.2.2 池化层
2.2.3 Flatten层、全连接层与输出层
2.2.4 激活函数
2.2.5 损失函数
2.3 卷积神经网络反向传播过程
2.4 本章小结
3 基于PCA初始化卷积核的CNN手写数字识别算法
3.1 CNN的卷积核初始化方法概述
3.2 PCA特征提取方法分析
3.3 改进的PCA初始化卷积核原理
3.3.1 基于PCA的卷积核初始化方法
3.3.2 学习速率影响分析
3.4 仿真结果与分析
3.4.1 仿真环境的设置以及样本集选取
3.4.2 仿真结果及分析
3.5 本章小结
4 基于最大值位置映射的SPPNet多尺度手写数字训练方法
4.1 基于空间金字塔池化的Le Net-5 网络
4.2 SPPNet训练概述
4.3 卷积层到SPP层正向传播
4.3.1 Feature Map填充
4.3.2 获取不同Bin中最大值及其相应位置
4.4 SPP层到卷积层反向传播方法
4.5 实验仿真验证
4.5.1 单尺度训练测试验证
4.5.2 多尺度训练测试验证
4.6 本章小结
5 基于卷积神经网络的试卷分数识别应用系统设计
5.1 试卷分数识别系统流程
5.2 试卷模板设计
5.2.1 试卷卷头基本定义
5.2.2 试卷卷头功能单元的分类
5.2.3 试卷卷头对象之间的逻辑关系
5.3 图像预处理
5.3.1 试卷分数区域提取
5.3.2 试卷分数区域倾斜矫正
5.3.3 试卷分数区域分割
5.4 卷积神经网络识别
5.4.1 Caffe卷积神经网络框架介绍
5.4.2 卷积神经网络模型设计与参数配置
5.4.3 系统权值微调
5.5 本章小结
6 总结与展望
6.1 总结
6.2 展望
参考文献
作者简介
学位论文数据集
本文编号:3955293
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3955293.html
最近更新
教材专著