基于卷积神经网络的维吾尔文检测
发布时间:2023-05-14 01:10
维吾尔文是新疆地区主要的使用文字,是少数民族地区流行的语言文字,大部分的文字出现在视频图像中,识别并理解这些文字对加强内地与新疆的交流、维护新疆稳定、促进经济发展等方面具有重要意义。近年来,人工智能和大数据技术得到快速发展,计算机可以通过处理海量的语音、文字、视频和图像等获取有效信息,这为加快新疆发展提供帮助和新的方向。为达到识别理解维吾尔文的目的,首先需要检测出图片中有维吾尔文并分割出该区域,即目标检测和语义分割,从而进一步理解文字。图像中的文本分为两种形式,一种是本文被后期嵌入的,这类文本与背景具有很大的特征差异,检测难度较小;一种是本文存在于自然场景的,这类文本受颜色大小、拍摄角度和光照噪声等自然环境因素影响,检测难度较大。本文针对自然场景图像中的维吾尔文提出了一种利用卷积神经网络提取并学习目标特征,从而识别文字。卷积神经网络具有强大的特征学习能力,对目标特征敏感,抗干扰能力强,适合应对自然条件下的各种干扰。针对维吾尔文的字母不规则性和独特的书写形式,本文利用深度学习方法对维吾尔文检测和分割进行了探索,首先在卷积神经网络的基础上构建融合多层特征网络,得到具有丰富语义信息的特征,同...
【文章页数】:70 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 维吾尔文简介及特点
1.4 本文主要工作和安排
第二章 融合多层卷积神经网络的维吾尔文特征提取
2.1 卷积神经网络
2.1.1 局部连接和权值共享
2.1.2 卷积神经网络结构
2.2 经典卷积神经网络模型
2.1.1 AlexNet网络
2.1.2 ZFNet网络
2.1.3 VGGNet网络
2.1.4 ResNet网络
2.3 基于特征金字塔的特征融合
2.4 特征提取
2.4.1 本文特征提取网络结构
2.4.2 特征图对比
2.5 本章小结
第三章 基于深度学习的自然场景图像中维吾尔文检测分割
3.1 引言
3.2 基于候选区域的目标检测算法
3.2.1 R-CNN算法
3.2.2 Fast R-CNN算法
3.2.3 Faster R-CNN算法
3.2.4 Faster R-CNN算法的改进
3.3 基于掩模的语义分割算法
3.4 实验数据集
3.5 本文算法流程
3.6 评价标准
3.7 实验结果与分析
3.8 本章小结
第四章 环境搭建与训练
4.1 开发环境
4.1.1 软件介绍
4.1.2 VS2015 安装
4.1.3 GPU搭建
4.1.4 Anaconda安装
4.1.5 TensorFlow-keras安装
4.1.6 OpenCV安装
4.2 训练过程
4.3 本章小结
第五章 总结与展望
参考文献
研究生期间发表论文和参加科研情况
致谢
本文编号:3816887
【文章页数】:70 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 维吾尔文简介及特点
1.4 本文主要工作和安排
第二章 融合多层卷积神经网络的维吾尔文特征提取
2.1 卷积神经网络
2.1.1 局部连接和权值共享
2.1.2 卷积神经网络结构
2.2 经典卷积神经网络模型
2.1.1 AlexNet网络
2.1.2 ZFNet网络
2.1.3 VGGNet网络
2.1.4 ResNet网络
2.3 基于特征金字塔的特征融合
2.4 特征提取
2.4.1 本文特征提取网络结构
2.4.2 特征图对比
2.5 本章小结
第三章 基于深度学习的自然场景图像中维吾尔文检测分割
3.1 引言
3.2 基于候选区域的目标检测算法
3.2.1 R-CNN算法
3.2.2 Fast R-CNN算法
3.2.3 Faster R-CNN算法
3.2.4 Faster R-CNN算法的改进
3.3 基于掩模的语义分割算法
3.4 实验数据集
3.5 本文算法流程
3.6 评价标准
3.7 实验结果与分析
3.8 本章小结
第四章 环境搭建与训练
4.1 开发环境
4.1.1 软件介绍
4.1.2 VS2015 安装
4.1.3 GPU搭建
4.1.4 Anaconda安装
4.1.5 TensorFlow-keras安装
4.1.6 OpenCV安装
4.2 训练过程
4.3 本章小结
第五章 总结与展望
参考文献
研究生期间发表论文和参加科研情况
致谢
本文编号:3816887
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3816887.html