自然场景文字检测与识别研究
发布时间:2020-12-31 00:55
自然环境中文字随处可见,人们通过文字可以进行信息传递和交流。由于场景文字包含了重要的语义信息,因此能够准确检测和识别场景文字信息至关重要。场景文字检测和识别技术对智能交通系统、无人驾驶等领域具有重要的应用,尤其是智能交通系统。在中国经济飞速发展的当下,民众的生活水平均得到了提升,汽车拥有数量也大幅上涨,使得交通系统拥堵现象严重。场景标识文字检测技术作为智能交通系统的一部分,本文以交通标志牌的文字识别为背景,研究自然场景的文字检测和识别技术。主要工作如下:(1)分析了传统的场景文字识别技术OCR,指出OCR识别系统在场景文字识别中存在的不足之处;对深度学习的相关理论进行了描述,并对本文使用的深度学习框架进行了研究;分析了场景文字检测数据集并且制作了交通标志文字数据集。(2)对基于颜色和形状的交通标志牌中文字的检测和识别技术进行了分析和实现,将颜色和形状进行特征融合,并利用K-means颜色聚类算法实现图像分割,然后通过连通域分析法对文字进行检测,最后利用OCR识别系统对文字进行识别。(3)分析了深度学习Faster R-CNN算法,然后对Mask R-CNN算法进行了研究,采用基于Mas...
【文章来源】:石家庄铁道大学河北省
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
人工智能、机器学习和深度学习的关系
深度学习之所以被称为“深度”,是从它的技术层面上来定义的,主要包括三个层面:从底层到高层的特征抽象、让网络变得更深和自动特征提取。深度学习通过低层次的特征的组合得到更为抽象的高层特征,即通过原始图像的像素数据出发,通过不同的卷积核处理,获取低层次方式的表达,之后将其作为依据,通过线性或非线性方式的组合,最终获得高层次的表达方式。原有的机器学习方法一般为浅层学习,使用传统的神经网络模型,而深度学习方法是由输入层、隐藏层、输出层组成的多层神经网络,如图 2-2 所示,更加接近人脑,并且具有很强的自动提取特征能力。目前,深度学习方法已经应用到工业界、人工智能和模式识别等领域,并且取得了较为突出的成果。
- 12图 2-3 TensorFlow 系统架构图 2-3 中,TensorFlow 系统架构图由上至下分别为应用层、客户算层、数据操作层、设备层和网络层。其中,gRPC(googleRemotetocol, gRPC)和 RDMA(Remote DirectMemory Access, RDMA)即经网络算法运行传递的参数。CPU 和 GPU 为设备层,用于负在数据操作层中完成 TensorFlow 算法的具体操作,如卷积操分布式计算图和本地计算图为图计算层,主要负责计算图的接。客户端提供多语言状况的编程环境,它能够为计算图的编程练类库和预测类库属于应用层部分,主要进行的是模型训练和的是服务于顾客的开发模型。
【参考文献】:
期刊论文
[1]自然场景中文本检测技术研究综述[J]. 戴津. 计算机光盘软件与应用. 2013(18)
[2]自然场景中字符型交通标志的检测算法[J]. 谷明琴,蔡自兴,任孝平. 中南大学学报(自然科学版). 2013(05)
[3]一种基于支持向量机的手写汉字识别方法[J]. 高学,金连文,尹俊勋,黄建成. 电子学报. 2002(05)
[4]汽车牌照自动识别技术研究[J]. 刘效静,成瑜. 南京航空航天大学学报. 1998(05)
硕士论文
[1]场景图像中的文字检测算法研究[D]. 谢立艳.北方工业大学 2018
[2]基于深度学习的自然场景文字检测方法研究[D]. 胡胤.广东工业大学 2018
[3]基于深度学习的自然场景文本检测与定位方法研究[D]. 罗聪.华南理工大学 2018
[4]自然场景中的文本检测研究[D]. 帅靖文.电子科技大学 2018
[5]面向图像的场景文字识别技术研究[D]. 卢未来.辽宁工业大学 2018
[6]基于实例分割的场景图像文字检测[D]. 张小爽.浙江大学 2018
[7]自然场景中的文字检测与识别技术研究[D]. 李荣龙.北京化工大学 2017
[8]基于自适应行聚类的自然场景文字检测算法研究[D]. 乔新旭.中国科学技术大学 2017
[9]基于深度学习的场景文字检测与识别[D]. 马景法.华南理工大学 2017
[10]自然场景中交通标志版面理解算法研究[D]. 陈亚杰.北京交通大学 2016
本文编号:2948628
【文章来源】:石家庄铁道大学河北省
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
人工智能、机器学习和深度学习的关系
深度学习之所以被称为“深度”,是从它的技术层面上来定义的,主要包括三个层面:从底层到高层的特征抽象、让网络变得更深和自动特征提取。深度学习通过低层次的特征的组合得到更为抽象的高层特征,即通过原始图像的像素数据出发,通过不同的卷积核处理,获取低层次方式的表达,之后将其作为依据,通过线性或非线性方式的组合,最终获得高层次的表达方式。原有的机器学习方法一般为浅层学习,使用传统的神经网络模型,而深度学习方法是由输入层、隐藏层、输出层组成的多层神经网络,如图 2-2 所示,更加接近人脑,并且具有很强的自动提取特征能力。目前,深度学习方法已经应用到工业界、人工智能和模式识别等领域,并且取得了较为突出的成果。
- 12图 2-3 TensorFlow 系统架构图 2-3 中,TensorFlow 系统架构图由上至下分别为应用层、客户算层、数据操作层、设备层和网络层。其中,gRPC(googleRemotetocol, gRPC)和 RDMA(Remote DirectMemory Access, RDMA)即经网络算法运行传递的参数。CPU 和 GPU 为设备层,用于负在数据操作层中完成 TensorFlow 算法的具体操作,如卷积操分布式计算图和本地计算图为图计算层,主要负责计算图的接。客户端提供多语言状况的编程环境,它能够为计算图的编程练类库和预测类库属于应用层部分,主要进行的是模型训练和的是服务于顾客的开发模型。
【参考文献】:
期刊论文
[1]自然场景中文本检测技术研究综述[J]. 戴津. 计算机光盘软件与应用. 2013(18)
[2]自然场景中字符型交通标志的检测算法[J]. 谷明琴,蔡自兴,任孝平. 中南大学学报(自然科学版). 2013(05)
[3]一种基于支持向量机的手写汉字识别方法[J]. 高学,金连文,尹俊勋,黄建成. 电子学报. 2002(05)
[4]汽车牌照自动识别技术研究[J]. 刘效静,成瑜. 南京航空航天大学学报. 1998(05)
硕士论文
[1]场景图像中的文字检测算法研究[D]. 谢立艳.北方工业大学 2018
[2]基于深度学习的自然场景文字检测方法研究[D]. 胡胤.广东工业大学 2018
[3]基于深度学习的自然场景文本检测与定位方法研究[D]. 罗聪.华南理工大学 2018
[4]自然场景中的文本检测研究[D]. 帅靖文.电子科技大学 2018
[5]面向图像的场景文字识别技术研究[D]. 卢未来.辽宁工业大学 2018
[6]基于实例分割的场景图像文字检测[D]. 张小爽.浙江大学 2018
[7]自然场景中的文字检测与识别技术研究[D]. 李荣龙.北京化工大学 2017
[8]基于自适应行聚类的自然场景文字检测算法研究[D]. 乔新旭.中国科学技术大学 2017
[9]基于深度学习的场景文字检测与识别[D]. 马景法.华南理工大学 2017
[10]自然场景中交通标志版面理解算法研究[D]. 陈亚杰.北京交通大学 2016
本文编号:2948628
本文链接:https://www.wllwen.com/kejilunwen/daoluqiaoliang/2948628.html