基于光谱成像的褪色文字信息提取和识别研究

发布时间:2021-10-23 15:15
  我国拥有大量的文物,包括壁画、书画等,它们作为中国的传统文物,可以记载古人的精神文化生活和重要的历史事件。其中,最能直观的了解文物所承载信息的当属文字。中华文明源远流长,早在旧石器时,就发现有文字的存在,从古代甲骨文到现代简体字,文字一直是人类记录事件和表达情绪的重要符号。古人留给我们众多珍贵文物,且大都会用文字加以描述和修饰,探索文字的信息能更好的还原真实历史,了解不同时期文化。然而,由于自然和人为因素影响,一些文物表面出现了褪色,影响外观,导致文字难以辨认。因此,在文物保护工作中提取文字信息尤为重要。传统方式多为人眼辨别,依赖文物工作者的经验,但褪色的文字依靠人眼难以辨别。所以,需要利用现代科学技术辅助提取文物中褪色或者隐藏的文字信息。高光谱技术具有非接触、“图谱合一”、光谱范围广等特点,能够对文物进行更深层次的数据留存与分析,利用高光谱独特的优势,可以捕捉到人眼观察不到的信息,对于文字提取和解读具有重要意义。本文研究数据为采集的国画、石刻以及墓葬底部的高光谱数据,三处文物均受到了不同程度的损伤,导致文物表面的信息难以辨识,在进行数据预处理后,对其中的褪色信息进行提取,再利用卷积神... 

【文章来源】:北京建筑大学北京市

【文章页数】:57 页

【学位级别】:硕士

【部分图文】:

基于光谱成像的褪色文字信息提取和识别研究


研究技术路线

特征提取,方法


卣魈崛》椒?(1)主成分分析与最小噪声分离由于采集的高光谱影像波段数较多,所包含的信息量十分丰富,但同样也会产生数据冗余的问题,在本文中用到的高光谱图像有1040个波段,许多数据相关性较高,要从众多波段中寻找特征明显的波段比较困难。并且,当图像维数达到一定数量后,图像的提取效果反而会随着维数增多而下降,出现Hughes现象[44]。因此,常需要进行特征提龋特征提取方法也就是将高光谱影像按照一定的数学变换把图像特征重新进行整合,组成一组新的变换空间,将原始数据中有价值的信息很好的保留下来的过程。如图2-3所示[45],Xn为高光谱图像的各个波段,Ym为进行数学变换后按照一定顺序进行排列的各个主成分。常用的特征提取方法有主成分分析[46]和最小噪声分离方法[47],最后得到降维后的数据,提取图像的主要信息。图2-3特征提取方法Fig.2-3Featureextractionmethod主成分分析(PrincipleComponentAnalysis,PCA),是高光谱图像处理中常用的方法之一,可以用来进行高光谱数据的压缩,消除噪声和特征提取等操作[48]。它通过统计变量的方差,将变换后数据按照方差的大小进行排列组合,这样可以把图像的大部分有效信息集中在前几个主成分分量中表现出来,以此来达到特征提取的目的。首先设X=[1,2,,]为P×N的矩阵,其中A=[1,2,,]则为系数矩阵,对其进行线性变换形成一个矩阵方程Z=AX,得到一组新的变量Z=[z1,z2,,zp]T,有方程Z=AX=[12]=[12]=[111+212++11121+222++2111+22++1](2-1)其中新的变量Z大小与X相同,zi与zj(i≠j且i,j∈1,2,…p)向量两两无关,再计算各个向量的方差和向量间?

示意图,卷积运算,示意图,卷积


卷积神经网络的结构和特点有所不同,但都是通过相同的基本元素组合进行搭建的,其基本元素如下:(1)输入层输入层可以向卷积神经网络中输入要训练的数据,一般的,根据卷积神经网络维数的不同可以输入不同维数的数据,也可以规定数据输入时的尺寸大校(2)卷积层能够用于提取输入数据特征的是卷积层。每个卷积层包括了卷积核的大孝步长和填充,这三个参数的设置决定一层卷积层运算后得到的特征图的尺寸和数量。卷积就是对输入的数据进行特征提取,卷积核种类和个数就代表神经网络提取特征的种类和个数。基本的卷积运算如图2-4所示,左侧蓝色矩阵代表输入的一张图像数据,假设规定图像的大小(6*6),中间的黄色矩阵是卷积核(3*3),卷积核在图像上进行卷积运算,每运算一次就可以得到一个元素,最终形成一张卷积后特征图像,如图是第一步运算,也就是2*1+2*2+1*(-2)+1*(-1)=3,依次进行运算后得到4*4的一个特征图像,卷积层上设置卷积核的个数就是运算后特征图像的个数。图2-4卷积运算示意图Fig.2-4Diagramofconvolutionoperation卷积神经网络首先认知的是简单的特征,例如颜色、亮度、边缘等,深层的是更加复杂的结构特征,例如纹理,最后是对整体的认识[62]。每一个卷积核都相当于一个特征提取器,提取的特征参数越多计算就会越复杂,对计算机的性能要求更高。所以,随着

【参考文献】:
期刊论文
[1]一种基于水族濒危文字的图像增强及识别方法[J]. 杨秀璋,夏换,于小民.  计算机科学. 2019(S2)
[2]基于高光谱影像的瞿昙寺壁画颜料层脱落病害评估[J]. 刘晓琴,侯妙乐,董友强,汪万福,吕书强.  地理信息世界. 2019(05)
[3]改进LeNet-5网络在图像分类中的应用[J]. 刘金利,张培玲.  计算机工程与应用. 2019(15)
[4]浅析文物研究工作中的文字释读[J]. 裴德文.  文物春秋. 2018(S1)
[5]一种基于深度学习的青铜器铭文识别方法[J]. 李文英,曹斌,曹春水,黄永祯.  自动化学报. 2018(11)
[6]中国古画矿物颜料光谱混合模型初探——以石青和石绿为例[J]. 李大朋,赵恒谦,张立福,赵学胜.  光谱学与光谱分析. 2018(08)
[7]卷积神经网络的多字体汉字识别[J]. 柴伟佳,王连明.  中国图象图形学报. 2018(03)
[8]基于像素邻域点信息的藏文图像细化算法研究[J]. 刘芳,张云洋.  计算机技术与发展. 2018(04)
[9]高光谱成像技术在彩绘文物分析中的研究综述[J]. 侯妙乐,潘宁,马清林,何海平,吕书强,胡云岗.  光谱学与光谱分析. 2017(06)
[10]高光谱成像技术在故宫书画文物保护中的应用[J]. 史宁昌,李广华,雷勇,吴太夏.  文物保护与考古科学. 2017(03)

博士论文
[1]光散射与文物彩绘的褪色与显现研究[D]. 郑丽珍.陕西师范大学 2018

硕士论文
[1]基于卷积神经网络的肺实质分割与肺结节检测方法研究[D]. 陈强锐.南京邮电大学 2019
[2]基于深度卷积神经网络的文字识别算法研究[D]. 张达峰.贵州大学 2019
[3]高光谱影像的降维方法研究[D]. 姚娆.辽宁师范大学 2018
[4]基于卷积神经网络改进算法的藏文识别系统的设计与分析[D]. 张瑛.吉林大学 2018
[5]基于图模型匹配的印章文字识别研究[D]. 华绍君.湖南大学 2018
[6]基于多元属性的媒体热度预测算法[D]. 蔡宏翔.上海交通大学 2018
[7]中国文字的发展与文字载体的演变[D]. 王熙林.山西师范大学 2017
[8]基于深度学习的图像识别与文字推荐系统的设计与实现[D]. 王雨辰.北京交通大学 2017
[9]基于遥感影像水体提取方法研究[D]. 张艳超.西北大学 2016
[10]基于LBP和PCA的脱机手写藏文字符识别系统[D]. 蔡晓娟.青海师范大学 2016



本文编号:3453417

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3453417.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a1eae***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com