工程图纸的关键信息智能提取技术
发布时间:2021-11-24 11:51
随着制图软件的广泛应用,面对逐渐积累的大量工程图纸,如何快速对现有图纸进行信息提取和检索查询,已成为迫切需要解决的问题。目前主要是通过人工比对的方式对数据库中的图纸进行查找,流程繁琐同时效率较低。因此快速提取工程图纸中的关键信息并建立图纸信息数据库和相似图纸查找系统,将大大提高工程图纸的管理效率。以此为背景,本文研究了利用人工智能技术,快速自动提取工程图纸中关键信息的技术,主要对工程图纸中的标题栏信息以及标注尺寸信息进行了提取,建立图纸信息数据库,设计了一套信息提取与查询系统。本文主要的研究工作如下:首先,本文对工程图纸的标题栏信息提取方法进行了研究。主要涉及到文字区域定位与文字识别两方面。鉴于表格标题栏格式较为固定,利用切分表格单元格的形式对关键信息进行了定位分析。基于卷积神经网络设计了文字识别模型,实验表明,文字识别率相比传统文字识别率得到了有效的提升,实现了对标题栏信息的自动化提取。其次,考虑到传统基于特征的标注尺寸检测方法效率较低,同时标注信息的提取是字符与图元相结合的结果,所以本文创新性的使用深度学习的方法对标注尺寸与字符同时进行检测,通过实验发现,该方法可以准确的对标注尺寸...
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
图2-4灰度直方图??Fig.2-4?Gray?histogram??
根据像素点局部邻域窗计算像素点阈值,在局部窗内计算阈值,有平均值法,高斯??加权法等,局部二值化方法速度一般较慢。对于图纸标题栏,其灰度直方图的分布??基本如图2-4所示,背景与目标相差较为明显,所以在对表格标题栏进行二值化时??可以使用OTSU算法,或者使用固定阈值进行二值化。??HEI??a)原始图??a)?Original?image??b)二值化图??b)?Binarization?graph??图2-3图像二值化??Fig.2-3?Image?binaryzation??70000?-??60000?-??50000?-??in??1??^?40000?-?|??〇??|?30000-??2??20000?-??10000?-?{??0?plBllla??,?1?1?1?—*——-??0?50?100?150?200?250??Grayscale??
对每个窗口采用单字识别模型对其进行识别。可以使用贪心算法或者是非极大??值抑制算法来规划最终的识别路径。这种识别方法存在两个问题,滑动步长过大容??易造成信息丢失,滑动步长过小计算量太大,所以很难选定一个合适的步长,同时??对单字识别模型的依赖程度较高。??语音识别,手写识别,文本识别其实都有一个共同的特点,就是需要对时序进??行建模,这就衍生出了序列学习[3G,31]。尽管文字行图像是二维的,但也都是以序列??的形式出现,识别过程中通常需要预测一系列的标签。文字识别也有其上下文的联??系,将从左到右的识别类比为时序,则文字识别也可归类为序列识别。通过端到端??的学习,无需进行矫正,分割等处理,输入文本行直接出来预测结果,以此提升序??列学习的效果,这己经成为当前研究的热点。基本思路是卷积神经网络??(Convolutional?Neural?Networks,CNN)与循环神经网络(Recurrent?Neural?Network,??RNN)结合:CNN被广泛的应用于特征提取,得到的特征可以充分的表征目标,而??RNN即有前馈连接又有反馈连接,决定了其适合处理序列问题。这种混合的文本??字符串识别网络突破了以往的文字识别方法,取得了不错的文字识别效果。??lnPU,image?ConvolutionalsandRelu
【参考文献】:
期刊论文
[1]基于雅克比稀疏自动编码机的手写数字识别算法[J]. 王慧玲,宋威. 计算机应用研究. 2018(12)
[2]一种基于Android平台的图像文字识别系统[J]. 赵思宁. 中国科技信息. 2018(02)
[3]基于图像分块的局部阈值二值化方法[J]. 张洁玉. 计算机应用. 2017(03)
[4]基于特征加权模糊模板匹配的字符识别[J]. 朱颢东,李红婵. 兰州理工大学学报. 2013(01)
[5]工程图纸字符串及标注信息提取[J]. 范帆,关佶红. 计算机工程与应用. 2012(07)
[6]工程图纸标题栏的自动生成及其信息提取的方法实现[J]. 苗帅,王卫东. 计算机应用与软件. 2011(09)
[7]面向工程图纸离线式表格信息提取与识别方法研究[J]. 董玉德,刘孙,朱长江,杜立,王仁敏,马云峰. 工程图学学报. 2009(01)
[8]工程图纸标题栏信息自动提取方法的研究[J]. 李贤兵,张应中,罗晓芳. 计算机工程与设计. 2004(11)
[9]机械图纸扫描图像尺寸信息提取[J]. 张习文,欧宗瑛. 机械科学与技术. 2001(02)
硕士论文
[1]基于OCR技术的通用证件识别系统[D]. 常参参.南昌大学 2018
[2]深度卷积神经网络在OCR问题中的应用研究[D]. 汪一文.电子科技大学 2018
[3]A汽车制造公司供应商管理研究[D]. 赵满生.武汉工程大学 2016
[4]CAD图纸文本信息提取与处理技术研究[D]. 颜立坤.河南工业大学 2013
[5]工程图三维重建中的信息提取与预处理技术研究[D]. 石岚峰.湖南大学 2006
本文编号:3515917
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
图2-4灰度直方图??Fig.2-4?Gray?histogram??
根据像素点局部邻域窗计算像素点阈值,在局部窗内计算阈值,有平均值法,高斯??加权法等,局部二值化方法速度一般较慢。对于图纸标题栏,其灰度直方图的分布??基本如图2-4所示,背景与目标相差较为明显,所以在对表格标题栏进行二值化时??可以使用OTSU算法,或者使用固定阈值进行二值化。??HEI??a)原始图??a)?Original?image??b)二值化图??b)?Binarization?graph??图2-3图像二值化??Fig.2-3?Image?binaryzation??70000?-??60000?-??50000?-??in??1??^?40000?-?|??〇??|?30000-??2??20000?-??10000?-?{??0?plBllla??,?1?1?1?—*——-??0?50?100?150?200?250??Grayscale??
对每个窗口采用单字识别模型对其进行识别。可以使用贪心算法或者是非极大??值抑制算法来规划最终的识别路径。这种识别方法存在两个问题,滑动步长过大容??易造成信息丢失,滑动步长过小计算量太大,所以很难选定一个合适的步长,同时??对单字识别模型的依赖程度较高。??语音识别,手写识别,文本识别其实都有一个共同的特点,就是需要对时序进??行建模,这就衍生出了序列学习[3G,31]。尽管文字行图像是二维的,但也都是以序列??的形式出现,识别过程中通常需要预测一系列的标签。文字识别也有其上下文的联??系,将从左到右的识别类比为时序,则文字识别也可归类为序列识别。通过端到端??的学习,无需进行矫正,分割等处理,输入文本行直接出来预测结果,以此提升序??列学习的效果,这己经成为当前研究的热点。基本思路是卷积神经网络??(Convolutional?Neural?Networks,CNN)与循环神经网络(Recurrent?Neural?Network,??RNN)结合:CNN被广泛的应用于特征提取,得到的特征可以充分的表征目标,而??RNN即有前馈连接又有反馈连接,决定了其适合处理序列问题。这种混合的文本??字符串识别网络突破了以往的文字识别方法,取得了不错的文字识别效果。??lnPU,image?ConvolutionalsandRelu
【参考文献】:
期刊论文
[1]基于雅克比稀疏自动编码机的手写数字识别算法[J]. 王慧玲,宋威. 计算机应用研究. 2018(12)
[2]一种基于Android平台的图像文字识别系统[J]. 赵思宁. 中国科技信息. 2018(02)
[3]基于图像分块的局部阈值二值化方法[J]. 张洁玉. 计算机应用. 2017(03)
[4]基于特征加权模糊模板匹配的字符识别[J]. 朱颢东,李红婵. 兰州理工大学学报. 2013(01)
[5]工程图纸字符串及标注信息提取[J]. 范帆,关佶红. 计算机工程与应用. 2012(07)
[6]工程图纸标题栏的自动生成及其信息提取的方法实现[J]. 苗帅,王卫东. 计算机应用与软件. 2011(09)
[7]面向工程图纸离线式表格信息提取与识别方法研究[J]. 董玉德,刘孙,朱长江,杜立,王仁敏,马云峰. 工程图学学报. 2009(01)
[8]工程图纸标题栏信息自动提取方法的研究[J]. 李贤兵,张应中,罗晓芳. 计算机工程与设计. 2004(11)
[9]机械图纸扫描图像尺寸信息提取[J]. 张习文,欧宗瑛. 机械科学与技术. 2001(02)
硕士论文
[1]基于OCR技术的通用证件识别系统[D]. 常参参.南昌大学 2018
[2]深度卷积神经网络在OCR问题中的应用研究[D]. 汪一文.电子科技大学 2018
[3]A汽车制造公司供应商管理研究[D]. 赵满生.武汉工程大学 2016
[4]CAD图纸文本信息提取与处理技术研究[D]. 颜立坤.河南工业大学 2013
[5]工程图三维重建中的信息提取与预处理技术研究[D]. 石岚峰.湖南大学 2006
本文编号:3515917
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3515917.html
最近更新
教材专著