复杂背景下仪表信息的图像识别研究
发布时间:2021-03-05 14:16
复杂环境下仪器仪表的图像信号处理可广泛应用于水电表、燃气表、工厂锅炉表盘等机械工程领域,但是如何设计一种更高效、更简单的仪表信息识别技术,一直都是科研人员和工程师研究的热门话题。研究分析了三种可用于仪表信息识别的技术,并对比了其识别率和复杂度,对所采集的仪表图像的识别率分别为80. 6%、49. 2%、90. 7%。实验结果表明,基于Python和OCR的仪表信息识别技术的识别效果是最佳的,对仪表图像进行预处理后得到待识别样本图,从而调用百度OCR的文字识别接口获取有用信息。相比于传统的基于嵌入式和OpenCV的识别技术,它不仅可以大大提高识别准确率至90%以上,而且还降低了复杂度。
【文章来源】:激光杂志. 2020,41(04)北大核心
【文章页数】:4 页
【部分图文】:
方法一的流程框图
如上图所示,本方法是使用基于烧写裁剪过的Linux操作系统,结合硬件环境导入图像处理程序,根据仪表信息多字符和多数字的特点,对仪表图像进行灰度化、二值化、闭运算和中值滤波等预处理之后,采用轮廓检测、连通域分割和垂直投影法对仪表信息进行字符定位和分割,利用邻近分类算法的仪表识别算法,进行优化模板匹配法[18],最后采用近邻法进行模板匹配,对每个分割出的字符块进行识别。在复杂工业工程环境中,所采集的仪表信息如图2的左边部分所示,测试样本图的识别结果如图2的右边部分所示,经对比计算后,其识别准确率为82.2%。3.2 基于Python和Tesseract的仪表信息识别
光学字符识别(OCR)的主要功能是将图像中的文字转换成文本格式。相对于传统的手工录入方式来说,OCR智能录入具有强大的优势,识别的速度远快于手工录入,减少了人工输入时间和工作量,还可以提供高效率、低成本的数据采集方案[10]。而Tesseract是一款开源OCR库,其图像转换文本的能力具有极高的精确度和灵活性[13]。此外,Tesseract对于彩色图片的识别效果没有黑白图片的效果好。因此,我们提出了基于Python和Tesseract的仪表信息识别技术,称为方法二,流程如图3所示。方法二如图3所示,首先使用Python语言对输入的彩色仪表图像进行加权平均灰度化、大律法等图像预处理后,得到如图4左边部分所示的待识别图,使其增强有关信息,提高识别准确率,再调用Tesseract_OCR对待识别的测试样本图进行仪表信息识别,识别结果如图4的右边部分所示,识别准确率为51.6%。
【参考文献】:
期刊论文
[1]中国信息通信研究院专家访问机械工业仪器仪表综合技术经济研究所探讨工业互联网合作[J]. 仪器仪表标准化与计量. 2019(01)
[2]Python语言在科学算法中的优势[J]. 刘瑞. 信息与电脑(理论版). 2019(04)
[3]基于铭牌OCR的字符分割优化技术[J]. 陈习,曾智翔,张蓓蕾,陈春. 福建电脑. 2019(01)
[4]基于数字图像处理的智能交通管理控制系统[J]. 吴则平. 通讯世界. 2018(08)
[5]基于人工智能的图像识别技术探讨[J]. 宋炯,柏松平,王燕华. 科技传播. 2018(01)
[6]数字图像处理综述[J]. 张薇,于硕. 通讯世界. 2015(18)
[7]嵌入式Linux系统的数字图像测量算法实现[J]. 陈磊,曹文峰,操亚华. 信息与电脑(理论版). 2015(09)
[8]基于数字图像处理的数显仪表数字识别[J]. 雷芳. 广东石油化工学院学报. 2014(06)
[9]仪器仪表数字图像的识别及其应用[J]. 迟铁,马斌,韩忠华,王长涛,孟祥斌. 电子产品世界. 2010(11)
[10]机器视觉技术及其应用综述[J]. 段峰,王耀南,雷晓峰,吴立钊,谭文. 自动化博览. 2002(03)
硕士论文
[1]OCR文字识别技术在不动产数据整合中的应用[D]. 马泽.东华理工大学 2018
[2]基于OCR技术的通用证件识别系统[D]. 常参参.南昌大学 2018
[3]基于TesseractOCR的驾驶证识别系统设计与实现[D]. 李亮.电子科技大学 2018
[4]面向图像的场景文字识别技术研究[D]. 卢未来.辽宁工业大学 2018
[5]复杂背景下彩色图像中的文字识别[D]. 付磊.吉林大学 2011
[6]仪器仪表数字图像识别及其应用研究[D]. 李貌.广东工业大学 2006
本文编号:3065345
【文章来源】:激光杂志. 2020,41(04)北大核心
【文章页数】:4 页
【部分图文】:
方法一的流程框图
如上图所示,本方法是使用基于烧写裁剪过的Linux操作系统,结合硬件环境导入图像处理程序,根据仪表信息多字符和多数字的特点,对仪表图像进行灰度化、二值化、闭运算和中值滤波等预处理之后,采用轮廓检测、连通域分割和垂直投影法对仪表信息进行字符定位和分割,利用邻近分类算法的仪表识别算法,进行优化模板匹配法[18],最后采用近邻法进行模板匹配,对每个分割出的字符块进行识别。在复杂工业工程环境中,所采集的仪表信息如图2的左边部分所示,测试样本图的识别结果如图2的右边部分所示,经对比计算后,其识别准确率为82.2%。3.2 基于Python和Tesseract的仪表信息识别
光学字符识别(OCR)的主要功能是将图像中的文字转换成文本格式。相对于传统的手工录入方式来说,OCR智能录入具有强大的优势,识别的速度远快于手工录入,减少了人工输入时间和工作量,还可以提供高效率、低成本的数据采集方案[10]。而Tesseract是一款开源OCR库,其图像转换文本的能力具有极高的精确度和灵活性[13]。此外,Tesseract对于彩色图片的识别效果没有黑白图片的效果好。因此,我们提出了基于Python和Tesseract的仪表信息识别技术,称为方法二,流程如图3所示。方法二如图3所示,首先使用Python语言对输入的彩色仪表图像进行加权平均灰度化、大律法等图像预处理后,得到如图4左边部分所示的待识别图,使其增强有关信息,提高识别准确率,再调用Tesseract_OCR对待识别的测试样本图进行仪表信息识别,识别结果如图4的右边部分所示,识别准确率为51.6%。
【参考文献】:
期刊论文
[1]中国信息通信研究院专家访问机械工业仪器仪表综合技术经济研究所探讨工业互联网合作[J]. 仪器仪表标准化与计量. 2019(01)
[2]Python语言在科学算法中的优势[J]. 刘瑞. 信息与电脑(理论版). 2019(04)
[3]基于铭牌OCR的字符分割优化技术[J]. 陈习,曾智翔,张蓓蕾,陈春. 福建电脑. 2019(01)
[4]基于数字图像处理的智能交通管理控制系统[J]. 吴则平. 通讯世界. 2018(08)
[5]基于人工智能的图像识别技术探讨[J]. 宋炯,柏松平,王燕华. 科技传播. 2018(01)
[6]数字图像处理综述[J]. 张薇,于硕. 通讯世界. 2015(18)
[7]嵌入式Linux系统的数字图像测量算法实现[J]. 陈磊,曹文峰,操亚华. 信息与电脑(理论版). 2015(09)
[8]基于数字图像处理的数显仪表数字识别[J]. 雷芳. 广东石油化工学院学报. 2014(06)
[9]仪器仪表数字图像的识别及其应用[J]. 迟铁,马斌,韩忠华,王长涛,孟祥斌. 电子产品世界. 2010(11)
[10]机器视觉技术及其应用综述[J]. 段峰,王耀南,雷晓峰,吴立钊,谭文. 自动化博览. 2002(03)
硕士论文
[1]OCR文字识别技术在不动产数据整合中的应用[D]. 马泽.东华理工大学 2018
[2]基于OCR技术的通用证件识别系统[D]. 常参参.南昌大学 2018
[3]基于TesseractOCR的驾驶证识别系统设计与实现[D]. 李亮.电子科技大学 2018
[4]面向图像的场景文字识别技术研究[D]. 卢未来.辽宁工业大学 2018
[5]复杂背景下彩色图像中的文字识别[D]. 付磊.吉林大学 2011
[6]仪器仪表数字图像识别及其应用研究[D]. 李貌.广东工业大学 2006
本文编号:3065345
本文链接:https://www.wllwen.com/kejilunwen/yiqiyibiao/3065345.html