当前位置:主页 > 科技论文 > 软件论文 >

基于OCR技术的化验单识别方法研究

发布时间:2018-04-04 17:51

  本文选题:OCR 切入点:化验单 出处:《浙江大学》2017年硕士论文


【摘要】:随着医疗互联网的发展,人类医疗产生的健康数据正迅速增长,健康数据体现在就诊后的化验单数据。我国医疗行业医患之间的数量差异导致化验单的解读存在壁垒,高效且准确地解读化验单、管理个人的健康数据是目前健康医疗行业面临的挑战。论文针对解读化验单、管理个人的健康数据中存在的问题,提出基于OCR技术的化验单识别基本流程方法,包括预处理、模式识别、内容识别、识别结果纠错,具体工作如下。首先论文对化验单图像预处理,主要包括二值化、抗扭斜。研究了全局阈值法、自适应阈值法和OTSU方法三种二值化方法,通过对比实验,分析了不同方法的预处理效果,选取OTSU方法作为化验单图像二值化基本方法。随后通过模式识别技术,采用基于霍夫变换的直线检测方法提取化验单图像特征,根据直线特征分类化验单图像、处理化验单图像。再利用Tesseract开源引擎,训练数据、参数调优、识别化验单内容。论文最后对识别结果采取结合编辑距离和化验单医学词库的纠错方案,通过汉字图像相似度比较,确定最终纠错选项。论文通过化验单识别结果纠错前后的对比实验,验证了该纠错方案的有效性。
[Abstract]:With the development of the medical Internet, the health data generated by human medical is increasing rapidly.The difference in the number of doctors and patients in our medical profession leads to the barriers to the interpretation of the laboratory sheet. It is a challenge for the health medical industry to efficiently and accurately interpret the test sheet and manage the individual health data.Aiming at the problems existing in the interpretation of laboratory sheets and the management of personal health data, this paper puts forward the basic flow method of identification of laboratory sheets based on OCR technology, including preprocessing, pattern recognition, content recognition, and error correction of recognition results. The specific work is as follows.First of all, the paper preprocessing the single image, mainly including binarization, torsion resistance.Three binarization methods, global threshold method, adaptive threshold method and OTSU method, are studied. Through comparative experiments, the preprocessing effects of different methods are analyzed, and OTSU method is selected as the basic method of binarization of single image.Then, through the pattern recognition technology, the method of line detection based on Hough transform is used to extract the feature of the laboratory single image, and the single image is classified according to the line feature, and the single test image is processed.Then use Tesseract open-source engine, training data, parameter tuning, identify the content of the test sheet.At the end of the paper, the method of error correction combined with editing distance and laboratory medical lexicon is adopted, and the final error correction options are determined by comparing the similarity of Chinese character images.The validity of the error correction scheme is verified by the contrast experiment before and after error correction.
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.41

【相似文献】

相关期刊论文 前8条

1 吴小英;;OCR技术及其在图书馆中的应用[J];当代图书馆;2001年02期

2 韩元中;浅析OCR技术在银行凭证档案中的应用[J];数字与缩微影像;2005年02期

3 李洋;;OCR技术在中央银行会计核算数据集中系统应用初探[J];金融发展研究;2014年04期

4 李联涛;孙海东;;OCR技术在B737定检工卡数字化中的应用[J];科技经济市场;2011年08期

5 迟春佳;;OCR技术及其在高校图书馆信息资源数字化建设中的应用[J];中国科技信息;2007年07期

6 ;引入OCR技术,再造事后监督流程——记南通工行事后监督改革[J];中国金融电脑;2003年04期

7 邢立民;陈永琴;;扫描仪的OCR技术[J];实验室科学;2006年06期

8 丁晓青,郭繁夏;中文OCR技术最新进展[J];电子出版;1995年12期

相关重要报纸文章 前5条

1 记者 张林军;中以巨头巅峰合作 汉王OCR技术新突破[N];大众科技报;2006年

2 琪文;引入OCR技术 再造事后监督流程[N];金融时报;2003年

3 林君;汉王OCR技术获科技进步一等奖[N];大众科技报;2006年

4 王伟;OCR技术:提速物流企业票据管理[N];现代物流报;2007年

5 江山;OCR技术助力金融业票据处理[N];中华工商时报;2006年

相关硕士学位论文 前2条

1 王宸敏;基于OCR技术的化验单识别方法研究[D];浙江大学;2017年

2 索玉秀;基于OCR技术的名片识别方法研究[D];哈尔滨理工大学;2015年



本文编号:1711032

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1711032.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c73c5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com