中文医疗化验单图像的信息抽取与识别算法研究
发布时间:2021-01-07 07:25
人工智能技术已经渗入到各行各业并为社会带来了很多便利。但仍然存在很多尚未被挖掘且有着广大需求的领域,例如医疗行业中患者留存的大量的纸质化验单作为重要的医疗大数据的来源之一,并没有被利用起来。然而对患者来说,仍被广泛使用的化验单难以存储和管理。相比之下,电子的医疗化验单不仅能够解决以上问题,还能够促进远程医疗和医疗大数据的发展。因此,将传统的纸质医疗化验单电子化是实现医疗大数据至关重要的一步。值得提及的是,由于中文化验单结构复杂、字符种类繁多,包含中文、英文、希腊字母、数学符号等,导致中文化验单图像的识别是一个富有挑战的任务。针对以上问题,本论文首先提出了一套完整的解决方案——基于深度学习的化验单信息抽取方法,包括化验单中的文字检测与识别。基于深度学习的文字检测算法避免了传统文字检测算法繁琐的步骤,检测效率高。不仅如此,基于深度学习的检测模型还表现出较高的准确率;考虑到单字识别模型的标注成本过高,我们基于Tesseract定制了适用于化验单场景的识别模块。Tesseract可作为预标注工具并支持多语言的字符识别,它的训练速度相比神经网络模型较快。通过分析单字识别模型的实验结果,我们发现基...
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
图1-2神经网络中的感受野示例??Figure?1-2?A?demonstration?for?the?receptive?field?in?neural?networks.??
选用了设置阈值和非极大值抑制(Non-maximum?Suppression,NMS)方法处理回归??出的文本框,得到最准确的文本框。该方法在各大公开数据集上的准确率都遥遥领??先,图2-2展示了该方法在ICDAR2015和MSRA-TD500这两个公开数据集中的??部分图片上的检测效果。??B禮??',棚、??_?■??a)?b)??图2-2£八5丁检测样例&)100八112015数据集13)1^1^-丁0500数据集[31]??Figure?2-2?Examples?of?EAST?detection?a)?the?dataset?of?ICDAR2015?b)?the?dataset?of?MSRA-??TD500[31]??12??
图像运算符,它计算每个像素最可能笔划的宽度。SWT的输出是一个大小等于输??入图像大小的图像,其中每个元素包含与像素关联的笔划宽度。一个笔画定义为图??像的一个连续部分,它形成一个宽度几乎恒定的带区域。图2-3解释了笔画宽度的??定义。该算法不预先对笔画的实际宽度进行约束,而是去恢复它的宽度。?? ̄ ̄了--丁了.■"广了.r1?'?1?r:.!…rr,r,,p"m,??-u?.J??^?u?\?.?...?-I.?|?J?U?^??^?-wrM?Vnr?i^iii?ir^ri?i^iiiiri^.ii?ii广.?丨十r-.■卞?■一?:二T?i?''?i■备一-卞…十?I?4?j?if??44-^?卞+^??—?gWiiiiM±kkfctftr!Tr:,?rP??P>?Hr??//?Jd??..:;'b????■?I?;?|?T?^?I?^?■■錄1?1■-?-这????? ̄ ̄??,,7|^'i?ix???,一,二一>—^.."_卜一??---4?-?-i?f?*?I?I?t?t?…■,。,..丨_,4".‘_”!_"?1??4-^-??14-><|^ ̄?4—-一4^>'??'°^'-<4^?一-1 ̄4- ̄?卜-.十■—…■?.t,.…^?I?<j??<?-,?? ̄ ̄J—?‘*??a)?b)?c)??图2-3?SWT的实现。a)典型笔画;b)/j是一个在笔画边缘的像素
本文编号:2962160
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
图1-2神经网络中的感受野示例??Figure?1-2?A?demonstration?for?the?receptive?field?in?neural?networks.??
选用了设置阈值和非极大值抑制(Non-maximum?Suppression,NMS)方法处理回归??出的文本框,得到最准确的文本框。该方法在各大公开数据集上的准确率都遥遥领??先,图2-2展示了该方法在ICDAR2015和MSRA-TD500这两个公开数据集中的??部分图片上的检测效果。??B禮??',棚、??_?■??a)?b)??图2-2£八5丁检测样例&)100八112015数据集13)1^1^-丁0500数据集[31]??Figure?2-2?Examples?of?EAST?detection?a)?the?dataset?of?ICDAR2015?b)?the?dataset?of?MSRA-??TD500[31]??12??
图像运算符,它计算每个像素最可能笔划的宽度。SWT的输出是一个大小等于输??入图像大小的图像,其中每个元素包含与像素关联的笔划宽度。一个笔画定义为图??像的一个连续部分,它形成一个宽度几乎恒定的带区域。图2-3解释了笔画宽度的??定义。该算法不预先对笔画的实际宽度进行约束,而是去恢复它的宽度。?? ̄ ̄了--丁了.■"广了.r1?'?1?r:.!…rr,r,,p"m,??-u?.J??^?u?\?.?...?-I.?|?J?U?^??^?-wrM?Vnr?i^iii?ir^ri?i^iiiiri^.ii?ii广.?丨十r-.■卞?■一?:二T?i?''?i■备一-卞…十?I?4?j?if??44-^?卞+^??—?gWiiiiM±kkfctftr!Tr:,?rP??P>?Hr??//?Jd??..:;'b????■?I?;?|?T?^?I?^?■■錄1?1■-?-这????? ̄ ̄??,,7|^'i?ix???,一,二一>—^.."_卜一??---4?-?-i?f?*?I?I?t?t?…■,。,..丨_,4".‘_”!_"?1??4-^-??14-><|^ ̄?4—-一4^>'??'°^'-<4^?一-1 ̄4- ̄?卜-.十■—…■?.t,.…^?I?<j??<?-,?? ̄ ̄J—?‘*??a)?b)?c)??图2-3?SWT的实现。a)典型笔画;b)/j是一个在笔画边缘的像素
本文编号:2962160
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2962160.html
最近更新
教材专著