当前位置:主页 > 医学论文 > 医卫管理论文 >

面向医疗保险图像的文本检测与识别研究

发布时间:2020-10-08 22:28
   图像中的文本信息包含着丰富准确的高层语义信息,是理解图像的关键要素。图像中的文本检测与识别技术在自动驾驶、电子档案、智慧医疗等诸多领域得到了广泛应用,受到学术界及产业界极大关注,已成为当前研究的一大热点。尽管当前的研究取得了许多成果,然而在医疗保险行业中的图像文本检测与识别仍面临巨大挑战。其一,医疗保险所用的图像分辨率低,图像噪声高。医疗保险图像在收集的过程中进行了多次压缩,导致图像分辨率低。医疗保险图像在使用过程中,其复印件会被再次复印,导致图像噪声变大。低分辨率高噪声的图像很难正确检测文本与非文本区域。其二,医疗保险图像表格线干扰大。不同于自然场景图片,医疗保险图像存在着大量表格,其中的文字、数字与表格线间的间隔较小,检测时经常会将表格线与文字连接到一起,引起识别错误。其三,医疗保险图像需要进行字符级的检测,现有检测算法在单字符检测时漏检严重,无法有效进行检测。其四,医疗保险图像包含大量的医疗发票及清单,图像上包含一个到多个彩色印章,导致被遮挡部分文字识别准确度下降,单一识别模型无法有效解决单字及序列的识别。针对以上问题,借鉴目标检测、轮廓检测、模式识别、深度学习等领域的最新进展,对医疗保险图像文本检测与识别开展了研究,主要研究工作如下:1)针对医疗保险图像分辨率低和噪声高导致的无法有效进行文本框检测的问题,在采用图像分割方式进行医疗保险图像文本检测时,提出了在像素分类中引入特征注意力机制的检测模型。该模型由检测网络和文本框生成两部分组成,检测网络将特征注意力机制应用到特征处理阶段,使得网络在处理特征的过程中尽可能多地保留图像原本的重要信息,促使模型学习到更加准确的特征。在文本框生成部分,提出了基于像素中心线的文本区域检测算法,从检测网络输出的结果中计算得到文本框结果,从而完成低分辨率、高噪声环境下的医疗保险图像的文本框检测。通过实验证明了该模型在分辨率低和噪声高的医疗保险图像中能取得较好的文本检测效果。2)为了解决医疗保险图像中表格线干扰大的问题,设计了由特征编码和特征上采样两个子网络组成的CEN模型。在特征编码子网络中,设计了一个特征增强模块保留文本轮廓信息,该模块能有效处理图像浅层特征,较好区分文本与表格线。在特征上采样子网络中,利用反卷积滤波器代替传统的上采样操作,对上一阶段提取的深层特征进行尺度扩充,在增加特征感受野的同时,有效地保留尽可能多的边缘信息。CEN模型最后对网络输出结果进行后处理,得到精确的医疗保险图像表格文本检测结果。通过实验证明了该模型在医疗保险表格图像中能取得较好的文本检测效果。3)为了有效进行单字符的检测,提出了一种将全卷积神经网络与蚁群算法结合的检测方法。该方法首先利用全卷积神经网络进行文本热图的检测,再在文本热图的基础上进行单字符的检测。在进行单字检测时,提出了一种优化的蚁群算法,该算法利用图像分区的梯度信息来初始化蚁群位置,根据文本目标的特点优化蚁群查找边缘的过程,设计一种自适应的信息素消散系数处理蚁群移动,有效地解决了传统蚁群算法收敛缓慢和对噪声敏感等问题,最终精确地分割出医疗保险图像中单个字符信息。通过实验证明了该方法在医疗保险图像中能取得较好的单字符检测效果。4)为了有效对印章覆盖文字及印章中小弧度文字和单字进行识别,提出一种多颜色空间多模型集成的识别算法。该算法首先将RGB通道进行通道分离,选取最合适的颜色空间进行识别,利用其它通道信息对识别进行补偿融合。其次,在选择的颜色通道上进行基于字符的识别和基于序列的识别,然后将两种模型的识别结果进行融合。为了对带有小弧度的文本进行识别,提出了一种基于四行注意力机制的识别模型,有效解决医疗保险图像中小弧度印章的文本识别。通过实验证明了集成算法能对医疗保险图像中的印章覆盖文字、单字符及小弧度文字进行有效识别。
【学位单位】:华中科技大学
【学位级别】:博士
【学位年份】:2019
【中图分类】:F842.684;TP391.41;R197.1
【部分图文】:

文本类型,图片,文本检测


(b)复杂环境下拍照文本 (c)自然场景下拍照文本图 1.1 图片文本类型为了对 OCR 研究有一个统一的评判标准及便于学者们交流,文档分析与识别国International Conference on Document Analysis and Recognition,ICDA3 年开始组织了 OCR 相关的比赛,并公开了数据集及其算法评测系统[3-6],ICD该领域最广泛的评测标准(Benchmark)。ICDAR 将 OCR 任务划分成三个子任务,分别为: 文本检测,即文本定位,查找输入图片中文本的位置。 文字识别,把文本检测所检测出来的文本框进行裁剪,当成文字识别的输对输入的文本框进行识别。 端到端:输入一张图片,输出图片中文本位置及相应文字识别结果。在过去 20 年间,大量学者提出了多种文本检测的方法。按照检测目标不同,基于字符的文本检测及基于单词的文本检测,按照文本框预测方式不同,可

检测步骤


华 中 科 技 大 学 博 士 学 位 论 文1.2.3 基于分割的文本检测分割算法在文本检测当中的应用已十分广泛,在实际图片中文本实例间的小,单纯的语义分割很难进行较好的分离,现在的基于分割的文本检测算法,在进行分割后,需要进行后处理得到文本行。TextBlock[30]算法利用分割思想进行文本行的检测,其检测步骤如图 1.2 所主要步骤包括:(1)用 FCN 进行文本/非文本的区域选择,一个独立的连通文称为一个 TextBlock;(2)使用 MSER 在 TextBlock 中提取字符区域;(3)以方式确定文本行方向;(4)利用文本行方向从 TextBlock 内得到文本行预测结用投影方式确定文本行方向的方法决定了 TextBlock 只适用于直线文本行的检于弯曲或竖直文本行的检测效果较差,如需要得到单个单词,还需要对检测到行进行分割,TextBlock 的处理速度也较慢。

噪声,图像,医疗保险


华 中 科 技 大 学 博 士 学 位 论 文像。同时,在网络传输过程中,为了保障用户的使用体验,快速完成图像的上传的图像进行压缩,有些图像会因为过度压缩而使图片失真,低分辨率的本检测带来较大影响。2.医疗保险图像噪声高文档图像一般是在较好的情况下成像,采用扫描仪扫描而得,其图像的质量噪声或噪声很小。医疗保险图像由于拍摄者的随意性,在拍摄的过程中产生等情况,使图像成像质量差,噪声大,致使检测识别效率低下,准确率低,图 1.3 所示。

【相似文献】

相关期刊论文 前10条

1 田志刚;刘伟东;张少锋;;关于我市医疗保险工作情况的调研报告[J];宝鸡社会科学;2005年03期

2 李梅;;浅析医疗保险档案管理的实践应用[J];人力资源;2019年20期

3 黄国武;仇雨临;;医疗保险治理现代化:内在逻辑和路径推演[J];四川大学学报(哲学社会科学版);2019年02期

4 陈丽霞;;医疗保险基金财务核算的不足和建议[J];财会学习;2019年08期

5 武杰;;探析医疗保险对医疗费用的影响[J];天津社会保险;2018年05期

6 黄春荣;;探析医疗保险基金的监管机制[J];劳动保障世界;2019年18期

7 王震;;医疗保险与医疗救助:理论、现实与政策[J];中国医疗保险;2019年07期

8 乔丽丽;;医疗保险差异对健康绩效的影响效应研究[J];保险职业学院学报;2019年03期

9 郑德利;;医疗保险档案管理在新形势下的强化策略[J];办公室业务;2019年12期

10 龙文忠;;医疗保险态势与结构优化影响探讨[J];临床医药文献电子杂志;2019年55期

相关会议论文 前10条

1 河北省财政学会课题组;;河北省医疗保险的政策评估与对策建议[A];中国财政学会2015年年会暨第二十次全国财政理论讨论会交流材料汇编之二[C];2015年

2 黄琼;;医疗保险对急性缺血性脑卒中溶栓治疗的疗效的影响[A];中华医学会第十八次全国神经病学学术会议论文汇编(下)[C];2015年

3 吴林旭;;探究医疗保险单位的人员绩效管理工作[A];“决策论坛——公共政策的创新与分析学术研讨会”论文集(下)[C];2016年

4 王亚飞;;微信群在医疗保险办公室工作中的应用[A];2015年医疗保险学术年会资料汇编[C];2015年

5 曹传清;;医疗保险档案管理中存在的问题与解决措施探微[A];决策论坛——基于公共管理学视角的决策研讨会论文集(上)[C];2015年

6 陈红;;在医疗改革的新形势下如何做好护士长工作[A];全国外科护理学术交流暨专题讲座会议论文汇编[C];2002年

7 王清华;万兴军;;贫困县如何开展医疗保险——灌云县医疗保险情况调研[A];2003’江苏省劳动和社会保障论文集[C];2003年

8 颜爱华;;三明市医疗保险基金赤字原因分析及相应对策[A];2004—2005年福建省会计学会理论研讨会论文集[C];2005年

9 傅鸿翔;;医疗保险的费用控制机制探讨[A];第一届浙江医学发展论坛论文集[C];2006年

10 陈丽;包品红;洪捷;孔研;;病案数码化在医疗保险中的价值[A];中国医院协会病案管理专业委员会第16届学术会议论文集[C];2007年

相关重要报纸文章 前10条

1 通讯员 李尚菲 周春清;郧阳调剂2452万补充贫困人口医疗保险[N];十堰日报;2019年

2 本报记者 郑源源;长期医疗保险可进行费率调整[N];农村金融时报;2019年

3 记者 唐庆 通讯员 向国屏;永顺贫困人口医疗保险实现全覆盖[N];团结报;2020年

4 记者 刘春燕;我市全面实行医疗保险门诊大病“长处方”报销政策[N];石嘴山日报;2020年

5 况娟 骆轶琪 张希雯;信息不畅折减高校医保效果[N];中国青年报;2011年

6 首席记者 王守明 通讯员 刘刚 程亚;12月1日起我市生育保险和职工医疗保险合并实施[N];淮北日报;2019年

7 青岛日报、青岛观、青报网记者 赵波;明年起青岛生育保险职工医疗保险合并实施[N];青岛日报;2019年

8 记者 张伟宁;首款“澳门专属”跨境医疗保险产品发布[N];珠海特区报;2019年

9 本报记者 张原 李宁馨;医疗保险先期介入让急诊住院治疗不再难[N];人民政协报;2020年

10 朱强;略阳联社全力保障医疗保险征缴工作[N];汉中日报;2019年

相关博士学位论文 前10条

1 谢屈波;面向医疗保险图像的文本检测与识别研究[D];华中科技大学;2019年

2 高永昌;医疗保险大数据中的欺诈检测关键问题研究[D];山东大学;2018年

3 石安其琛;基本医疗保险政策效果评估[D];对外经济贸易大学;2018年

4 王茜;基于精算评估的我国基本医疗保险基金可持续性研究[D];中央财经大学;2016年

5 吴爱平;保险人群医疗服务利用公平性研究南通市职工医疗保险实证[D];复旦大学;2004年

6 张亚东;医疗费用控制与医疗保险纵向一体化研究[D];华中科技大学;2004年

7 王健;参保职工医疗服务利用与费用及其影响因素研究[D];山东大学;2006年

8 李晓林;我国医疗服务领域公平性分析[D];吉林大学;2006年

9 杨文俊;美德日社会保险制度比较研究[D];吉林大学;2007年

10 田国栋;城镇职工基本医疗保险基金平衡的影响因素及对策研究[D];复旦大学;2006年

相关硕士学位论文 前10条

1 陈奕男;基本医疗保险制度整合问题研究[D];黑龙江大学;2019年

2 孙杨;大连市居民健康保障制度的研究[D];大连理工大学;2019年

3 刘天宇;天津市城乡居民基本医疗保险制度满意度及其影响因素研究[D];长春工业大学;2019年

4 曾霞;江西省精准扶贫医疗保险调研报告[D];江西财经大学;2019年

5 曾yN琪;大学生医疗保险满意度分析[D];江西财经大学;2019年

6 张五星;社会支持、医疗保险对老年人生活满意度的影响研究[D];河南大学;2019年

7 孙媛;S省职工基本医疗保险基金管理研究[D];山西大学;2019年

8 李苗;城镇职工医疗保险对重大疾病患者的补偿效果研究:以陕西省旬邑县为例[D];西北大学;2019年

9 何其慧;某三甲医院医保院内智能审核系统的应用及效果分析[D];华北理工大学;2019年

10 卢美鑫;东北地区流动人口医疗保险参保率影响因素研究[D];辽宁大学;2019年



本文编号:2832845

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/2832845.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3c51d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com