基于依存句法分析的超声检查报告结构化处理方法
本文关键词: 医疗数据 超声检查报告 依存句法分析 文本结构化处理 神经网络语言模型 出处:《东华大学》2017年硕士论文 论文类型:学位论文
【摘要】:超声检查报告记录了病人在一次超声检查后得到的影像描述及医生的诊断结果,是重要的临床信息,也是医学领域研究重要的数据来源。为了能够更准确地描述患者的病情,医生通常以自然语言书写各类检查报告的内容,上述非结构化数据描述不利于计算机进行自动分析和处理,在一定程度上阻碍了医疗大数据的信息挖掘和知识发现,因此有必要在分析之前进行结构化处理。目前针对中文自然语言的文本结构化处理方法主要采用的是信息关系抽取技术,然而该方法的可扩展性较差,而超声检查报告中对不同检查部位具有不同的表述特征,所以现有的中文信息关系抽取技术无法适用于超声检查报告文本的结构化处理。为解决上述问题,本文在传统信息关系抽取技术的基础上结合句法分析方法,并根据超声检查报告特有的语法特征,提出了一种基于依存句法分析的医疗指标结构化处理方法。该方法通过分析文本句子结构,获取句中各成分之间的依存关系及语义特征,同时构建依存关系树,最终从依存关系树中获取器官组织或病症的属性描述,进而将非结构化的超声检查报告提取成key-value形式的结构化数据,方便计算机进行分析处理。本文所做的研究如下:首先,本文对现有中文自然语言结构化处理方法的现状进行了归纳,探讨了实体关系抽取、依存句法分析以及基于机器学习方法等结构化处理方法的优缺点,同时对本文涉及的同义词识别方法和文本标注方法的研究现状也作了说明。接着对本文所使用的Word2vec词向量训练工具和Han LP中文自然语言处理工具的工作原理进行了阐述。其次,对本文所提出的基于依存句法分析结构化处理方法的整体框架作了说明,分别介绍了该框架中的主要模块,并对其中的核心算法依次作了详细说明。设置预处理模块是为了消除一义多词现象,通过神经网络语言模型构建超声检查报告的同义词表得以实现;指标提取模块中利用依存关系树生成结构化模板,并采用切分短句和文本标注相结合的分治剪裁策略简化依存关系树结构,使语法关系更加清晰,提高结构化结果的准确度;在后处理模块中对噪声数据进行修正,同时优化算法,提高其可扩展性。最后,本文使用真实的医院病理检查报告数据作为实验数据集,验证了本文提出的结构化处理方法的可用性及通用性。实验表明,针对超声检查报告的指标词和对应指标值提取的准确率可以分别达到82.91%和79.11%,为相关研究打下了基础。
[Abstract]:The ultrasonic examination report records the image description of the patient after an ultrasound examination and the doctor's diagnostic results. It is an important clinical information and important data source for medical research, in order to describe the patient's condition more accurately. Doctors usually write the contents of various examination reports in natural language. The above unstructured data description is not conducive to the automatic analysis and processing of computers, and to a certain extent hinders medical big data's information mining and knowledge discovery. Therefore, it is necessary to carry out structured processing before analysis. At present, the main method of text structured processing for Chinese natural language is information relation extraction technology, however, the extensibility of this method is poor. However, the ultrasonic examination report has different expression characteristics for different examination sites, so the existing Chinese information relation extraction technology can not be applied to the structured processing of ultrasonic inspection report text. In order to solve the above problems, Based on the traditional information relation extraction technique and the syntactic analysis method, and according to the special grammatical features of the ultrasonic examination report, This paper presents a structured processing method for medical indicators based on dependency syntax analysis. By analyzing the sentence structure of the text, the dependency and semantic features of each component in the sentence are obtained, and the dependency tree is constructed at the same time. Finally, the attribute description of organ, tissue or disease is obtained from dependency tree, and then the unstructured ultrasonic examination report is extracted into structured data in the form of key-value, which is convenient for computer to analyze and process. The research in this paper is as follows: firstly, In this paper, the current situation of Chinese natural language structured processing methods is summarized, and the advantages and disadvantages of entity relation extraction, dependency syntax analysis and machine learning are discussed. At the same time, the research status of synonym recognition and text tagging is also explained. Then, the working principle of Word2vec word vector training tool and Han LP Chinese natural language processing tool are described. In this paper, the framework of structured processing method based on dependency parsing is introduced, and the main modules in the framework are introduced. The core algorithms are explained in detail. The preprocessing module is set up to eliminate the phenomenon of multi-word meaning, and the synonym table of ultrasonic examination report is constructed by neural network language model. In the index extraction module, the dependency tree is used to generate the structured template, and the divide-and-conquer clipping strategy is adopted to simplify the dependency tree structure, so that the syntax relation is clearer and the accuracy of the structured result is improved. In the post-processing module, the noise data is modified, and the algorithm is optimized to improve its extensibility. Finally, the real hospital pathology report data is used as the experimental data set. The experimental results show that the accuracy of extracting index words and corresponding index values of ultrasonic inspection report can reach 82.91% and 79.11 respectively, which lays a foundation for related research.
【学位授予单位】:东华大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.1;R445.1
【相似文献】
相关期刊论文 前10条
1 董林森,凌宝存,宫泽光,刘克震;超声检查辅助阑尾炎的诊治[J];前卫医药杂志;2000年03期
2 黄培兰,余习蛟,谢腊英;眼部异物的超声检查(附16例报告)[J];中国医师杂志;2001年02期
3 傟晓辉;急性右侧结肠憩室炎的超声检查[J];国外医学.外科学分册;2002年03期
4 沈延政;加强超声医疗服务规范和安全防范刻不容缓[J];中国医学影像技术;2002年12期
5 王保玲;超声检查在健康体检中的作用[J];实用医技杂志;2003年02期
6 杨琳,姚晓奇,刘亚绵;假性甲状旁腺机能减退症1例的超声表现[J];中国超声医学杂志;2004年03期
7 李琼英;对超声检查病人开展健康教育的体会[J];职业与健康;2005年10期
8 刘欣;王月香;于德江;唐杰;于国;;第10例 超声检查发现肝右叶占位性病变[J];中华医学超声杂志(电子版);2006年01期
9 陈月花;;超声检查前对患者健康教育的作用[J];职业与健康;2006年12期
10 马秀清;;环形阑尾炎的超声表现1例[J];中国超声医学杂志;2006年09期
相关会议论文 前10条
1 沈秋芳;朱京京;王明雅;;超声检查在体检中的应用价值[A];中华医学会超声医学新进展学术会议论文汇编[C];2004年
2 涂长玉;;小儿髋关节规范性超声检查[A];中华医学会第十三次全国超声医学学术会议论文汇编[C];2013年
3 涂长玉;;小儿髋关节规范性超声检查[A];2013山东省儿童保健学术交流会资料汇编[C];2013年
4 葛凤芹;;妇产科术后近期超声观察[A];第二届长三角超声医学论坛暨2009年浙江省超声医学学术年会论文汇编[C];2009年
5 张东兴;;超声检查在基层医院的现状与思考[A];中国超声医学工程学会第八届全国腹部超声学术会议论文汇编[C];2010年
6 刘为公;智建华;刘镇;;超声对主动脉夹层动脉瘤的诊断价值(附三例报告)[A];中华医学会第六次全国超声医学学术年会论文汇编[C];2001年
7 宋伊丽;;小儿妇科超声检查[A];2005年浙江省超声医学学术年会论文汇编[C];2005年
8 于东平;;B型超声检查在出生缺陷筛查中的应用[A];第三届计划生育与生殖健康学术交流大会论文汇编[C];2005年
9 刘景菊;孙庆瑛;;对产前B型超声检查的认识误区[A];第三届计划生育与生殖健康学术交流大会论文汇编[C];2005年
10 杨文丽;;超声检查在计划生育“三情查体”中的应用[A];第三届计划生育与生殖健康学术交流大会论文汇编[C];2005年
相关重要报纸文章 前10条
1 第四军医大学唐都医院 闵保华;超声检查该做哪些准备[N];家庭医生报;2004年
2 解放军546医院超声科主任 胡泽华;超声报告如何写才贴切[N];健康报;2012年
3 王小华;超声技术的空白领域——胃肠超声[N];农村医药报(汉);2007年
4 河北省沧州中心医院 杨德瑞;乙肝患者怎样选择超声检查[N];保健时报;2010年
5 记者 李艳梅 通讯员 聂一钢 涂晓晨 张方方;王新房获“超声之父”称号[N];长江日报;2011年
6 本报记者 李蕴明;决策系统给超声技术“深潜”供氧[N];医药经济报;2012年
7 本报记者 慕欣;不可忽视产前二次超声检查[N];医药经济报;2010年
8 张艳蓉邋杨亚利;超声检查前 准备早知道[N];家庭医生报;2007年
9 翟云云;怎样做好腹部超声前检查准备[N];农村医药报(汉);2007年
10 彭光生;为超声检查定规矩[N];健康报;2006年
相关博士学位论文 前10条
1 王华;超声及320排CT诊断先天性心脏病的临床应用研究[D];郑州大学;2014年
2 陈树强;多模式超声评估类风湿性关节炎的实验研究[D];福建医科大学;2015年
3 李洪飞;超声引导注射神经生长因子对兔受损周围神经再生的研究[D];中国人民解放军医学院;2016年
4 张茂;床旁超声在严重创伤快速评估中的应用研究[D];浙江大学;2008年
5 何爱军;超声心脏图象的多维多参数功能重建[D];四川大学;2002年
6 李冬凯;肺部超声在急性呼吸窘迫综合征肺复张过程中的应用[D];北京协和医学院;2013年
7 朱庆莉;超声对乳腺病变的诊断及病理学对照研究[D];中国协和医科大学;2004年
8 袁定华;胸主动脉病变综合超声系列研究[D];中国协和医科大学;1995年
9 陶国伟;超声联合MRI对胎儿中枢神经系统的应用研究[D];山东大学;2008年
10 洪玉蓉;超声在甲状腺乳头状癌颈部淋巴结转移诊断和预测中的应用研究[D];浙江大学;2014年
相关硕士学位论文 前10条
1 黄丽燕;超声对年轻乳腺癌诊断与鉴别诊断的价值研究[D];福建医科大学;2015年
2 钟岩;超声动态观察类风湿关节炎手关节病变对其疗效的评估[D];石河子大学;2015年
3 陈晶;超声误诊为甲状腺癌的良性病变超声与病理对照分析[D];山西医科大学;2015年
4 张仁韦;铜钢熔敷焊焊接接头自动超声C扫检测系统研究[D];南京理工大学;2015年
5 邓妍妍;US-CT/MRI融合成像在肝癌消融治疗中的应用[D];广西医科大学;2015年
6 张俊花;超声对正常甲状旁腺及甲状旁腺肿瘤诊断的应用价值[D];山西医科大学;2015年
7 徐雪纯;飞行人员颈部动脉超声标准化测量及椎动脉储备功能研究[D];河北北方学院;2015年
8 邓肖群;婴儿髋关节超声检查床研制与临床应用研究[D];兰州大学;2015年
9 宣之东;正常人舌的超声解剖及血流多普勒研究[D];河北医科大学;2014年
10 黄英;干燥综合征腮腺超声与磁共振导管成像的对比研究[D];广西医科大学;2015年
,本文编号:1512318
本文链接:https://www.wllwen.com/yixuelunwen/fangshe/1512318.html