面向急性加重型慢阻肺的计算机辅助诊断模型研究

发布时间:2021-01-19 12:15
  慢性阻塞性肺疾病(chronic obstructive pulmonary disease,简称慢阻肺)是一种严重危害人类健康的常见病、多发病,居全球死亡原因第4位。目前,诊断方法是通过病人临床症状、体征、实验室检查指标等综合诊断。一般的诊断方法诊断时间长,治疗价格比较高,而且临床症状的描述,缺乏量化指标,容易造成漏诊和误诊。本文主要通过对急性加重型慢阻肺特有临床特征等特征结合分析,并使用自然语言处理相关技术,建立了对急性加重型慢阻肺(AECOPD)电子病历进行辅助诊断的模型。本文研究对于将电子病历应用在医疗辅助诊断领域具有非常重要的学术价值。本文主要从下面几个方面进行研究且创新点如下:(1)对比目前单独使用数据驱动或使用专家系统在医疗领域做疾病诊断,本文结合NLP(自然语言处理)技术,通过数据驱动的方式结合知识驱动,对文本分类处理,针对患者使特征更具可解释性,这也是本文的创新点;(2)对于知识驱动,主要是人工读取专家手册,并与专家沟通确定AECOPD已有的特征;(3)对于数据驱动,根据AECOPD临床特征,对电子病历数据进行实体抽取、词频特征提取,并将两者结合;(4)将数据驱动与知... 

【文章来源】:中北大学山西省

【文章页数】:50 页

【学位级别】:硕士

【部分图文】:

面向急性加重型慢阻肺的计算机辅助诊断模型研究


知识图谱建设框架图

本体结构,部分内容,本体


首先需要阅读 AECOPD 诊治专家发表的诊治指南或者专家共识手册,然后通过手动方式标注 AECOPD 诊断主要特征,通过 Bilstm+crf 再根据数据语义识别抽出特征各类,进行学习分类电子病例文本。2.1.2 基于 protege 的本体知识表示本体作为表达知识的共享概念模型,是知识工程中的的重要组成部分。信息提取是从纯文本中自动获取知识的过程。由于书面自然语言的模糊性,信息提取是一项困难的任务。基于本体的信息提取(obie)通过以领域本体的形式包含上下文信息来降低这种复杂性。本体通过提供有关领域的概念和关系,为提取过程提供指导。本文正是使用本体构建系统 Protege 进行本体表示。在充分了解领域知识之后,人工将整理出的重要概念进行收集并整理,通过简短的自然语言表达出来,在经过该领域的专家确认之后,将下面以 AECOPD 诊断标准为基础建立的专业知识体系结构本体:

电子病历,本地网


2.2AECOPD 数据清洗2.2.1 电子病例数据来源本次研究语料数据来源于中日友好医院(简称“中日医院”),由于医院较大,年住院 10 万多人次,每年产生的电子病历数据快速增长,为了提高针对 AECOPD 的诊断准确率,我们与中日友好医院呼吸科研究中心合作,获取到 998 份电子病例记录,记录能够涵盖病人所有的记录,病史,检查等内容。并对出院诊断为慢阻肺急性加重的语料进行标注,约 200 条。所有数据均进行了脱敏处理。2.2.2 电子病例结构分析原始的数据是本地网页形式,如图 2.3 所示。首先进行网页爬虫获取对应的字段值,并存入表格中,如图 2.4 所示。

【参考文献】:
期刊论文
[1]基于结构化电子病历构建临床路径的数据利用方法探讨[J]. 刘建.  信息记录材料. 2019(02)
[2]基于支持向量机的文本分类[J]. 李芸初.  中国新技术新产品. 2019(01)
[3]首诊慢阻肺错失早期诊断时间与疾病严重程度相关[J]. 彭显如,黄敏於,赵文驱,袁亚飞,李博厚,叶艳梅,粱健鹏,朱顺芳,刘来昱,蔡绍曦,赵海金.  南方医科大学学报. 2018(12)
[4]多因素影响特征选择的短文本分类方法[J]. 李文慧,张英俊,潘理虎.  计算机系统应用. 2018(12)
[5]基于CRF和BI-LSTM的命名实体识别方法[J]. 柏兵,侯霞,石松.  北京信息科技大学学报(自然科学版). 2018(06)
[6]一种基于SVM的线性分类算法[J]. 程凤伟.  太原学院学报(自然科学版). 2018(04)
[7]基于条件随机场的地名识别[J]. 田婧,李玉森.  无线互联科技. 2018(23)
[8]中文分词技术综述[J]. 冯俐.  现代计算机(专业版). 2018(34)
[9]基于在线评论情感分析的海淘APP用户满意度研究[J]. 赵杨,李齐齐,陈雨涵,曹文航.  数据分析与知识发现. 2018(11)
[10]基于隐马尔可夫模型的中文分词[J]. 吴帅,潘海珍.  现代计算机(专业版). 2018(33)

博士论文
[1]面向小样本的文本分类模型及算法研究[D]. 刘川.电子科技大学 2017
[2]基于信息融合的中文笔迹鉴别研究[D]. 鄢煜尘.武汉大学 2009

硕士论文
[1]基于机器学习的文本分类研究与实现[D]. 王振.南京邮电大学 2018
[2]基于核学习方法的非线性系统建模与辨识研究[D]. 张观东.兰州交通大学 2018
[3]微信公众号文本的类别标注方法研究[D]. 邓罗丹.北京交通大学 2018
[4]半结构化中文简历的信息抽取[D]. 晏文坛.华南理工大学 2018
[5]基于词典与统计结合的中文分词方法研究及全文检索系统设计[D]. 周世宇.华中师范大学 2017
[6]中文电子病历命名实体识别研究[D]. 曲春燕.哈尔滨工业大学 2015
[7]基于多核融合的中文领域实体关系抽取研究[D]. 陈鹏.昆明理工大学 2014
[8]基于理解的汉语分词系统的设计与实现[D]. 苏勇.电子科技大学 2011



本文编号:2986968

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2986968.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户78bec***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com