基于条件随机场的医学文本与图像标注模型构建及应用研究
本文关键词:基于条件随机场的医学文本与图像标注模型构建及应用研究,由笔耕文化传播整理发布。
【摘要】:计算机辅助医学信息处理属于计算机科学和医学的交叉研究,如何对文本与图像进行高精度标注是制约医学信息处理发展的技术难题,有效获取文本与图像的空间上下文联系能够有效解决该难题。条件随机场模型(Conditional Random Fields,CRFs)是适用于分类及标注结构化数据的概率图模型,其主要优势是可以描述大尺度空间上下文信息和直接后验概率建模,有效提高文本与图像的标注精度。 基于CRFs理论的优势,本文针对当前中文文本病历识别与医学图像标注中存在的问题,进行基于空间上下文特征的CRFs模型的研究。研究的主要内容及创新点如下: 1、针对中文文本病历的特点,提出了构建层叠CRFs模型对文本病历中的命名实体进行识别。首先在低层CRFs模型中对两类简单命名实体进行识别,即身体基本部位名称与基本疾病名称;然后将得到的标注结果传送到第二层CRFs模型,并加入一个根据文本病历特点设计的特征序列,这个自定义特征序列由词性特征和实体特征交互融合而成,在论文中我们称之为自定义组合特征。实体特征是指第一层CRFs模型的标注结果。第二层CRFs模型的输入数据不仅包含有观测序列,还包含第一层模型识别后的标注结果,这为进一步识别最终实体类别——复杂疾病名称及临床症状提供更可靠的依据。通过对在医生指导下构建的中文文本病历语料库进行多组封闭与开放测试表明,基于自定义组合特征的层叠CRFs模型比未加入自定义组合特征的层叠CRFs模型,F值提高3%,比单层CRFs模型,F值提高7%,其他各项评测指标及总体性能均有显著提高。即便是对那些训练语料中未曾出现的实体名称,也能够进行准确地识别。此外,它还有效地解决了具有嵌套构词特点的中文文本病历命名实体在标注识别中产生歧义性的问题。 2、针对骨肉瘤MRI图像的各组织之间结构复杂,提出基于CRFs模型的骨肉瘤MRI图像中多类目标分类标注方法。由于骨肉瘤MRI图像中每一个像素属于某个类别的概率不仅与其自身特征有关,还与其周围像素的信息分布紧密相关。因此在对骨肉瘤MRI各类目标(肌肉、骨组织、脂肪、肿瘤等)纹理特征建模的同时,也对能够表达各类间相互约束关系的特征进行建模。模型充分考虑各类目标的空间关系,提升特征的区分度。通过在相关图像纹理上定义纹理空间滤波器,得到更加具有区分度的纹理、形状、相对位置、上下文信息等重要特征,本文将其称之为上下文环境特征。然后采用基于这些特征的JointBoost分类器来构建CRFs模型的一元势函数,对标注样本进行训练。经过实验表明,该算法实现了骨肉瘤MRI图像中同时对多类目标进行分类标注的目标,特别是在结构不规则且多变化的肿瘤识别方面,基于上下文环境特征的CRFs模型相对完善,准确率相比现有的骨肉瘤MRI图像识别算法有提高,可作为临床借鉴。 3、针对基于CRFs模型的骨肉瘤MRI图像时间复杂度高的问题,提出基于区域CRFs模型的骨肉瘤MRI图像标注方法。该方法首先利用一种基于图结构的过分割算法将骨肉瘤MRI图像分割成若干小的均匀区域,然后将区域作为图的节点、用边连接相邻节点构建图模型。相对以像素为节点建模,该方法减少了图模型中的节点数目,减小了图的规模。实验结果表明,相比以像素为节点的方法,,基于区域的CRFs模型缩短了运行时间,并实现对骨肉瘤MRI图像中多类目标同时分类标注的目的。 本文采用的医学文本和医学图像数据来源于XX省肿瘤医院及XX大学第X医院,每组数据均经过临床医生及放射科医生的审核确认。
【关键词】:条件随机场 医学文本命名实体识别 医学图像分类标注 计算机辅助诊疗
【学位授予单位】:吉林大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:TP391.41
【目录】:
- 摘要4-6
- Abstract6-11
- 第1章 绪论11-35
- 1.1 研究目的与研究意义11
- 1.2 研究现状与存在问题11-32
- 1.2.1 序列标注方法及医学数据信息特点11-17
- 1.2.2 医学文本序列标注问题研究现状17-25
- 1.2.3 医学图像标注问题及研究现状25-31
- 1.2.4 存在的主要问题31-32
- 1.3 论文的主要研究内容32-33
- 1.4 论文章节安排33-35
- 第2章 基于层叠 CRFs 模型的文本病历命名实体识别研究35-63
- 2.1 引言35
- 2.2 文本病历及其特点35-38
- 2.3 CRFs 模型38-42
- 2.3.1 CRFs 模型的定义38-39
- 2.3.2 势函数的定义39-40
- 2.3.3 参数估计与模型求解40-42
- 2.4 层叠 CRFs 模型构建及整体框架设计42-47
- 2.4.1 层叠 CRFs 模型构建42-43
- 2.4.2 模型整体框架设计43-47
- 2.5 中文病历命名实体识别47-53
- 2.5.1 特征集的选取47-48
- 2.5.2 语料标注48-50
- 2.5.3 工具包的选取50-51
- 2.5.4 特征模板的构造51-53
- 2.6 实验结果与分析53-61
- 2.7 本章小结61-63
- 第3章 基于CRFs 的骨肉瘤MRI 图像多类目标标注研究63-85
- 3.1 引言63-66
- 3.2 基于 CRFs 模型的骨肉瘤 MRI 图像标注模型构建66-69
- 3.2.1 模型整体框架设计66-67
- 3.2.2 CRFs 模型及势函数的定义67-69
- 3.3 由 上下文环境特征‖构建的一元势函数69-73
- 3.3.1 纹理特征的获取70-71
- 3.3.2 上下文环境特征‖的获取71-73
- 3.4 CRFs 模型参数学习与求解73-75
- 3.4.1 CRFs 模型参数学习73-74
- 3.4.2 CRFs 模型求解74-75
- 3.5 实验结果与分析75-83
- 3.6 本章小结83-85
- 第4章 基于区域 CRFs 的骨肉瘤MRI 图像标注研究85-95
- 4.1 引言85-86
- 4.2 基于区域 CRFs 的骨肉瘤 MRI 图像标注模型86-93
- 4.2.1 过分割算法86-89
- 4.2.2 模型构建89-90
- 4.2.3 势函数的定义90-91
- 4.2.4 模型参数估计与推导91-92
- 4.2.5 算法流程92-93
- 4.3 实验结果与分析93-94
- 4.4 本章小结94-95
- 第5章 全文总结95-97
- 5.1 论文主要研究内容及创新性的工作95-96
- 5.2 下一步工作96-97
- 参考文献97-109
- 作者简介及在学期间所取得的科研成果109-111
- 致谢111-112
【参考文献】
中国期刊全文数据库 前10条
1 陈少卿,吴朝霞,程敬之,王臻,李松建,黄鲁豫;骨肿瘤X光图像定量分析系统的研究[J];北京生物医学工程;1998年04期
2 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
3 沈晔;李敏丹;夏顺仁;;基于内容的医学图像检索技术[J];计算机辅助设计与图形学学报;2010年04期
4 郑强;刘齐军;王正华;朱云平;;生物医学命名实体识别的研究与进展[J];计算机应用研究;2010年03期
5 林瑶;田捷;;医学图像分割方法综述[J];模式识别与人工智能;2002年02期
6 燕杨;文敦伟;王云吉;王珂;;基于层叠条件随机场的中文病历命名实体识别[J];吉林大学学报(工学版);2014年06期
7 张浩;崔雷;;生物医学文本知识发现的研究进展[J];医学信息学杂志;2008年09期
8 李超峰;刘燕;胡珊;何荣;;基于支持向量机的骨肉瘤X线图像中病变区域的自动识别研究[J];医学信息学杂志;2010年09期
9 邵虹,崔文成,张继武,赵宏;低级特征和语义特征相结合的医学图像检索方法[J];中国图象图形学报;2004年02期
10 吴士林;耿佳佳;朱枫;于泳;;基于区域的多类目标识别与分割算法研究[J];中国图象图形学报;2011年09期
中国博士学位论文全文数据库 前5条
1 汤步洲;序列标注问题的监督学习方法及应用[D];哈尔滨工业大学;2011年
2 刘军伟;基于水平集的图像分割方法研究及其在医学图像中的应用[D];中国科学技术大学;2009年
3 李博;基于LDA和LSA的医学文本和影像分析模型及应用研究[D];吉林大学;2012年
4 毛凌;基于概率图模型的场景理解方法研究[D];电子科技大学;2013年
5 徐丽;面向图像标记的条件随机场模型研究[D];长安大学;2013年
本文关键词:基于条件随机场的医学文本与图像标注模型构建及应用研究,由笔耕文化传播整理发布。
本文编号:302222
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/302222.html