基于机器学习的医疗文本分析挖掘技术研究
发布时间:2022-01-11 06:08
随着医疗行业信息技术的引入,该行业的信息化和自动化水准不断提高。医学文本信息处理技术正逐渐成为一个新的研究热点。医疗文本,以电子病历为代表,包含了大量丰富的医疗信息,是进行疾病预测、个性化信息推荐、临床决策支持、用药模式挖掘等的重要资源,并且可以以此为基础进行医院机构服务价值的衡量。医学文本中尽管蕴藏着丰富的医疗知识,但处理起来也更加困难。由于以电子病历为主的医疗文本中包括大量非结构化的自由文本以及图像影像信息,且医生自行录入可能导致文本的拼写错误、医学名词简写以及不同医生不同地区的惯用语,电子病历中所包含的医疗信息还不能被计算机有效利用。因此,机器学习和自然语言处理相关技术将在医学文本的分析和挖掘中发挥重要作用。为了更好地探索和利用医学文本,特别是电子病历的半结构化和非结构化信息,对其中非结构化自由文本进行标准化和结构化非常的重要,而医疗信息对时间特征具有较高的敏感性,使得时间信息也成为了更好分析医疗文本必不可少的因素。传统的文本分类需要先进行一系列预处理和特征工程的建模,在医疗文本中存在大量的专业术语和知识、不准确的分词或难以理解的语义特征会影响分类的正确性。医疗文本被分析处理,最...
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:124 页
【学位级别】:博士
【部分图文】:
论文组织结构
神经网络己经从简单的架构发展到了结构越来越复杂。最初,神经网络只有输??入和输出层,称为单层神经网络,但由于其结构简单,只能用于解决线性分类问题。??通过添加更多的层,形成了由输入层,隐藏层和输出层组成的多层神经网络。非线??性前馈神经网络,可以在实数空间近似任何连续函数。??一般来说隐藏层大于2的神经网络就叫做深度神经网络,深度学习就是采用??像深度神经网络这种深层架构的一种机器学习方法。深层网络可以用少得多的神??经元去拟合同样的函数,其表达能力更强,且更能省资源。??此时的人工神经网络虽然也称为多层感知器,但实际上是一个只有一个隐藏??层节点的浅层模型。??目前,大多数分类,回归和其他学习方法都是浅层结构算法。复杂分类问题的??泛化能力有限。深度学习可以通过表征深度非线性网络结构和表征输入数据的分??布式表示来实现复杂的函数逼近。它还展示了从小样本集中学习数据集基本特征??的强大能力。(多层的好处是您可以用更少的参数表示复杂的功能)。??深度学习架构主要可分为如下3类:1)生成式深度架构(Generative?deep??
2.2.2卷积神经网络??卷积神经网络被设计用于处理多维阵列数据,例如具有3个颜色通道和3个??像素值2-D图像的彩色图像。许多数据形式都是这样的多维数组:1D用于指示??信号和序列包括语言,2D用于表示图像或声音,3D用于表示具有声音的视频或图??像。卷积神经网络使用四个关键概念来利用自然信号的特性:本地连接,权重共享,??池化以及多个网络层的使用。??1959年,Hubei和Wiesel通过猫视觉皮层细胞的研究提出了感受野的概念181]。??1982年,日本学者福岛提出了一种基于感受野概念的新认识[85],它试图对视觉系??统进行建模,即使物体移位或轻微变形。'??一个典型的卷积神经网络结构如图2-3是由一系列的过程组成的。前几个阶??段由卷积层和汇集层组成,卷积层的单元组织在特征映射中。在特征映射中,每个??单元通过一组称为过滤器的权重连接到前一层的特征映射的部分块。然后将该局??部加权和传递给非线性函数,例如ReLU。一个要素图中的所有单元格都享有相同??的过滤器,不同图层的要素图使用不同的过滤器。使用这种结构出于两方面的原??因。
【参考文献】:
期刊论文
[1]基于电子病历的胃癌治疗方案辅助选择[J]. 夏冬,李国垒,陈先来. 中华医学图书情报杂志. 2018(02)
[2]一种面向突发事件的文本语料自动标注方法[J]. 刘炜,王旭,张雨嘉,刘宗田. 中文信息学报. 2017(02)
[3]大规模情感词典的构建及其在情感分类中的应用[J]. 赵妍妍,秦兵,石秋慧,刘挺. 中文信息学报. 2017(02)
[4]基于改进的卷积神经网络的中文情感分类[J]. 张绮琦,张树群,雷兆宜. 计算机工程与应用. 2017(22)
[5]中文病历文本分词方法研究[J]. 李国垒,陈先来,夏冬,杨荣. 中国生物医学工程学报. 2016(04)
[6]基于长短期记忆多维主题情感倾向性分析模型[J]. 滕飞,郑超美,李文. 计算机应用. 2016(08)
[7]基于混合策略的公众健康领域新词识别方法研究[J]. 侯丽,李姣,侯震,陈松景. 图书情报工作. 2015(23)
[8]基于卷积神经网络的微博情感倾向性分析[J]. 刘龙飞,杨亮,张绍武,林鸿飞. 中文信息学报. 2015(06)
[9]基于极性转移和LSTM递归网络的情感分析[J]. 梁军,柴玉梅,原慧斌,高明磊,昝红英. 中文信息学报. 2015(05)
[10]中英命名实体识别及对齐中的中文分词优化[J]. 尹存燕,黄书剑,戴新宇,陈家骏. 电子学报. 2015(08)
博士论文
[1]基于深度学习的文本表示与分类方法研究[D]. 闫琰.北京科技大学 2016
[2]基于深度学习的短文本分析与计算方法研究[D]. 李岩.北京科技大学 2016
[3]文本分类关键技术及应用研究[D]. 凤丽洲.吉林大学 2015
硕士论文
[1]基于医学语言处理的面向任务的信息提取框架构建及应用[D]. 葛彩霞.浙江大学 2015
[2]面向文本分类的特征提取算法研究[D]. 彭君睿.北京邮电大学 2014
[3]中文病历文本的时间信息提取研究[D]. 周小甲.浙江大学 2011
[4]电子病历的时态数据研究[D]. 张洁.中南大学 2008
[5]中文Web文本分类技术研究[D]. 曹勇.厦门大学 2007
本文编号:3582245
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:124 页
【学位级别】:博士
【部分图文】:
论文组织结构
神经网络己经从简单的架构发展到了结构越来越复杂。最初,神经网络只有输??入和输出层,称为单层神经网络,但由于其结构简单,只能用于解决线性分类问题。??通过添加更多的层,形成了由输入层,隐藏层和输出层组成的多层神经网络。非线??性前馈神经网络,可以在实数空间近似任何连续函数。??一般来说隐藏层大于2的神经网络就叫做深度神经网络,深度学习就是采用??像深度神经网络这种深层架构的一种机器学习方法。深层网络可以用少得多的神??经元去拟合同样的函数,其表达能力更强,且更能省资源。??此时的人工神经网络虽然也称为多层感知器,但实际上是一个只有一个隐藏??层节点的浅层模型。??目前,大多数分类,回归和其他学习方法都是浅层结构算法。复杂分类问题的??泛化能力有限。深度学习可以通过表征深度非线性网络结构和表征输入数据的分??布式表示来实现复杂的函数逼近。它还展示了从小样本集中学习数据集基本特征??的强大能力。(多层的好处是您可以用更少的参数表示复杂的功能)。??深度学习架构主要可分为如下3类:1)生成式深度架构(Generative?deep??
2.2.2卷积神经网络??卷积神经网络被设计用于处理多维阵列数据,例如具有3个颜色通道和3个??像素值2-D图像的彩色图像。许多数据形式都是这样的多维数组:1D用于指示??信号和序列包括语言,2D用于表示图像或声音,3D用于表示具有声音的视频或图??像。卷积神经网络使用四个关键概念来利用自然信号的特性:本地连接,权重共享,??池化以及多个网络层的使用。??1959年,Hubei和Wiesel通过猫视觉皮层细胞的研究提出了感受野的概念181]。??1982年,日本学者福岛提出了一种基于感受野概念的新认识[85],它试图对视觉系??统进行建模,即使物体移位或轻微变形。'??一个典型的卷积神经网络结构如图2-3是由一系列的过程组成的。前几个阶??段由卷积层和汇集层组成,卷积层的单元组织在特征映射中。在特征映射中,每个??单元通过一组称为过滤器的权重连接到前一层的特征映射的部分块。然后将该局??部加权和传递给非线性函数,例如ReLU。一个要素图中的所有单元格都享有相同??的过滤器,不同图层的要素图使用不同的过滤器。使用这种结构出于两方面的原??因。
【参考文献】:
期刊论文
[1]基于电子病历的胃癌治疗方案辅助选择[J]. 夏冬,李国垒,陈先来. 中华医学图书情报杂志. 2018(02)
[2]一种面向突发事件的文本语料自动标注方法[J]. 刘炜,王旭,张雨嘉,刘宗田. 中文信息学报. 2017(02)
[3]大规模情感词典的构建及其在情感分类中的应用[J]. 赵妍妍,秦兵,石秋慧,刘挺. 中文信息学报. 2017(02)
[4]基于改进的卷积神经网络的中文情感分类[J]. 张绮琦,张树群,雷兆宜. 计算机工程与应用. 2017(22)
[5]中文病历文本分词方法研究[J]. 李国垒,陈先来,夏冬,杨荣. 中国生物医学工程学报. 2016(04)
[6]基于长短期记忆多维主题情感倾向性分析模型[J]. 滕飞,郑超美,李文. 计算机应用. 2016(08)
[7]基于混合策略的公众健康领域新词识别方法研究[J]. 侯丽,李姣,侯震,陈松景. 图书情报工作. 2015(23)
[8]基于卷积神经网络的微博情感倾向性分析[J]. 刘龙飞,杨亮,张绍武,林鸿飞. 中文信息学报. 2015(06)
[9]基于极性转移和LSTM递归网络的情感分析[J]. 梁军,柴玉梅,原慧斌,高明磊,昝红英. 中文信息学报. 2015(05)
[10]中英命名实体识别及对齐中的中文分词优化[J]. 尹存燕,黄书剑,戴新宇,陈家骏. 电子学报. 2015(08)
博士论文
[1]基于深度学习的文本表示与分类方法研究[D]. 闫琰.北京科技大学 2016
[2]基于深度学习的短文本分析与计算方法研究[D]. 李岩.北京科技大学 2016
[3]文本分类关键技术及应用研究[D]. 凤丽洲.吉林大学 2015
硕士论文
[1]基于医学语言处理的面向任务的信息提取框架构建及应用[D]. 葛彩霞.浙江大学 2015
[2]面向文本分类的特征提取算法研究[D]. 彭君睿.北京邮电大学 2014
[3]中文病历文本的时间信息提取研究[D]. 周小甲.浙江大学 2011
[4]电子病历的时态数据研究[D]. 张洁.中南大学 2008
[5]中文Web文本分类技术研究[D]. 曹勇.厦门大学 2007
本文编号:3582245
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3582245.html