面向中文医疗文本的信息抽取技术研究
发布时间:2021-08-10 01:28
随着医疗信息化进程的推进,中文电子病历的数量也在不断增加。电子病历包含了丰富的医疗领域知识,对于医疗健康服务的信息化、智能化发展有着重要的意义。电子病历包含了病人就诊过程中产生的各种诊疗信息,有效的挖掘并利用其中的医疗知识对于医疗事业的健康发展有着积极的意义。不同于通用领域的信息抽取,中文电子病历固有的很多特点,使得对于中文电子病历的信息抽取面临一定的难度。本课题在充分调研通用领域信息抽取的基础上,对中文医疗领域的信息抽取任务展开了以下研究:首先,传统的命名实体识别方法需要人工构造大量的特征,针对这一问题,本文设计了基于字标注的医疗命名实体识别算法,通过在词向量表征中添加词性、词典等特征,以丰富原有字向量的表示,并在BiLSTM的输出层后加入CRF层,来学习标签之间的依赖关系。在自建数据集上的实验结果表明,本文提出的基于字标注的BiLSTM-CRF方法,能够有效学习句子的表征,提升医疗实体识别的效果。其次,针对医疗实体关系类别较多,受限于有限的标注数据,提出一种基于特征融合的方法,首先提取句子的词法特征和句法特征作为基本特征,通过支持向量机模型构建多个分类器预测医疗实体的关系类别。并根...
【文章来源】:北京工业大学北京市 211工程院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
典型的感知器网络模型结构图
图 2-2 多层感知器网络模型结构图Figure 2-2 Structure of Multilayer Perceptor Network Mod感知机还引入了新的激活函数,常见的有 sigmo(公式 2-3)等。单层感知器仅能学习线性函数,进行学习。( )11xsigmoid xe = tanh( )x xx xe exe e = 数也称为 Logistic 函数,取值范围为(0,1)之间于输入的归一化。图 2-3 为 sigmoid 函数的图像较强,但是它的缺点在于软饱和性,反向传播的,所以一般用作二分类问题或者作为输出层的激 函数的变形,取值范围在(-1,1)之间,实际应
图 2-2 多层感知器网络模型结构图Figure 2-2 Structure of Multilayer Perceptor Network Model多层感知机还引入了新的激活函数,常见的有 sigmoid 函 函数(公式 2-3)等。单层感知器仅能学习线性函数,而多函数进行学习。( )11xsigmoid xe = tanh( )x xx xe exe e = id 函数也称为 Logistic 函数,取值范围为(0,1)之间,可或用于输入的归一化。图 2-3 为 sigmoid 函数的图像。sig性也较强,但是它的缺点在于软饱和性,反向传播的过程情况,所以一般用作二分类问题或者作为输出层的激活函moid 函数的变形,取值范围在(-1,1)之间,实际应用中
本文编号:3333179
【文章来源】:北京工业大学北京市 211工程院校
【文章页数】:73 页
【学位级别】:硕士
【部分图文】:
典型的感知器网络模型结构图
图 2-2 多层感知器网络模型结构图Figure 2-2 Structure of Multilayer Perceptor Network Mod感知机还引入了新的激活函数,常见的有 sigmo(公式 2-3)等。单层感知器仅能学习线性函数,进行学习。( )11xsigmoid xe = tanh( )x xx xe exe e = 数也称为 Logistic 函数,取值范围为(0,1)之间于输入的归一化。图 2-3 为 sigmoid 函数的图像较强,但是它的缺点在于软饱和性,反向传播的,所以一般用作二分类问题或者作为输出层的激 函数的变形,取值范围在(-1,1)之间,实际应
图 2-2 多层感知器网络模型结构图Figure 2-2 Structure of Multilayer Perceptor Network Model多层感知机还引入了新的激活函数,常见的有 sigmoid 函 函数(公式 2-3)等。单层感知器仅能学习线性函数,而多函数进行学习。( )11xsigmoid xe = tanh( )x xx xe exe e = id 函数也称为 Logistic 函数,取值范围为(0,1)之间,可或用于输入的归一化。图 2-3 为 sigmoid 函数的图像。sig性也较强,但是它的缺点在于软饱和性,反向传播的过程情况,所以一般用作二分类问题或者作为输出层的激活函moid 函数的变形,取值范围在(-1,1)之间,实际应用中
本文编号:3333179
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3333179.html
最近更新
教材专著