基于深度学习的医疗文本信息抽取
发布时间:2024-05-10 23:00
医疗文本的信息抽取是医疗领域自然语言处理研究中重要的一环。其目的是从电子化的医疗文本中,挖掘有价值的信息,并进行提取和分析,以帮助医生或患者分析病情,实现医疗智能化。随着人民的生活水平提高,对身体健康的关注日益加强,发展医疗信息化、将大量的医疗文本通过自然语言处理技术转化为医疗知识是一份十分重要的工作。然而,如何对中文文本使用自然语言处理技术进行信息抽取,具有以下几个问题:(一)由于中文的汉字和词语都具有语义,这不同于英文等以单词为最小语言单位的语言,在中文自然语言处理时,不同场景下,对中文的表征有不同需求,有的场景需要用字作为基本单位,有的场景需要以词语作为基本单位。因此,在文本信息抽取任务中,需要一个鲁棒性好,适应性强的中文分词算法。(二)在医疗文本中,包含了如“疾病名称”、“发病部位”、“症状”、“药品名称”和“治疗手段”等大量有价值的信息,这是医疗文本信息抽取的主要内容。由于医疗文本多为描述复杂的非结构化自由文本,且具有很多专业领域的描述方式,如何准确的提取上述信息,是医疗文本信息抽取的难点和关键点。(三)仅仅识别医疗文本中的实体,还不足以满足医疗文本信息抽取这一需求。实体的属...
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
本文编号:3969143
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
图1.2本文工作内容
杭州师范大学硕士学位论文绪论自然语言处理的基本任务,针对医疗文本的自然语言处理也叫医疗语言处理(MedicalLanguageProcessing,MLP)[17],该任务大致可分为两个部分。第一部分是基础研究,该部分主要涉及到自然语言处理的基本问题,如中文分词、命名实体识别....
图2.1简单的前馈神经网络结构
DeepLearning,DL)是机器学习的一种方法,是euralNetwork,ANN)为基本架构,对数据进行特,它大量借鉴了人们关于人脑、统计学和应用数更加强大的计算机、海量的数据和更深层的神经及程度和实用性都有巨大的发展。本节将对深度网络络(FeedforwardNeu....
图2.2sigmoid函数图像
换(affinetransformation),多层神经网络的仿射变换的叠加。而激活函数的作用是在每一个仿射变换后引入非线性变换网络输出值应用非线性函数改变其值(这一过程称为激活)下一层的输入。的激活函数有Sigmoid、ReLU、Tanh等。oid函数oid函数可以将变....
图2.3ReLU函数图像
图2.3ReLU函数图像采用ReLU激活函数的神经元只需要进行加法、乘法和大小比较操作更加高效。另外,在优化方面,ReLU激活函数为左饱和函数,且在数为1,相对于sigmoid型函数的两端饱和,ReLU函数在一定程度上经网络中可能会出现的梯度消失问题,并加速反....
本文编号:3969143
本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/3969143.html