护理领域命名实体抽取方案研究
发布时间:2020-07-05 15:40
【摘要】:随着我国老龄化的愈发严重,老人的日常护理需求越来越多,尤其是患病后的护理。但不同情况下的老人所需的护理方法不同,某些细致的护理方法并非所有人都了解。虽然常见疾病一般都有相关的护理指南等文献资料,但当老人患有多种疾病时,就需要查阅大量的护理指南,十分费时。且有时要根据老人的实际情况,来制定专门的方案,这些特定的方案往往写在老人的病历或体检报告中,不易统计。如果能够自动地从这些自然语言文本中抽取命名实体,就能够快速、准确获得老人所需的护理措施。因此,本文研究了从自然语言文本中获取护理领域命名实体的方法,来实现老人所需护理措施的自动获取。本文主要工作如下:1)提出了一种基于条件随机场的命名实体抽取方法。为收集到的护理领域文献添加实体标签后,加入外部特征,使用条件随机场模型进行命名实体抽取。为了消除模型训练时冗余特征模板过多造成的负面影响,使用遗传算法对特征模板进行了优化,提高了命名实体抽取的准确率。最终,实体抽取的准确率达到80%。2)提出了一种基于Bi-LSTM与条件随机场相结合的命名实体抽取方法。将护理领域文献转化为字向量,再通过神经网络对句子特征进行计算,最后使用条件随机场进行实体标注。为了提高实体抽取的准确率,使用遗传算法对神经网络训练时所需的各类参数进行优化,使模型更适合文献的结构。最终,实体抽取的精确率达到85.2%,较直接进行抽取提高了3%。
【学位授予单位】:合肥工业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.1;R47
【图文】:
图 3.1 一阶链式条件随机场Fig 3.1 First-order chain conditional random field图 3.2 图结构相同的 X 和 Y 构成的一阶链式条件随机场
14图 3.2 图结构相同的 X 和 Y 构成的一阶链式条件随机场g 3.2 The first-order chain conditional random field of X and Y with the same struc其中,X n 表示输入的观察序列,Y - - -n 表示序列。条件随机场的条件概率P( )的计算,需要通过使用势函数以及图结函数是定义在变量子集上的非负实函数,作用是来定义概率分布函的是图中节点的一个特殊子集,该子集中的任意两节点间都有边连接
本文编号:2742803
【学位授予单位】:合肥工业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.1;R47
【图文】:
图 3.1 一阶链式条件随机场Fig 3.1 First-order chain conditional random field图 3.2 图结构相同的 X 和 Y 构成的一阶链式条件随机场
14图 3.2 图结构相同的 X 和 Y 构成的一阶链式条件随机场g 3.2 The first-order chain conditional random field of X and Y with the same struc其中,X n 表示输入的观察序列,Y - - -n 表示序列。条件随机场的条件概率P( )的计算,需要通过使用势函数以及图结函数是定义在变量子集上的非负实函数,作用是来定义概率分布函的是图中节点的一个特殊子集,该子集中的任意两节点间都有边连接
【参考文献】
相关期刊论文 前10条
1 邱泉清;苗夺谦;张志飞;;中文微博命名实体识别[J];计算机科学;2013年06期
2 孙镇;王惠临;;命名实体识别研究进展综述[J];现代图书情报技术;2010年06期
3 迟呈英;于长远;战学刚;;基于条件随机场的中文分词方法[J];情报杂志;2008年05期
4 陈霄;刘慧;陈玉泉;;基于支持向量机方法的中文组织机构名的识别[J];计算机应用研究;2008年02期
5 周顺先;林亚平;王耀南;易叶青;;基于聚簇隐马尔可夫模型的文本信息抽取[J];系统仿真学报;2007年21期
6 洪铭材;张阔;唐杰;李涓子;;基于条件随机场(CRFs)的中文词性标注方法[J];计算机科学;2006年10期
7 张华平,刘群;基于角色标注的中国人名自动识别研究[J];计算机学报;2004年01期
8 魏延,谢开贵;模拟退火算法[J];蒙自师范高等专科学校学报;1999年04期
9 张小衡,王玲玲;中文机构名称的识别与分析[J];中文信息学报;1997年04期
10 孙艳丰,王众托;遗传算法在优化问题中的应用研究进展[J];控制与决策;1996年04期
本文编号:2742803
本文链接:https://www.wllwen.com/linchuangyixuelunwen/2742803.html
最近更新
教材专著