基于词表示和深度学习的生物实体关系抽取
发布时间:2020-06-30 05:13
【摘要】:生物医学实体关系抽取是信息抽取领域中重要的研究任务之一,有助于生物医学的发展。作为关系抽取任务中的一种,细菌栖息地地理位置关系抽取致力于识别生物医学文本中细菌和栖息地或地理位置的交互关系。该任务探究了细菌的生存环境,其对于学习生物体及其生存环境之间的相互作用和关联机制十分重要,从而帮助生物学家了解细菌的分布情况和生活习性。本文基于词表示和深度学习模型对细菌栖息地地理位置关系抽取任务进行研究,提高其性能。基于深度学习方法的关键之一是词表示模型训练的词向量,词向量直接影响深度学习模型的性能。本文提出了一种面向生物医学领域的词表示模型,同时考虑了背景语料不足的情况。该词表示模型融入了生物医学和语言学信息,其中包括词性、词原形、句法块和命名实体,使得词向量包含更加丰富的语义信息。其次,利用支持向量机中的最大间隔原理解决背景语料不足的问题,使得提出的词表示模型适用于背景语料匮乏的任务的词向量训练。最后,将训练得到的词向量应用在细菌栖息地地理位置关系抽取任务上,提高系统的性能。本文提出的深度学习方法为基于注意力机制的门控循环单元神经网络模型。为了避免复杂的特征选择过程,构建双向门控循环单元神经网络学习输入信息。此外,为了使得句子中重要的词能够在句子的语义表示中占有更大的比重,采用注意力机制将深度学习模型中得到的结果赋予不同的权重。将权重与结果融合得到句子的语义表示,并利用softmax函数对句子语义表示进行分类。在使用本文提出的词表示模型训练的词向量后,该方法在细菌栖息地地理位置关系抽取任务的测试集上达到了58.21%的F值,为当前最高的结果。综上所述,本文利用深度学习方法对细菌栖息地地理位置关系抽取任务进行研究,并且加入了注意力机制,同时使用本文提出的词表示模型进一步提高结果。实验结果验证了所提出的关系抽取方法和词表示模型的有效性。
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP391.1
本文编号:2734906
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP391.1
【参考文献】
相关期刊论文 前7条
1 赵为;;俄语俚语研究举隅[J];外语学刊;2006年06期
2 孙汉军;行话研究[J];中国俄语教学;2003年02期
3 丁昕;《俄语俚语研究》评价[J];外语研究;2003年02期
4 丛亚平;论俄语俚语中的语言文化特征[J];山东外语教学;2001年04期
5 荣洁,赵为;俄语俚语:历史、研究现状、面临的任务[J];外语研究;1998年04期
6 刘兵;略谈现代俄语青年俚语中的英语借词[J];中国俄语教学;1992年03期
7 丁昕;;试论俄语俚语[J];外语研究;1988年03期
相关硕士学位论文 前7条
1 夏俊杰;俄语话语词的语用功能研究[D];黑龙江大学;2016年
2 陈雪;俄罗斯青年网络俚语研究[D];广东外语外贸大学;2015年
3 韩学力;俄罗斯现代青年俚语的语言文化学分析[D];华中师范大学;2015年
4 陈宁琴;现代俄语青年俚语研究[D];黑龙江大学;2015年
5 王晓琦;现代俄语青年俚语研究[D];吉林大学;2014年
6 汉磊;现代俄语词汇体系中的外来词研究[D];陕西师范大学;2014年
7 张宁宁;论俚语的语言和社会特征[D];山东大学;2006年
本文编号:2734906
本文链接:https://www.wllwen.com/waiyulunwen/eyulunwen/2734906.html