当前位置:主页 > 理工论文 > 生物学论文 >

基于局部和全局上下文的蛋白质交互关系识别

发布时间:2020-08-27 19:53
【摘要】:蛋白质交互(Protein-Protein Interaction,PPI)作为生物医学领域一项重要的研究课题,在发现疾病,探究生命规律方面有重要的应用价值。随着互联网的快速发展,生物医学文献呈指数级增长。依靠人工阅读的方式,从海量非结构化的文本中获取PPI的有效信息很难满足实际需求。因此,如何设计算法从大量文本资源中准确提取信息,实现自动化PPI信息抽取的这个问题亟待解决。目前蛋白质交互关系识别主要采用基于单句和基于大规模文本两种方式。基于单句的蛋白质交互关系抽取,只依赖单个句子,很难掌握目标蛋白质对的全面描述信息。基于大规模文本的交互关系抽取,虽然获取了目标蛋白质对更全面的信息进行PPI判断,但是对于有交互的蛋白质对下会有一些句子没有表达蛋白质之间的交互关系,将所有句子同等看待,会抽取出一些无效的特征,从而影响识别的精度。针对两者各自存在的缺陷,本文首先建立了基于双层逻辑回归分类器框架的基本模型,利用多实例多标记学习关系抽取框架来对目标蛋白质对进行表示,充分结合了蛋白质对的局部信息和全局上下文信息。利用训练后的分类器在测试数据集上进行预测,结果表明,本文的模型取得了较好的识别性能。接下来本文主要从单句级和蛋白质对级两个层面对基本模型进行改进,设计了基于多层次线索的PPI识别改进模型。对于包含核心词的蛋白质对,利用句子重要性、句子相似性以及关键词集等概念对包含核心词集的蛋白质对从蛋白质对级上抽取额外的特征进行特征改进。和基本模型相比,有交互蛋白质对的F1度量最高提高了2.8%,无交互蛋白质对的F1度量最高提高了1.9%。对于无核心词的蛋白质对,观察到有交互的蛋白质之间单词数量明显少于无交互的蛋白质,因此采用图模型来对每一个蛋白质对进行建模,利用不同句子中单词之间以及单词和关键词之间的相似性来构建边。对于最终得到的图模型,利用图的相关属性抽取有效线索来对句子级分类器特征进行更丰富的展示。相较于基本模型,有交互蛋白质对F1度量提高了2.9%,无交互蛋白质对提高了2.5%。整体来说,该改进模型的抽取性能有明显提升,并且抽取结果更加稳定。
【学位授予单位】:南京航空航天大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:Q51;TP391.1

【相似文献】

相关期刊论文 前10条

1 徐爱国;;法律与文明的交互关系论[J];民主与科学;2019年02期

2 赵文聘;;我国社会事业同心圆中互补型交互关系营造[J];上海师范大学学报(哲学社会科学版);2019年06期

3 巩淼森;杨梓;郑彬彬;张雳;;社区营造中的共创机制与交互关系[J];中国艺术;2019年04期

4 韩莉;;思想政治教育主体间交互关系的内涵界定及意义[J];黑龙江教育学院学报;2015年11期

5 李宜川;常景芝;沈永杰;刘国玲;胡灵卫;芦琨;;网络教育环境中师生交互关系的探讨[J];西北医学教育;2010年04期

6 刘茜萍;窦万春;蔡士杰;唐加山;;针对交互关系模型优化的协作式问题分配[J];电子学报;2007年02期

7 李丽双;郭瑞;黄德根;周惠巍;;基于迁移学习的蛋白质交互关系抽取[J];中文信息学报;2016年02期

8 排日代姆·艾合麦提;;汉语交互关系的判定标准及典型性探讨[J];青春岁月;2019年07期

9 余冰;;国家与社会交互关系:社区及其组织研究的一种路径[J];学术研究;2007年05期

10 江大红;;漫话幸福生活[J];决策与信息;2012年07期

相关会议论文 前1条

1 高湘泽;;人与人之间的交互关系何以可能和可知?——让-保罗·萨特的有关思想略论[A];人学与现代化——全国第六届人学研讨会论文集[C];2004年

相关重要报纸文章 前3条

1 北京大学法学院教授 徐爱国;司法与媒体的交互关系[N];人民法院报;2013年

2 ;《创造网络经济价值》[N];中国计算机报;2001年

3 邹华;北京审美文化的历史融合[N];光明日报;2014年

相关博士学位论文 前4条

1 周瑜胜;公司控制权、流动性与并购绩效研究[D];华南理工大学;2015年

2 王洪羿;基于空间与行为交互关系的机构型养老建筑设计策略研究[D];大连理工大学;2017年

3 张旺勋;基于复杂交互网络的武器装备体系安全性分析方法[D];国防科学技术大学;2015年

4 李凯;交通犯罪的刑法规制[D];西南财经大学;2013年

相关硕士学位论文 前10条

1 蔡松成;基于局部和全局上下文的蛋白质交互关系识别[D];南京航空航天大学;2019年

2 庞新哲;微生物交互关系挖掘中的路径提取算法研究[D];华中师范大学;2019年

3 闵庆凯;基于远监督的蛋白质交互关系抽取[D];南京航空航天大学;2018年

4 邹昊;基于支持向量机的基因-基因交互关系识别方法研究[D];西北农林科技大学;2017年

5 张盼盼;基于篇章的蛋白质交互关系抽取[D];大连理工大学;2014年

6 平金玉;基于组合核与主动学习的蛋白质交互关系抽取[D];大连理工大学;2010年

7 郭瑞;基于迁移学习和词表示的蛋白质交互关系抽取[D];大连理工大学;2015年

8 封二英;基于大规模文本的蛋白质交互关系自动提取研究[D];南京航空航天大学;2012年

9 李婷;产品与服务之间的交互关系对制造企业竞争优势的影响研究[D];中原工学院;2015年

10 刘洋;基于组合核函数的蛋白质交互关系抽取[D];大连理工大学;2013年



本文编号:2806544

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/2806544.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2a45a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com