基于文本关系相似性的蛋白质交互关系识别
发布时间:2021-11-11 15:07
蛋白质交互(Protein-Protein Interaction,PPI)信息是生物学研究的重要内容之一。目前通过生物学实验发现的PPI信息主要以非结构化文本的形式保存在生物文献当中,生物学家试图从这些文献中手工地识别出PPI并将其录入关系数据库,用以建立可利用的知识网络。然而随着生物学科技文献的日益激增,通过手工方式来搜集蛋白质交互信息显然难以满足实际的应用需求。因而研究如何从生物医学文献中自动识别PPI对于生物医学的发展具有重要的意义。目前PPI识别效果较好的基于机器学习的方法大多以单个句子作为识别的依据,这种方法忽略了蛋白质交互的上下文信息难以对交互特征进行全面的把握,还有就是需要对训练集句子中的每对蛋白质都进行标注,训练集的缺乏使得其难以满足PPI自动识别的要求。为了解决以上这些问题,本文则在关系相似性框架下以大规模文本为依据,首先建立了基本的关系相似性(Relational Similarity,RS)模型,实验比较了此模型下多种相似性度量策略,权值表示对识别结果的影响,最终得出了比较合理的衡量关系相似性的函数以及权重表示方法,实验结果表明以余弦距离衡量关系相似性以及二值权...
【文章来源】:南京航空航天大学江苏省 211工程院校
【文章页数】:71 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
缩略词
第一章 绪论
1.1 研究背景及意义
1.2 研究现状
1.3 本文的工作
1.4 本文的结构
第二章 相关工作
2.1 生物医学领域文本挖掘
2.1.1 有关生物医学领域文本挖掘研究的介绍
2.1.2 生物医学领域文本挖掘的研究内容
2.2 PPI识别的主要方法
2.2.1 基于同现的方法
2.2.2 基于规则或模式匹配的方法
2.2.3 基于自然语言处理的方法
2.2.4 基于机器学习的方法
2.3 本章总结
第三章 基于相似性的PPI识别
3.1 相似性的定义
3.1.1 语义相似性与语义相关性、语义距离的关系
3.1.2 相似性的直觉性定义
3.2 属性相似性
3.3 关系相似性
3.4 基于关系相似性框架的PPI识别
3.5 本章总结
第四章 基于关系相似性框架的PPI识别基本模型
4.1 关系相似性模型框架
4.2 基于关系相似性的PPI识别
4.2.1 收集关系描述
4.2.2 关系表示
4.2.3 关系相似性计算
4.2.4 近邻分类
4.3 实验设计及结果分析
4.3.1 实验数据
4.3.2 实验设置
4.3.3 实验结果及讨论
4.4 本章总结
第五章 特征单词相似性计算
5.1 单词相似性计算的相关研究
5.1.1 基于词典或语义层次的方法
5.1.2 基于语料库的方法
5.2 单词相似性模型的建立
5.2.1 目标词集合
5.2.2 数据预处理
5.2.3 单词相似性矩阵的计算
5.3 单词相似性计算结果及分析
5.4 本章总结
第六章 基于相似性混合模型的PPI识别
6.1 一种未引入单词相似性的方案
6.2 权值调整
6.2.1 基于权值调整的混合模型识别算法
6.2.2 实验结果与分析
6.3 特征聚类
6.3.1 聚类簇特征的生成
6.3.2 基于添加聚类簇特征的混合模型识别算法及评估
6.3.3 以聚类簇为特征的混合模型识别算法及评估
6.4 本章小结
第七章 总结与展望
7.1 工作总结
7.2 前景展望
参考文献
致谢
在学期间的研究成果及发表的论文
本文编号:3489073
【文章来源】:南京航空航天大学江苏省 211工程院校
【文章页数】:71 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
缩略词
第一章 绪论
1.1 研究背景及意义
1.2 研究现状
1.3 本文的工作
1.4 本文的结构
第二章 相关工作
2.1 生物医学领域文本挖掘
2.1.1 有关生物医学领域文本挖掘研究的介绍
2.1.2 生物医学领域文本挖掘的研究内容
2.2 PPI识别的主要方法
2.2.1 基于同现的方法
2.2.2 基于规则或模式匹配的方法
2.2.3 基于自然语言处理的方法
2.2.4 基于机器学习的方法
2.3 本章总结
第三章 基于相似性的PPI识别
3.1 相似性的定义
3.1.1 语义相似性与语义相关性、语义距离的关系
3.1.2 相似性的直觉性定义
3.2 属性相似性
3.3 关系相似性
3.4 基于关系相似性框架的PPI识别
3.5 本章总结
第四章 基于关系相似性框架的PPI识别基本模型
4.1 关系相似性模型框架
4.2 基于关系相似性的PPI识别
4.2.1 收集关系描述
4.2.2 关系表示
4.2.3 关系相似性计算
4.2.4 近邻分类
4.3 实验设计及结果分析
4.3.1 实验数据
4.3.2 实验设置
4.3.3 实验结果及讨论
4.4 本章总结
第五章 特征单词相似性计算
5.1 单词相似性计算的相关研究
5.1.1 基于词典或语义层次的方法
5.1.2 基于语料库的方法
5.2 单词相似性模型的建立
5.2.1 目标词集合
5.2.2 数据预处理
5.2.3 单词相似性矩阵的计算
5.3 单词相似性计算结果及分析
5.4 本章总结
第六章 基于相似性混合模型的PPI识别
6.1 一种未引入单词相似性的方案
6.2 权值调整
6.2.1 基于权值调整的混合模型识别算法
6.2.2 实验结果与分析
6.3 特征聚类
6.3.1 聚类簇特征的生成
6.3.2 基于添加聚类簇特征的混合模型识别算法及评估
6.3.3 以聚类簇为特征的混合模型识别算法及评估
6.4 本章小结
第七章 总结与展望
7.1 工作总结
7.2 前景展望
参考文献
致谢
在学期间的研究成果及发表的论文
本文编号:3489073
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3489073.html