蛋白质编码及蛋白质相互作用预测模型的研究
发布时间:2021-05-24 19:18
细胞凋亡、免疫应答和代谢途径等一系列重要生命活动,均是通过蛋白质之间的相互作用来实现的。蛋白质相互作用有利于阐明生命活动的分子机制,对疾病治疗和新药开发也具有一定的指导意义。随着后蛋白质组时代的到来,积累了海量蛋白质序列数据,如何处理这些海量的数据,如何从大量的蛋白质序列数据中挖掘出蛋白质之间内在的关系,以及如何构建蛋白质之间的相互作用网络,成为当前蛋白质组学研究中亟待解决的问题。因此,本文以蛋白质相互作用为研究目标,围绕蛋白质序列的编码方法和基于氨基酸序列的蛋白质相互作用预测模型构建及模型优化等问题开展研究工作。论文主要研究内容及结果如下:(1)为了改进蛋白质相互作用的预测性能,基于深度神经网络(Deep Neural Network,DNN)结合联合三元组(Conjoint Triads,CT)、自协方差(Auto-Covariance,AC)、局部描述符(Local Descriptor,LD)三种蛋白质编码方法,构建了 DNN-CT、DNN-AC和DNN-LD三种蛋白质相互作用预测模型,并采用dropout对三种模型的预测性能进行优化。实验结果发现:dropout将DNN-CT...
【文章来源】:中国科学技术大学安徽省 211工程院校 985工程院校
【文章页数】:127 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 选题的背景和意义
1.2 国内外研究现状
1.2.1 实验检测方法
1.2.2 计算预测方法
1.2.3 存在的问题
1.3 研究内容与创新点
1.3.1 主要研究内容
1.3.2 技术路线
1.3.3 主要创新点
1.4 论文结构安排
第2章 蛋白质相互作用预测相关技术
2.1 蛋白质相互作用的分子生物学基础
2.1.1 蛋白质相互作用类型
2.1.2 蛋白质相互作用原理
2.2 蛋白质相互作用的计算预测方法
2.2.1 基于基因组信息的方法
2.2.2 基于进化信息的方法
2.2.3 基于蛋白质结构信息的方法
2.2.4 基于氨基酸序列的方法
2.3 机器学习算法
2.3.1 深度神经网络
2.3.2 支持向量机
2.3.3 K近邻
2.3.4 随机森林
2.3.5 决策树
2.3.6 自适应提升算法
2.4 本章小结
第3章 基于深度神经网络联合多种编码方法的蛋白质相互作用预测模型
3.1 引言
3.2 数据集
3.2.1 Benchmark数据集
3.2.2 外部数据集
3.3 评价指标
3.4 蛋白质编码方法
3.4.1 联合三元组
3.4.2 自协方差
3.4.3 局部描述符
3.5 分类器
3.5.1 深度神经网络
3.5.2 深度神经网络优化技术
3.6 实验设计
3.7 实验结果
3.7.1 超参数的选择
3.7.2 在Benchmark数据集上的预测性能
3.7.3 在外部数据集预测性能
3.7.4 和现有方法的比较
3.7.5 讨论
3.8 本章小结
第4章 基于联合三元组自协方差的蛋白质编码方法
4.1 引言
4.2 数据集
4.3 评价指标
4.4 CTAC蛋白质编码方法
4.5 分类器
4.6 实验设计
4.7 实验结果
4.7.1 超参数的调整
4.7.2 CTAC的预测性能
4.7.3 CTAC在不同分类器上的预测性能
4.7.4 CTAC在外部数据集预测性能
4.7.5 CTAC在水稻数据集预测性能
4.7.6 和现有方法的比较
4.8 本章小结
第5章 基于序列矩阵的蛋白质编码方法
5.1 引言
5.2 数据集
5.2.1 Benchmark数据集
5.2.2 非冗余数据集
5.3 评价指标
5.4 序列矩阵蛋白质编码方法
5.5 分类器
5.6 实验设计
5.7 实验结果
5.7.1 超参数的选择
5.7.2 MOS在Benchmark数据集上的预测性能
5.7.3 MOS在非冗余数据集上的预测性能
5.7.4 MOS在不同分类器上的预测性能
5.7.5 和现有方法的比较
5.8 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
在读期间发表的学术论文与取得的其他研究成果
本文编号:3204722
【文章来源】:中国科学技术大学安徽省 211工程院校 985工程院校
【文章页数】:127 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 选题的背景和意义
1.2 国内外研究现状
1.2.1 实验检测方法
1.2.2 计算预测方法
1.2.3 存在的问题
1.3 研究内容与创新点
1.3.1 主要研究内容
1.3.2 技术路线
1.3.3 主要创新点
1.4 论文结构安排
第2章 蛋白质相互作用预测相关技术
2.1 蛋白质相互作用的分子生物学基础
2.1.1 蛋白质相互作用类型
2.1.2 蛋白质相互作用原理
2.2 蛋白质相互作用的计算预测方法
2.2.1 基于基因组信息的方法
2.2.2 基于进化信息的方法
2.2.3 基于蛋白质结构信息的方法
2.2.4 基于氨基酸序列的方法
2.3 机器学习算法
2.3.1 深度神经网络
2.3.2 支持向量机
2.3.3 K近邻
2.3.4 随机森林
2.3.5 决策树
2.3.6 自适应提升算法
2.4 本章小结
第3章 基于深度神经网络联合多种编码方法的蛋白质相互作用预测模型
3.1 引言
3.2 数据集
3.2.1 Benchmark数据集
3.2.2 外部数据集
3.3 评价指标
3.4 蛋白质编码方法
3.4.1 联合三元组
3.4.2 自协方差
3.4.3 局部描述符
3.5 分类器
3.5.1 深度神经网络
3.5.2 深度神经网络优化技术
3.6 实验设计
3.7 实验结果
3.7.1 超参数的选择
3.7.2 在Benchmark数据集上的预测性能
3.7.3 在外部数据集预测性能
3.7.4 和现有方法的比较
3.7.5 讨论
3.8 本章小结
第4章 基于联合三元组自协方差的蛋白质编码方法
4.1 引言
4.2 数据集
4.3 评价指标
4.4 CTAC蛋白质编码方法
4.5 分类器
4.6 实验设计
4.7 实验结果
4.7.1 超参数的调整
4.7.2 CTAC的预测性能
4.7.3 CTAC在不同分类器上的预测性能
4.7.4 CTAC在外部数据集预测性能
4.7.5 CTAC在水稻数据集预测性能
4.7.6 和现有方法的比较
4.8 本章小结
第5章 基于序列矩阵的蛋白质编码方法
5.1 引言
5.2 数据集
5.2.1 Benchmark数据集
5.2.2 非冗余数据集
5.3 评价指标
5.4 序列矩阵蛋白质编码方法
5.5 分类器
5.6 实验设计
5.7 实验结果
5.7.1 超参数的选择
5.7.2 MOS在Benchmark数据集上的预测性能
5.7.3 MOS在非冗余数据集上的预测性能
5.7.4 MOS在不同分类器上的预测性能
5.7.5 和现有方法的比较
5.8 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢
在读期间发表的学术论文与取得的其他研究成果
本文编号:3204722
本文链接:https://www.wllwen.com/projectlw/swxlw/3204722.html
教材专著