基于深度学习的串联质谱蛋白质鉴定方法研究
发布时间:2023-05-20 05:28
基于串联质谱的肽鉴定是蛋白质组学的关键算法之一,而蛋白质序列数据库搜索是目前常用的肽鉴定方法。在传统的蛋白质序列数据库搜索中,通常需要先对每个肽段进行理论谱的构建,只考虑了质荷比的信息,但是与同位素峰值强度相关的信息被忽略了。近年来,随着人工智能技术的飞速发展,基于深度学习的MS/MS谱预测工具显示出了很高的准确性,在提高蛋白质序列数据库搜索的灵敏度和准确性方面具有很大的潜力。本文针对传统的蛋白质序列数据库搜索方法,通过考虑同位素峰强度相关信息对搜索流程进行优化,主要研究内容包括以下两个方面:(1)评估常用基于机器学习、深度学习的谱预测工具。利用机器学习或深度学习模型进行谱图预测是计算蛋白质组学的一种新兴方法。基于深度学习的MS/MS谱预测工具在提高data-dependent acquisition(DDA)搜索引擎的灵敏度和准确性,以及建立data-independent acquisition(DIA)分析的谱库方面具有巨大的潜力。不同的工具有其独特的算法和实现,可能会导致不同的性能。因此,有必要对这些工具进行系统的评估,以找出它们的偏好和内在差异。在本研究中,我们使用具有不同碰...
【文章页数】:73 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
注释表
第1章 引言
1.1 基于质谱的蛋白质鉴定
1.2 串联质谱数据的生成
1.3 基于串联质谱数据的肽鉴定方法
1.4 研究内容与创新点
1.5 论文的行文结构
第2章 蛋白质序列数据库搜索鉴定及深度学习知识
2.1 蛋白质序列数据库搜索鉴定流程
2.1.1 肽鉴定流程
2.1.2 谱图匹配打分
2.1.3 数据库搜索参数
2.1.4 蛋白质序列数据库
2.1.5 蛋白质序列数据库搜索鉴定结果
2.2 深度学习相关知识
2.2.1 卷积神经网络(Convolutional Neural Networks,CNN)
2.2.2 循环神经网络(Recurrent Neural Network,RNN)
2.3 本章小结
第3章 MS/MS谱预测工具的综合评估
3.1 研究背景
3.2 MS/MS谱预测方法评估方法及数据
3.2.1 用于评估的MS/MS谱预测工具
3.2.2 用于评估的公共数据集
3.2.3 公共数据集的质谱数据重分析
3.2.4 MS/MS谱预测工具的评估策略
3.2.5 MS/MS谱预测工具在CPU和 GPU上的时间比较
3.3 MS/MS谱预测工具的评估结果及讨论
3.3.1 每个数据集中MS/MS谱预测工具之间的相关性分析
3.3.2 在肽水平上MS/MS谱预测工具和真实值之间的性能评估
3.3.3 MS/MS谱预测工具在不同长度和不同电荷的肽段下与真实值之间的性能评估
3.3.4 运行时间评估
3.4 本章小结
第4章 基于深度学习的肽鉴定方法研究
4.1 工具介绍
4.1.1 pDeep2
4.1.2 DeepNovo
4.2 肽鉴定方法及数据
4.2.1 公共数据集
4.2.2 公共数据集的质谱数据重分析
4.2.3 数据处理流程
4.2.4 蛋白质序列数据库搜索鉴定流程构建
4.3 鉴定结果及讨论
4.3.1 模型训练结果
4.3.2 测试集鉴定结果
4.4 本章小结
第5章 总结与展望
5.1 主要工作、贡献与创新点
5.1.1 主要工作
5.1.2 主要贡献
5.1.3 创新性
5.2 后续研究工作
参考文献
致谢
攻读硕士学位期间从事的科研工作及取得的成果
本文编号:3820628
【文章页数】:73 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
注释表
第1章 引言
1.1 基于质谱的蛋白质鉴定
1.2 串联质谱数据的生成
1.3 基于串联质谱数据的肽鉴定方法
1.4 研究内容与创新点
1.5 论文的行文结构
第2章 蛋白质序列数据库搜索鉴定及深度学习知识
2.1 蛋白质序列数据库搜索鉴定流程
2.1.1 肽鉴定流程
2.1.2 谱图匹配打分
2.1.3 数据库搜索参数
2.1.4 蛋白质序列数据库
2.1.5 蛋白质序列数据库搜索鉴定结果
2.2 深度学习相关知识
2.2.1 卷积神经网络(Convolutional Neural Networks,CNN)
2.2.2 循环神经网络(Recurrent Neural Network,RNN)
2.3 本章小结
第3章 MS/MS谱预测工具的综合评估
3.1 研究背景
3.2 MS/MS谱预测方法评估方法及数据
3.2.1 用于评估的MS/MS谱预测工具
3.2.2 用于评估的公共数据集
3.2.3 公共数据集的质谱数据重分析
3.2.4 MS/MS谱预测工具的评估策略
3.2.5 MS/MS谱预测工具在CPU和 GPU上的时间比较
3.3 MS/MS谱预测工具的评估结果及讨论
3.3.1 每个数据集中MS/MS谱预测工具之间的相关性分析
3.3.2 在肽水平上MS/MS谱预测工具和真实值之间的性能评估
3.3.3 MS/MS谱预测工具在不同长度和不同电荷的肽段下与真实值之间的性能评估
3.3.4 运行时间评估
3.4 本章小结
第4章 基于深度学习的肽鉴定方法研究
4.1 工具介绍
4.1.1 pDeep2
4.1.2 DeepNovo
4.2 肽鉴定方法及数据
4.2.1 公共数据集
4.2.2 公共数据集的质谱数据重分析
4.2.3 数据处理流程
4.2.4 蛋白质序列数据库搜索鉴定流程构建
4.3 鉴定结果及讨论
4.3.1 模型训练结果
4.3.2 测试集鉴定结果
4.4 本章小结
第5章 总结与展望
5.1 主要工作、贡献与创新点
5.1.1 主要工作
5.1.2 主要贡献
5.1.3 创新性
5.2 后续研究工作
参考文献
致谢
攻读硕士学位期间从事的科研工作及取得的成果
本文编号:3820628
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3820628.html