基于质谱数据的完整N-糖肽鉴定方法与算法研究
发布时间:2021-05-07 15:30
糖基化是生物界中普遍存在且非常重要的蛋白质翻译后修饰之一,有研究表明真核生物中有50%以上的蛋白质含有潜在的糖基化修饰位点。随着质谱技术的发展,研究热点从糖组学的糖链结构鉴定和蛋白质组学的糖基化位点鉴定逐渐发展到糖蛋白质组学的位点特异糖链鉴定,即完整糖肽的规模化鉴定。蛋白质糖基化的修饰在蛋白质折叠、免疫、信号传导等方面有着重要的生物学功能。在实际应用中,多种疾病诊断的生物标志物和蛋白质药物是糖蛋白,更有大量具有重要和特殊功能的糖蛋白有待深入解析其糖基化修饰与疾病的相关性,因此,迫切需要研究和开发一套能够规模化解析糖蛋白结构的算法和流程。但是由于糖结构数据库的缺乏以及糖结构本身结构的复杂性,导致N-糖肽结构解析中遇到了极大的挑战,已有的方法在解决这类问题上结果并不是很理想。在此背景下,本研究以质谱数据中糖链碎片特征的关联关系为基础,利用改进的多重最小支持度关联规则挖掘构建了B离子结构数据库,并将构建好的数据库应用在完整N-糖肽鉴定流程中,取得了如下创新型成果:1.挖掘糖结构碎片之间的关联关系,构建B离子结构库。本研究针对质谱数据事务集中不同数据项的重要性和出现概率各不相同的问题,结合垂直...
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
符号对照表
缩略语对照表
第一章 绪论
1.1 研究背景
1.2 国内外研究现状
1.2.1 基于质谱技术的蛋白质鉴定研究现状
1.2.2 基于质谱技术的糖肽鉴定研究现状
1.2.3 多重最小支持度研究现状
1.3 研究内容及意义
1.4 章节安排
第二章 相关知识介绍
2.1 质谱技术介绍
2.2 N糖结构编码方式
2.2.1 糖结构编码
2.2.2 双侧外包分层编码方法
2.3 关联规则的基本概念
2.4 经典关联规则算法
2.4.1 FP-Growth算法及生成过程实例
2.4.2 Eclat算法及生成过程实例
2.5 本章小结
第三章 基于多重最小支持度关联规则挖掘算法构建B离子库
3.1 B离子结构的稀少数据项问题
3.2 基于多重最小支持度关联规则挖掘算法
3.2.1 CFP-Growth++算法
3.2.2 改进的多重最小支持度关联规则挖掘算法
3.3 质谱数据预处理
3.3.1 筛选糖肽谱图
3.3.2 母离子单同位素峰质量矫正
3.3.3 去除同位素峰簇及电荷确定
3.4 实验设计及结果分析
3.4.1 B离子关联规则挖掘实验设计
3.4.2 实验结果分析
3.5 本章小结
第四章 基于B离子库的N-糖肽鉴定方法及生物意义解释
4.1 完整N-糖肽鉴定方法
4.2 多肽序列鉴定
4.2.1 常规的多肽鉴定方法
4.2.2 改进的多肽鉴定方法
4.3 糖链组成和结构鉴定
4.3.1 N-糖链结构数据分析
4.3.2 N-糖链组成和结构鉴定流程
4.4 实验及结果分析
4.4.1 实验数据及设置
4.4.2 性能评价指标的描述
4.4.3 鉴定结果及方法比较
4.4.4 生物学意义解释
4.5 本章小结
第五章 总结与展望
5.1 工作总结
5.2 工作展望
参考文献
致谢
作者简介
【参考文献】:
期刊论文
[1]N-连接完整糖肽的质谱分析策略和研究方法[J]. 朱伯婧,智渊,孙士生. 生物化学与生物物理进展. 2017(10)
[2]糖蛋白质组学的信息学资源和方法[J]. 刘杭,姚鋆,杨芃原,张扬. 生物化学与生物物理进展. 2016(09)
[3]目标-诱饵库搜索策略在蛋白质组质谱鉴定和质控中的应用及研究进展[J]. 冯晓东,马洁,常乘,白明泽,朱云平,舒坤贤. 生物化学与生物物理进展. 2016(07)
[4]N-糖肽的规模化质谱解析方法进展[J]. 曾文锋,张扬,刘铭琪,吴建强,张晓今,杨皓,刘超,迟浩,张昆,孙瑞祥,杨芃原,贺思敏. 生物化学与生物物理进展. 2016(06)
[5]规模化蛋白质鉴定中母离子的准确检测技术研究[J]. 袁作飞,邬龙,刘超,迟浩,樊盛博,张昆,曾文锋,孙瑞祥,贺思敏. 生物化学与生物物理进展. 2013(01)
[6]负关联规则挖掘与特征词抽取融合的局部反馈查询扩展[J]. 黄名选. 计算机工程与科学. 2011(11)
[7]关于Top-N最频繁项集挖掘的研究[J]. 朱颢东,李红婵. 电子科技大学学报. 2010(05)
[8]挖掘数据流界标窗口Top-K频繁项集[J]. 杨蓓,黄厚宽. 计算机研究与发展. 2010(03)
[9]基于多支持度的挖掘加权关联规则算法[J]. 段军,戴居丰. 天津大学学报. 2006(01)
[10]多最小支持度策略的关联规则挖掘方法[J]. 王振宇,白石磊,熊范纶. 小型微型计算机系统. 2002(08)
硕士论文
[1]基于关联规则挖掘的乳腺癌致病基因筛选[D]. 张粉利.西安电子科技大学 2018
[2]蛋白质组串联质谱鉴定结果质量控制工具的评估和应用[D]. 冯晓东.重庆邮电大学 2017
[3]基于串联质谱数据的PepNovo并行化研究与实现[D]. 李林.湖南大学 2016
[4]基于多重最小支持度的髙效用频繁项集挖掘算法研究[D]. 王立俊.广西大学 2015
[5]基于滤波对角化方法提高傅立叶变换质谱数据质量[D]. 方剑委.国防科学技术大学 2013
[6]质谱数据结构化存储及压缩问题研究[D]. 马海滨.国防科学技术大学 2010
本文编号:3173636
【文章来源】:西安电子科技大学陕西省 211工程院校 教育部直属院校
【文章页数】:78 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
符号对照表
缩略语对照表
第一章 绪论
1.1 研究背景
1.2 国内外研究现状
1.2.1 基于质谱技术的蛋白质鉴定研究现状
1.2.2 基于质谱技术的糖肽鉴定研究现状
1.2.3 多重最小支持度研究现状
1.3 研究内容及意义
1.4 章节安排
第二章 相关知识介绍
2.1 质谱技术介绍
2.2 N糖结构编码方式
2.2.1 糖结构编码
2.2.2 双侧外包分层编码方法
2.3 关联规则的基本概念
2.4 经典关联规则算法
2.4.1 FP-Growth算法及生成过程实例
2.4.2 Eclat算法及生成过程实例
2.5 本章小结
第三章 基于多重最小支持度关联规则挖掘算法构建B离子库
3.1 B离子结构的稀少数据项问题
3.2 基于多重最小支持度关联规则挖掘算法
3.2.1 CFP-Growth++算法
3.2.2 改进的多重最小支持度关联规则挖掘算法
3.3 质谱数据预处理
3.3.1 筛选糖肽谱图
3.3.2 母离子单同位素峰质量矫正
3.3.3 去除同位素峰簇及电荷确定
3.4 实验设计及结果分析
3.4.1 B离子关联规则挖掘实验设计
3.4.2 实验结果分析
3.5 本章小结
第四章 基于B离子库的N-糖肽鉴定方法及生物意义解释
4.1 完整N-糖肽鉴定方法
4.2 多肽序列鉴定
4.2.1 常规的多肽鉴定方法
4.2.2 改进的多肽鉴定方法
4.3 糖链组成和结构鉴定
4.3.1 N-糖链结构数据分析
4.3.2 N-糖链组成和结构鉴定流程
4.4 实验及结果分析
4.4.1 实验数据及设置
4.4.2 性能评价指标的描述
4.4.3 鉴定结果及方法比较
4.4.4 生物学意义解释
4.5 本章小结
第五章 总结与展望
5.1 工作总结
5.2 工作展望
参考文献
致谢
作者简介
【参考文献】:
期刊论文
[1]N-连接完整糖肽的质谱分析策略和研究方法[J]. 朱伯婧,智渊,孙士生. 生物化学与生物物理进展. 2017(10)
[2]糖蛋白质组学的信息学资源和方法[J]. 刘杭,姚鋆,杨芃原,张扬. 生物化学与生物物理进展. 2016(09)
[3]目标-诱饵库搜索策略在蛋白质组质谱鉴定和质控中的应用及研究进展[J]. 冯晓东,马洁,常乘,白明泽,朱云平,舒坤贤. 生物化学与生物物理进展. 2016(07)
[4]N-糖肽的规模化质谱解析方法进展[J]. 曾文锋,张扬,刘铭琪,吴建强,张晓今,杨皓,刘超,迟浩,张昆,孙瑞祥,杨芃原,贺思敏. 生物化学与生物物理进展. 2016(06)
[5]规模化蛋白质鉴定中母离子的准确检测技术研究[J]. 袁作飞,邬龙,刘超,迟浩,樊盛博,张昆,曾文锋,孙瑞祥,贺思敏. 生物化学与生物物理进展. 2013(01)
[6]负关联规则挖掘与特征词抽取融合的局部反馈查询扩展[J]. 黄名选. 计算机工程与科学. 2011(11)
[7]关于Top-N最频繁项集挖掘的研究[J]. 朱颢东,李红婵. 电子科技大学学报. 2010(05)
[8]挖掘数据流界标窗口Top-K频繁项集[J]. 杨蓓,黄厚宽. 计算机研究与发展. 2010(03)
[9]基于多支持度的挖掘加权关联规则算法[J]. 段军,戴居丰. 天津大学学报. 2006(01)
[10]多最小支持度策略的关联规则挖掘方法[J]. 王振宇,白石磊,熊范纶. 小型微型计算机系统. 2002(08)
硕士论文
[1]基于关联规则挖掘的乳腺癌致病基因筛选[D]. 张粉利.西安电子科技大学 2018
[2]蛋白质组串联质谱鉴定结果质量控制工具的评估和应用[D]. 冯晓东.重庆邮电大学 2017
[3]基于串联质谱数据的PepNovo并行化研究与实现[D]. 李林.湖南大学 2016
[4]基于多重最小支持度的髙效用频繁项集挖掘算法研究[D]. 王立俊.广西大学 2015
[5]基于滤波对角化方法提高傅立叶变换质谱数据质量[D]. 方剑委.国防科学技术大学 2013
[6]质谱数据结构化存储及压缩问题研究[D]. 马海滨.国防科学技术大学 2010
本文编号:3173636
本文链接:https://www.wllwen.com/projectlw/swxlw/3173636.html
教材专著