基于大规模质谱数据在人类蛋白质水平研究变异位点
本文关键词:基于大规模质谱数据在人类蛋白质水平研究变异位点
更多相关文章: 鸟枪法蛋白质组学 人类蛋白质变异数据库 单氨基酸多态性 功能分析
【摘要】:人类在基因组水平的变异,如基因突变和单核苷酸多态性(SNPs)已经证明了同表型变异包括疾病具有很强的相关性。高通量技术的应用已经确定人类基因组有数以百万计的遗传变异,编码区的变异有可能会影响其相对应氨基酸变化,此发生在氨基酸水平上的变异叫做单氨基酸多态性(SAPs)。虽然已有部分研究进行SAPs的全局识别,但只有很少的SAP被发现,这是由于质谱实验自身存在覆盖率低的缺陷并且鸟枪法蛋白质组学分析依赖于蛋白质参考变异数据库,而目前尚且不存在一个全面的人类蛋白质变异数据库。本篇文章中,我们首先构建了一个全面的人类变异数据库,数据是从八个相关数据库中收集来的,包括NCBI的dbSNP数据库,Ensembl变异数据库,癌症体细胞突变数据库(COSMIC), UniProt变异数据库,蛋白质突变数据库(PMD),HPMD(人类蛋白质突变数据库),数据库MSIPI和数据库MS-CanProVar;然后提出了一个基于大规模鸟枪法蛋白质组学质谱实验数据(11,113组实验)进行变异肽段以及相关蛋白质鉴定的工作流。通过上述方法分析,进行严格质控后我们检测到了24,358个变异肽(包括29,431个nsSNPs肽段以及24,813个突变肽段),映射到8,505个基因,提高了质谱实验谱图鉴定率。我们还构建了一个动态网站,存储我们鉴定到的所有变异以及其相关信息,并且对其谱图进行了相关展示,使读者可以直观了解此变异发生位点以及质量变化等多方面信息。对结果进行进一步分析发现,不同组织间变异差距较大,但存在一些共性变异,在较多组织中出现。我们同样发现芳香族氨基酸不易发生突变,这也与其结构稳定性相吻合。对于特异发生在癌症细胞系中的变异进行功能分析(GO和KEGG Pathway),也发现发生变异的蛋白质都富集到一些重要的通路中,表明蛋白质变异同表型变异包括癌症息息相关。我相信我们的蛋白变异数据库会为日后蛋白质水平变异检测提供丰富的资源。
【关键词】:鸟枪法蛋白质组学 人类蛋白质变异数据库 单氨基酸多态性 功能分析
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:R3416
【目录】:
- 论文摘要6-7
- ABSTRACT7-11
- 第1章 研究背景与方法11-20
- 1.1 鸟枪法蛋白质组学11-14
- 1.2 生物质谱技术14-16
- 1.2.1 串联质谱14-16
- 1.3 单点氨基酸多态性(SAP)16-18
- 1.4 本文研究内容18-20
- 第2章 人类蛋白质变异数据库构建20-27
- 2.1 SNP数据库20-21
- 2.1.1 dbSNP数据库20
- 2.1.2 Ensembl变异数据库20-21
- 2.2 突变数据库21-24
- 2.2.1 MS-CanProVar数据库21-22
- 2.2.2 癌症体细胞突变数据库(COSMIC)22
- 2.2.3 人类蛋白质突变数据库(HPMD)22-23
- 2.2.4 在线人类孟德尔遗传数据库(OMIM)23
- 2.2.5 MSIPI数据库23
- 2.2.6 蛋白质突变数据库(PMD)23-24
- 2.2.7 UniProt变异数据库24
- 2.3 ANNOVAR注释24-25
- 2.4 人类变异参考数据库构建25-27
- 第3章 材料与方法27-39
- 3.1 人类蛋白质组学数据收集27-28
- 3.2 蛋白质定性分析28-31
- 3.2.1 TPP28-30
- 3.2.2 并行化程序开发与优化30
- 3.2.3 高通量自动化蛋白质组学并行分析平台构建30-31
- 3.3 SAP蛋白鉴定31-34
- 3.3.1 鸟枪法蛋白质鉴定的质量控制31-32
- 3.3.2 蛋白质翻译后修饰(PTM)32
- 3.3.3 SAP蛋白鉴定结果质量控制流程32-34
- 3.4 SAP蛋白功能分析34-37
- 3.4.1 Gene Ontology34
- 3.4.2 KEGG34-35
- 3.4.3 DAVID35-36
- 3.4.4 GO分析和KEGG分析流程36-37
- 3.5 dbSAP建立37-39
- 第4章 鉴定结果39-47
- 4.1 变异肽段的鉴定39-42
- 4.2 翻译后修饰-磷酸化影响42-43
- 4.3 谱图鉴定率增加43-44
- 4.4 功能富集分析44-45
- 4.5 dbSAP网站数据导入45-47
- 第5章 总结和展望47-49
- 附录一49-53
- R脚本49-50
- Python脚本50-53
- 附录二53-56
- 附录三56-58
- 附件四58-60
- 附录五60-61
- 参考文献61-66
- 后记66-67
【相似文献】
中国期刊全文数据库 前10条
1 曾再新;价廉物美的营养饮料——豆浆[J];新疆农业科技;1993年06期
2 袁从愿;吴他山;;凝集素及其在临床上的应用[J];生化药物杂志;1987年02期
3 ;适当吃鱼好处多[J];肝博士;2008年01期
4 一才;烟叶也能救人命[J];中华养生保健;2004年02期
5 施建科,叶蕴华,田桂玲;有甜味的蛋白质[J];化学通报;1998年08期
6 谢宏玉;;好吃不宜多吃的食物[J];健康生活;2008年10期
7 严世荣;氨基酰-tRNA合成酶结构与功能[J];郧阳医学院学报;1997年01期
8 ;第三届国际人类蛋白质组大会即将于2004年10月召开[J];药物分析杂志;2004年02期
9 ;咨询台[J];早期教育;1993年03期
10 ;宜心爽身的果蔬[J];品牌与标准化;2011年23期
中国重要会议论文全文数据库 前3条
1 孙婷婷;马海珠;;圆柱形管道对类蛋白质分子传输过程的影响[A];中国化学会第27届学术年会第07分会场摘要集[C];2010年
2 张彦定;高建民;林玮;郑翠芳;;人骨生成蛋白转基因细胞株的制备[A];中国生物化学与分子生物学会第八届会员代表大会暨全国学术会议论文摘要集[C];2001年
3 唐琳;李红涛;杜海宁;张峰;胡红雨;胡钧;;原子力显微镜在研究α-Synuclein蛋白纤维的解聚-积聚动态过程中的应用[A];第十次中国生物物理学术大会论文摘要集[C];2006年
中国重要报纸全文数据库 前3条
1 记者 钱铮;虹鳟鱼有望成为人类蛋白质“工厂”[N];新华每日电讯;2006年
2 ;510个人类蛋白质激已经完成图谱[N];中国高新技术产业导报;2002年
3 ;美开展利用烟草培育抗癌疫苗试验[N];中国高新技术产业导报;2001年
中国博士学位论文全文数据库 前3条
1 孙婷婷;类蛋白质分子构象及其动力学行为的研究[D];浙江大学;2007年
2 杨茂君;三类蛋白质的结晶、结构及功能研究[D];中国协和医科大学;2003年
3 石彦;两对人类蛋白质(MSK1与CK2,NLK与SMAD4)相互作用及其磷酸化的研究[D];复旦大学;2008年
中国硕士学位论文全文数据库 前2条
1 杨娟;基于大规模质谱数据在人类蛋白质水平研究变异位点[D];华东师范大学;2015年
2 何冰;基于序列的人类蛋白质泛素化修饰位点计算分析[D];南京航空航天大学;2013年
,本文编号:630939
本文链接:https://www.wllwen.com/xiyixuelunwen/630939.html