当前位置:主页 > 理工论文 > 生物学论文 >

基于有序Graphlet相似性度量的近天然蛋白质结构选取

发布时间:2020-09-10 12:32
   随着人类和其他几个物种基因组计划的完成,基因图谱也正式绘制出来,生命科学进入后基因组时代。人们亟待了解那些数以亿计的基因序列所对应的功能是什么。由遗传学中心法则可以知道,蛋白质是由基因指导合成,而蛋白质既是构成生命体的主要成分,也是生命活动的主要执行者,因此我们可以通过研究蛋白质的功能来研究对应的基因功能。因为蛋白质的功能主要由其三级结构决定,所以蛋白质三级结构的研究对于理解基因组数据至关重要。然而,目前只有小部分蛋白质的三级结构是已知的。因此,如何有效预测蛋白质三级结构成为计算结构生物学中一个非常重要且具有挑战性的问题。目前常用的蛋白质三维结构预测方法是从头预测(Ab initio)法。使用从头预测方法,可以预测出大量称为预测集的候选蛋白质结构,但是从预测得到的预测集中选择良好的近天然蛋白质结构是一个难题。在这项工作中,我们设计了一种基于Contact Map Overlap(CMO)和Graphlet子图节点度的相似性从预测集中选择近原生蛋白结构的新方法。通过将graphlet扩展到有序图,并使用引入动态空位罚分的动态规划算法来选择最佳的匹配序列,通过定义GR_score来评价两个蛋白质三维结构之间的相似性。最后,使用集成聚类方法在预测集中选择近天然蛋白质结构,在这里的近天然蛋白质结构指的是聚类簇的中心结构。实验表明,与I-TASSER中使用的SPICKER方法相比,本课题中所提出的方法选择得到的近天然蛋白质结构与天然蛋白质结构之间具有更好的相似性,也就是说二者之间通过计算得到的相似性分数值更高。
【学位单位】:兰州大学
【学位级别】:硕士
【学位年份】:2019
【中图分类】:Q51;Q811.4
【部分图文】:

中心法则,自我复制,生物学,中指


通过判决基因及其序列,最终达到破译人类遗传信息的目的。人类基因组计划中实质的内容便是人类基因组的 DNA 序列,人类基因组的计划开始、争论的焦点、主要分歧等都是围绕着基因序列图谱展开的。2003 年,DNA 双螺旋结构模型发表 50 周年前夕,参与人类基因组计划的六个国家的领导人签署文件,在六国科学家共同发表声明之后,宣告人类基因组序列图谱绘制正式完成。随着人类基因组计划的完成,基因工程正式进入了“后基因组时代”。基因序列的获得使得人们可以更为准确的了解生物体的奥秘。但是单单从基因序列的角度并不能完整的阐述生物体的功能[1],主要的原因有两个:1.生物体的核苷酸序列并不会直接参与生物体的新陈代谢,相反的是,通过图 1-1 所示的遗传学中心法则中[2],DNA 通过转录生成 RNA 后,经过翻译以后生成蛋白质,最后蛋白质通过控制人生物体的新陈代谢来调控生物体的生命活动,进而表现出基因的遗传特性。为了更加全面的发掘生物体自身的变化,了解生命体的衰老过程,知晓疾病的发病机制就必须从基因的表达产物蛋白质入手。2.由于大量的基因序列信息使得科学家并不能完成相关的计算。因此在认识到蛋白质对于生物体功能阐述的重要性后,“蛋白质组学”应用而生。

示意图,示意图,空间结构,生物活性


兰州大学硕士学位论文 基于有序 Graphlet 相似性度量的近天然蛋白质结构选取蛋白质分子的多肽链不是线性延伸的,而是具有相对稳定的空间结构,这是折叠和盘曲特有的。蛋白质的生物活性和性质主要取决于空间结构的完整性。因此,仅仅确定蛋白质分子的氨基酸组成及其排列顺序,并不能充分了解蛋白质分子的生物活性和理化性质。因此就需要得知蛋白质的空间结构,其空间结构指的是蛋白质的二级、三级和四级结构。

示意图,蛋白质二级结构,α-螺旋,β-折叠


图 2-1 蛋白质的一级结构示意图 蛋白质二级结构蛋白质的二级结构是指蛋白质多肽链中的规律重复,仅限于主链原子的排列,不包括肽链和侧链的其他部分。二级结构主要有 α-螺旋型、β-折转角型。目前常见的蛋白质二级结构包含 α-螺旋型和 β-折叠型,两种图如 2-2 所示。蛋白质的二级结构是其空间结构的基本单元。

【相似文献】

相关期刊论文 前10条

1 ;美国培育出抗虫害的西红柿[J];化学世界;1988年10期

2 汪玉华;海洋:新世纪的天然蛋白质“仓库”[J];解放军健康;2001年05期

3 李潇;一种新的合成天然蛋白质的方法[J];生命的化学(中国生物化学会通讯);1995年03期

4 ;美国科学家发现细胞内有天然蛋白质“电池”[J];化工学报;2005年10期

5 邓海莲;;天然蛋白质牙膏创新与包装设计传播环保新理念[J];沿海企业与科技;2017年03期

6 王俊杰;二十一世纪的天然蛋白质主要来源[J];山东食品科技;2000年05期

7 魏香,曾宪纲,周海梦;蛋白质结构中卷曲螺旋的研究进展[J];中国生物化学与分子生物学报;2004年05期

8 谢桂军;程凌燕;张玉梅;王华平;;天然蛋白质材料在离子液体中的溶解与再生[J];丝绸;2008年05期

9 约卡尔.帕克,山越利夫,堀照夫;天然蛋白质改性及其在功能性纺织品整理中的应用[J];天津纺织工学院学报;1997年01期

10 郑琦,曾云鹗,蔡汝秀;天然蛋白质的模拟酶特性研究及应用[J];分析科学学报;2005年05期

相关会议论文 前3条

1 孔祥铎;苟小军;谢慧敏;王晓平;张红缨;张今;;L-天冬氨酸酶结构域重组的研究[A];中国生物化学与分子生物学会第八届会员代表大会暨全国学术会议论文摘要集[C];2001年

2 孙力;董坚;;水溶性聚柠檬酰胺的性质研究[A];2013年全国高分子学术论文报告会论文摘要集——主题I:生物高分子与天然高分子[C];2013年

3 孙静;李志波;;聚肽/聚类肽高分子的结构与性能相互关系的研究[A];中国化学会2017全国高分子学术论文报告会摘要集——主题B:生物大分子[C];2017年

相关重要报纸文章 前4条

1 记者 张梦然;半合成生物体能生成非天然蛋白质[N];科技日报;2017年

2 记者 吴长锋;我学者发现“仿制”天然蛋白质新路径[N];科技日报;2014年

3 徐泽余 陆学进 陈忠立;天然蛋白质得到充分利用[N];中国环境报;2014年

4 记者 李陈续;我科学家验证蛋白质设计新方法[N];光明日报;2014年

相关硕士学位论文 前5条

1 韩旭;基于有序Graphlet相似性度量的近天然蛋白质结构选取[D];兰州大学;2019年

2 李利;使用集成聚类方法选取近天然蛋白质结构[D];兰州大学;2018年

3 刘荀;基于MOF多级孔材料的设计合成及应用研究[D];辽宁师范大学;2015年

4 闫劲阳;基于极大团的近天然蛋白质结构选取方法[D];兰州大学;2017年

5 刘琼;羽毛多肽粉的制备、性能分析与应用[D];安徽工程大学;2014年



本文编号:2815828

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/2815828.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0dbc5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com