当前位置:主页 > 理工论文 > 生物学论文 >

新型生物酶的挖掘算法研究

发布时间:2020-12-30 02:38
  卤醇脱卤酶是一类重要的蛋白质,它不仅能通过开环反应催化有毒污染物的降解,还能作为亲核试剂促进高价值药物中间体的生成。卤醇脱卤酶在自然界中的分布极为稀少,目前仅在少数菌株中发现过卤醇脱卤酶酶活性的表达。已有的生成卤醇脱卤酶的生物实验虽然可行,但存在成本高昂且效率过低的问题。因此,根据已测定的卤醇脱卤酶序列高效挖掘更多的新卤醇脱卤酶序列,丰富已有的卤醇脱卤酶数据集的需求显得尤为迫切。另一方面,深度生成模型在图像处理、语音识别和文本生成领域都取得了令人惊喜的成果,但在生物序列方面的应用仍然存在较大的空白。综合考虑以上两个因素,本文提出了一种新的研究思路——将深度生成模型应用于新型卤醇脱卤酶序列挖掘研究之中。为实现新卤醇脱卤酶序列的挖掘,本文首先根据已有相关的序列知识构建卤醇脱卤酶数据集,然后识别卤醇脱卤酶序列中的模体,再使用深度生成模型生成新卤醇脱卤酶序列,最后建立分类模型对生成的序列进行挖掘预测。本文主要内容及创新点如下:1)提出了将模体的判别能力考虑在内的模体识别算法。使用已有的MEME算法识别卤醇脱卤酶正样本包含的模体后,计算模体的判别式评分特征(MSC、MOR和MRE),并据此筛选过... 

【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校

【文章页数】:84 页

【学位级别】:硕士

【部分图文】:

新型生物酶的挖掘算法研究


遗传信息在生物大分子之间的传递

蛋白质序列,肽键,氨基酸,主链


表 2-1 组成蛋白质序列的 20 种氨基酸及其缩写Alanine A CysteiAspartic GlutamPhenylalanine GlyciHistidine IsoleucLysineD F H K LeuciMethionine AsparagProline G uP taMl称 英文名称 缩写氨基酸名称 半胱氨酸 谷氨酰胺 甘氨酸 异亮氨酸 天冬英文名酰胺 谷氨酸亮氨酸mArginine SerinThreonineR T ValinTryptophan WTyrosi 丝氨酸 缬氨酸 酪氨酸

序列,模体,字符


第二章 相关理论概述2.3.1.3 可视化 logo 表示法序列 logo 是序列保守区域的可视化表示,通过对每一个残基位置的可能出现的字母的频率进行绘制,可以直观的展示模体中的保守位置以及对应的字符。在logo 图中,横坐标是共有序列的位置,纵坐标代表出现在对应序列位置上的字符出现的频率。通过观察字符的高低来判断字符在当前位置所包含的信息量。字符在某个位置上的高度越高,说明该字符在这个位置上越保守。借助于 WebLogo[29],对图 2-5 中包含的模体的可视化表示,详见图 2-6。

【参考文献】:
期刊论文
[1]合成生物学发展现状与前景[J]. 熊燕,陈大明,杨琛,赵国屏.  生命科学. 2011(09)

硕士论文
[1]用于蛋白质二级结构设计的深度生成模型的研究与应用[D]. 常菁.北京交通大学 2018



本文编号:2946816

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/2946816.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d5cc8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com