基于深度学习的农作物基因剪接位点识别研究
发布时间:2021-12-28 05:02
准确的识别基因剪接位点对于理解以及控制基因性状的表达具有十分重要的意义。本文基于拟南芥、水稻、玉米三类农作物基因剪接位点数据集,结合卷积神经网络与递归神经网络设计了一种深度学习网络模型DeepAS(CNN+GRU+LSTM)。并根据DeepAS模型开发了农作物基因剪接位点识别系统,目的是能够实现快速准确的识别农作物基因剪接位点,从而方便研究者的使用,加快科研工作的效率。主要研究内容如下:1、基于拟南芥、水稻、玉米三种原始农作物的基因数据提取基因剪接位点数据集,并分别制作基因剪接位点模型训练集。2、基于Tensorflow+Keras深度学习框架提出了一种农作物基因剪接位点识别模型,设计了51种不同的模型结构用于训练并测试三种农作物基因剪接位点数据集以及他们的混合数据集,挑选出在每种数据集上识别准确率最高的网络模型,命名为DeepAS,并保存其模型与权重。实验表明DeepAS网络模型在用于识别农作物基因剪接位点时具有很好的准确率与泛化能力,在农作物混合基因数据集上识别准确率为97.09%,精确率为96.88%,召回率为0.9692,F1Score为96.90%,结果...
【文章来源】:山东农业大学山东省
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
技术路线Fig.1Technologyroadmap
真核生物基因结构
山东农业大学硕士学位论文被内含子隔离开来,n个内含子一般总是把基因的外显子分隔成 n+1部分,通常内含子的长度要比外显子长很多,核苷酸数量可以比外显子多许多倍。2.1.3 基因表达与剪接位点基因表达是基因指导下的蛋白质合成过程,在这一过程中按照顺序主要分为转录和翻译两步。简单来讲,转录是以 DNA 为模板按照碱基配对的原则合成 mRNA 的过程,翻译则是以 mRNA 作为模板,按照密码子表翻译密码子为氨基酸序列,最终形成具有生物活性的蛋白质分子。
本文编号:3553451
【文章来源】:山东农业大学山东省
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
技术路线Fig.1Technologyroadmap
真核生物基因结构
山东农业大学硕士学位论文被内含子隔离开来,n个内含子一般总是把基因的外显子分隔成 n+1部分,通常内含子的长度要比外显子长很多,核苷酸数量可以比外显子多许多倍。2.1.3 基因表达与剪接位点基因表达是基因指导下的蛋白质合成过程,在这一过程中按照顺序主要分为转录和翻译两步。简单来讲,转录是以 DNA 为模板按照碱基配对的原则合成 mRNA 的过程,翻译则是以 mRNA 作为模板,按照密码子表翻译密码子为氨基酸序列,最终形成具有生物活性的蛋白质分子。
本文编号:3553451
本文链接:https://www.wllwen.com/kejilunwen/nykj/3553451.html