基于深度学习的植物miRNA靶基因预测研究
发布时间:2021-02-25 16:35
生物体内存在着种类和功能各异的RNA,其中非编码RNA是近年来新发现的一类RNA,它们在生物体的生命过程中主要起调控作用,而miRNA就是非编码RNA中最有代表性的一类。在植物中,miRNA可以通过碱基互补匹配的方式与靶基因相互识别,并以此对靶基因介导翻译抑制或对靶基因进行切割,进而影响基因性状的表达。基于miRNA及其靶向机制对生物体的重要作用,本文通过研究植物miRNA和靶基因的生物特性,采用深度学习的算法,设计了一种植物miRNA靶基因预测模型:DeepMiRNA,并开发了基于web的植物miRNA靶基因预测系统。自miRNA被发现,miRNA的相关数据量在不断攀升,对miRNA靶基因的预测也从传统的单一靶基因序列验证转变为借助计算机技术中的大数据和机器学习、深度学习等技术进行预测。并且由于一个miRNA一般会有多个靶基因,因此计算方法的产生极大的推动了miRNA靶基因预测的效率和准确性。因此基于当前的研究现状,本文利用在序列类自然语言处理中有出色表现的卷积神经网络(CNN)和循环神经网络的特殊形式双向长短期记忆网络(BiLSTM),设计出针对植物miRNA靶基因的预测模型Dee...
【文章来源】:山东农业大学山东省
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
技术路线Fig.1Technologyroadmap
基于深度学习的植物miRNA靶基因预测研究82.1.2植物miRNA合成过程植物microRNA在生物体中产生的主要步骤如下:一、细胞核中编码miRNA的基因在RNA聚合酶II(PolII)的介导下转录为pri-miRNA,其长度约为几千个碱基。二、pri-miRNA在Drosha蛋白酶的作用下,被加工成长度为60-70个核苷酸长度且具有茎环结构的miRNA前体(pre-miRNA)。三、pre-miRNA在转运蛋白的协助下从细胞核内被转运至细胞质中。四、在细胞质中,Dicer酶对miRNA前体的茎环结构进行剪切和修饰,形成miRNA:miRNA*二聚体。五、在RNA诱导沉默复合体RISC(RNA-inducedsilencingcomplex)的加载过程中,一条miRNA双链被选择为导链(如图2红色链所示),并与ARGONAUTE(AGO)蛋白结合形成功能性RISC,成为成熟体miRNA,而另一条链(乘客链)则被移除并降解(YuYetal.,2017)。本文中需要的miRNA序列都为成熟体miRNA序列。该过程如图2所示。图2miRNA的产生过程aFig.2TheproductionprocessofmiRNA*aDiederichsSetal.,2009
’端的非编码区域称为尾部区,或者3’非编码区(3’Untranslatedregion,3’UTR)。虽然有研究指出miRNA可以作用于mRNA的5’端甚至编码区,但综合目前已有的生物学实验数据,miRNA主要还是通过结合mRNA的3’UTR来调控靶mRNA。不同mRNA中3’UTR的长度变化范围跨度较大,从几十nt到几十万nt,其中能够和miRNA结合的具体位置被称为靶位点(Targetsite)。一般每个靶3’UTR都具有多个靶位点,对于一个3’UTR而言,若存在能与miRNA相互作用的真实靶位点,则称这个3’UTR为该miRNA的靶基因。miRNA与靶基因的结合过程如图3所示。图3miRNA与靶基因结合示意图Fig.3MiRNAbindingtotargetgenes种子区域(seedregion)为miRNA上进化最为保守的片段,一般指miRNA上第2个到第8个核苷酸。种子区域通常与mRNA3’UTR上的靶位点以近似完全互补匹配的方式结合。植物miRNA通常与mRNA3’UTR的序列完全互补匹配,并且互补区域散布在靶mRNA的转录区域内而非仅仅局限在3’UTR,使得miRNA会结合到包括编码区域在内的多个位点上去,从而直接降解mRNA导致基因沉默。如图2左下角所示,ARGONAUTE1(AGO1)蛋白介导miRNA的靶基因切割,接着导致基因序列的裂解,最后降解切割片段。成熟的植物miRNA被整合到ARGONAUTE蛋白中,实际可以通过两种方式导致基因沉默(PTGS)或触发次级小干扰RNA(siRNA)的产生:一是转录切割,二是翻译抑制。但在植物中还是以转录切割从而直接降解mRNA为主,从而影响基因的表达,进而影响植物体的各项生命进程。由于miRNA的长度较短,并且动物miRNA及其序列的互补靶标有限,预测特异性的动物miRNA靶标是具有一定难度的。但是植物中靶标的预测相对简单,因为植物miRNA与靶标mRNA的结合是近乎完全互补的。另外,miRNA序列与靶基因序列在进行结合时,要遵循?
【参考文献】:
期刊论文
[1]植物miRNA研究进展[J]. 王洁,章嘉航,孟秋峰,黄芸萍,任锡亮,高天一. 宁波农业科技. 2019(03)
[2]microRNA在植物生长发育中的研究进展[J]. 黄俊骏,刘文文,郭亚如,蒋天慧,任晴,王华华,梁卫红. 生物技术通报. 2019(11)
[3]融合CNN和Bi-LSTM的miRNA-lncRNA互作关系预测模型[J]. 石文浩,孟军,张朋,刘婵娟. 计算机研究与发展. 2019(08)
[4]植物中miRNA的研究进展[J]. 李小凡,冀蒙蒙,翟晓巧. 河南林业科技. 2019(02)
[5]用于图像分类的卷积神经网络中激活函数的设计[J]. 王红霞,周家奇,辜承昊,林泓. 浙江大学学报(工学版). 2019(07)
[6]植物miRNA参与调控作物农艺性状的研究进展[J]. 江曾明,何娟,莫蓓莘,刘琳,徐晓峰. 生物化学与生物物理进展. 2019(03)
[7]一个深度学习DNA序列特异性的预测模型[J]. 黄立群,丁雪松,张步忠,吕强. 小型微型计算机系统. 2018(11)
[8]深度学习在生物医学数据中的应用[J]. 洪浩,伯晓晨,李非. 医学信息学杂志. 2018(03)
[9]植物microRNA响应非生物胁迫研究进展[J]. 吴美婷,杨晓玉,罗淋淋,莫蓓莘,刘琳. 广东农业科学. 2018(03)
[10]microRNA靶基因预测算法的研究与发展[J]. 程爽,郭茂祖,武雪剑. 智能计算机与应用. 2018(01)
博士论文
[1]复杂疾病关联miRNAs预测算法及应用研究[D]. 彭理.湖南大学 2018
[2]miRNA靶基因预测及其功能识别算法研究[D]. 程爽.哈尔滨工业大学 2016
硕士论文
[1]基于神经网络对鼠标移动轨迹的情绪识别[D]. 王欣.江西财经大学 2019
[2]基于DeepCNN的拟南芥TFBS预测模型的构建及其在植物跨物种的迁移学习应用[D]. 张戈.华中农业大学 2019
[3]基于深度学习的lncRNA识别和功能注释及与疾病关系研究[D]. 安高乐.军事科学院 2019
[4]基于随机游走和卷积神经网络的miRNA-疾病关联预测研究[D]. 董益华.黑龙江大学 2019
[5]基于卷积神经网络的RNA二级结构预测方法研究[D]. 张春鹤.吉林大学 2019
[6]基于深度学习的农作物基因剪接位点识别研究[D]. 李瑞.山东农业大学 2019
[7]基于深度学习网络的剪接位点及蛋白质相互作用预测方法研究[D]. 姚雨.安徽大学 2019
[8]基于深度学习的蛋白质二级结构预测研究[D]. 赵志山.哈尔滨工业大学 2018
[9]芦笋雌雄花发育转录组分析及性别决定相关miRNA靶基因的鉴定[D]. 秦力.浙江大学 2016
[10]植物miRNA及其功能的预测方法研究与实现[D]. 刘冬.大连理工大学 2015
本文编号:3051247
【文章来源】:山东农业大学山东省
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
技术路线Fig.1Technologyroadmap
基于深度学习的植物miRNA靶基因预测研究82.1.2植物miRNA合成过程植物microRNA在生物体中产生的主要步骤如下:一、细胞核中编码miRNA的基因在RNA聚合酶II(PolII)的介导下转录为pri-miRNA,其长度约为几千个碱基。二、pri-miRNA在Drosha蛋白酶的作用下,被加工成长度为60-70个核苷酸长度且具有茎环结构的miRNA前体(pre-miRNA)。三、pre-miRNA在转运蛋白的协助下从细胞核内被转运至细胞质中。四、在细胞质中,Dicer酶对miRNA前体的茎环结构进行剪切和修饰,形成miRNA:miRNA*二聚体。五、在RNA诱导沉默复合体RISC(RNA-inducedsilencingcomplex)的加载过程中,一条miRNA双链被选择为导链(如图2红色链所示),并与ARGONAUTE(AGO)蛋白结合形成功能性RISC,成为成熟体miRNA,而另一条链(乘客链)则被移除并降解(YuYetal.,2017)。本文中需要的miRNA序列都为成熟体miRNA序列。该过程如图2所示。图2miRNA的产生过程aFig.2TheproductionprocessofmiRNA*aDiederichsSetal.,2009
’端的非编码区域称为尾部区,或者3’非编码区(3’Untranslatedregion,3’UTR)。虽然有研究指出miRNA可以作用于mRNA的5’端甚至编码区,但综合目前已有的生物学实验数据,miRNA主要还是通过结合mRNA的3’UTR来调控靶mRNA。不同mRNA中3’UTR的长度变化范围跨度较大,从几十nt到几十万nt,其中能够和miRNA结合的具体位置被称为靶位点(Targetsite)。一般每个靶3’UTR都具有多个靶位点,对于一个3’UTR而言,若存在能与miRNA相互作用的真实靶位点,则称这个3’UTR为该miRNA的靶基因。miRNA与靶基因的结合过程如图3所示。图3miRNA与靶基因结合示意图Fig.3MiRNAbindingtotargetgenes种子区域(seedregion)为miRNA上进化最为保守的片段,一般指miRNA上第2个到第8个核苷酸。种子区域通常与mRNA3’UTR上的靶位点以近似完全互补匹配的方式结合。植物miRNA通常与mRNA3’UTR的序列完全互补匹配,并且互补区域散布在靶mRNA的转录区域内而非仅仅局限在3’UTR,使得miRNA会结合到包括编码区域在内的多个位点上去,从而直接降解mRNA导致基因沉默。如图2左下角所示,ARGONAUTE1(AGO1)蛋白介导miRNA的靶基因切割,接着导致基因序列的裂解,最后降解切割片段。成熟的植物miRNA被整合到ARGONAUTE蛋白中,实际可以通过两种方式导致基因沉默(PTGS)或触发次级小干扰RNA(siRNA)的产生:一是转录切割,二是翻译抑制。但在植物中还是以转录切割从而直接降解mRNA为主,从而影响基因的表达,进而影响植物体的各项生命进程。由于miRNA的长度较短,并且动物miRNA及其序列的互补靶标有限,预测特异性的动物miRNA靶标是具有一定难度的。但是植物中靶标的预测相对简单,因为植物miRNA与靶标mRNA的结合是近乎完全互补的。另外,miRNA序列与靶基因序列在进行结合时,要遵循?
【参考文献】:
期刊论文
[1]植物miRNA研究进展[J]. 王洁,章嘉航,孟秋峰,黄芸萍,任锡亮,高天一. 宁波农业科技. 2019(03)
[2]microRNA在植物生长发育中的研究进展[J]. 黄俊骏,刘文文,郭亚如,蒋天慧,任晴,王华华,梁卫红. 生物技术通报. 2019(11)
[3]融合CNN和Bi-LSTM的miRNA-lncRNA互作关系预测模型[J]. 石文浩,孟军,张朋,刘婵娟. 计算机研究与发展. 2019(08)
[4]植物中miRNA的研究进展[J]. 李小凡,冀蒙蒙,翟晓巧. 河南林业科技. 2019(02)
[5]用于图像分类的卷积神经网络中激活函数的设计[J]. 王红霞,周家奇,辜承昊,林泓. 浙江大学学报(工学版). 2019(07)
[6]植物miRNA参与调控作物农艺性状的研究进展[J]. 江曾明,何娟,莫蓓莘,刘琳,徐晓峰. 生物化学与生物物理进展. 2019(03)
[7]一个深度学习DNA序列特异性的预测模型[J]. 黄立群,丁雪松,张步忠,吕强. 小型微型计算机系统. 2018(11)
[8]深度学习在生物医学数据中的应用[J]. 洪浩,伯晓晨,李非. 医学信息学杂志. 2018(03)
[9]植物microRNA响应非生物胁迫研究进展[J]. 吴美婷,杨晓玉,罗淋淋,莫蓓莘,刘琳. 广东农业科学. 2018(03)
[10]microRNA靶基因预测算法的研究与发展[J]. 程爽,郭茂祖,武雪剑. 智能计算机与应用. 2018(01)
博士论文
[1]复杂疾病关联miRNAs预测算法及应用研究[D]. 彭理.湖南大学 2018
[2]miRNA靶基因预测及其功能识别算法研究[D]. 程爽.哈尔滨工业大学 2016
硕士论文
[1]基于神经网络对鼠标移动轨迹的情绪识别[D]. 王欣.江西财经大学 2019
[2]基于DeepCNN的拟南芥TFBS预测模型的构建及其在植物跨物种的迁移学习应用[D]. 张戈.华中农业大学 2019
[3]基于深度学习的lncRNA识别和功能注释及与疾病关系研究[D]. 安高乐.军事科学院 2019
[4]基于随机游走和卷积神经网络的miRNA-疾病关联预测研究[D]. 董益华.黑龙江大学 2019
[5]基于卷积神经网络的RNA二级结构预测方法研究[D]. 张春鹤.吉林大学 2019
[6]基于深度学习的农作物基因剪接位点识别研究[D]. 李瑞.山东农业大学 2019
[7]基于深度学习网络的剪接位点及蛋白质相互作用预测方法研究[D]. 姚雨.安徽大学 2019
[8]基于深度学习的蛋白质二级结构预测研究[D]. 赵志山.哈尔滨工业大学 2018
[9]芦笋雌雄花发育转录组分析及性别决定相关miRNA靶基因的鉴定[D]. 秦力.浙江大学 2016
[10]植物miRNA及其功能的预测方法研究与实现[D]. 刘冬.大连理工大学 2015
本文编号:3051247
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3051247.html