基于RNA二级结构的调控玉米干旱应激响应lncRNA特征识别算法研究
本文关键词:基于RNA二级结构的调控玉米干旱应激响应lncRNA特征识别算法研究 出处:《吉林大学》2017年硕士论文 论文类型:学位论文
【摘要】:长非编码RNA为长度通常大于200个核苷酸且不存在长开放阅读框架的RNA大分子,其自身并不能编码蛋白,却在动植物体生长、发育等过程起到重要作用。近年来,长非编码RNA发现、分类、特征识别以及功能研究,日益成为RNA领域研究的热点问题。由于lncRNA结构决定其功能,因此从结构入手探究其特征并进行相应分类研究,能够发现并识别具有相似功能的lncRNA,促进其功能分类研究,对有效识别未知lncRNA功能也有重要意义。目前在人类疾病领域中lncRNA的研究已经取得很大进展,相比之下植物领域的研究相对较少,而基于相同功能的lncRNA特征识别更鲜有研究。众所周知,玉米是全世界最主要的谷类作物之一,为人及动物的食物,也是工业用途的关键性资源,而干旱作为主要非生物应激条件之一严重影响玉米产量。研究表明,玉米lncRNA在玉米干旱应激响应中起着关键作用。本文通过生物计算方法识别干旱应激响应下玉米lncRNA的序列及结构特征,分析具有此功能的玉米lncRNA序列结构共性特征,最终构建玉米干旱应激响应lncRNA特征集,从而为识别未被发现的调控玉米干旱应激响应的lncRNA奠定基础。本文首先收集具有干旱应激响应功能的玉米lncRNA和具有其他特定功能的玉米lncRNA用于算法验证。其次对具有干旱应激响应功能的lncRNA进行一级序列特征的提取及分析,然后通过一种新型的结合了热力学与动力学理论的RNA折叠仿真软件进行lncRNA的二级结构预测;对预测的二级结构通过结构比对算法进行特征分析,包括碱基对的特征以及对内环、发夹环以及多分支环等二级特征的提取及分析;同时,考虑到单一的特征可能对功能的影响存在偶然性,通过支持向量机SVM建模对特征的各种组合方式分析,使用留一交叉验证进行准确率计算,排名后从而评估出最优的特征集。最后验证具有玉米干旱应激响应功能的lncRNA特征识别算法的有效性。本文通过对已知功能的玉米lncRNA进行特征识别,并使用支持向量机SVM建模及评估等方法评估分析结果,最终得到可以作为玉米干旱应激响应lncRNA功能特征集,为研究植物lncRNA功能特征提供了新的思路,为研究玉米干旱应激响应的调控机制提供有效的途径,同时对玉米作物的增产增收及抗旱机制提供理论基础。
[Abstract]:Long non coding RNA is RNA macromolecule whose length is usually larger than 200 nucleotides and does not exist long open reading frame. It can not encode protein itself, but plays an important role in the growth and development of plants and animals. In recent years, the discovery, classification, feature recognition and functional research of long non coded RNA have become a hot issue in the field of RNA. Because the structure of lncRNA determines its function, so we can explore its characteristics from the structure and classify it. It can detect and identify lncRNA with similar functions, and promote its functional classification. It is also significant for effective identification of unknown lncRNA functions. At present, in the field of human disease, lncRNA has made great progress. Compared with the field of plant research, relatively few studies have been done. However, lncRNA feature recognition based on the same function is rarely studied. As we all know, corn is one of the most important cereal crops in the world. It is also a key resource of industrial use for human and animal food, and drought as one of the main abiotic stress conditions seriously affects maize yield. The study shows that maize lncRNA plays a key role in the response to drought stress in maize. The calculation method for biological identification of drought stress response sequence and structure characteristics of maize lncRNA maize, analysis of lncRNA sequence structure possess the common feature of this function, finally construct the maize drought stress response lncRNA feature set, which lays the foundation for the identification of undiscovered regulation of maize drought stress response lncRNA. This paper first collects maize lncRNA with drought stress response function and maize lncRNA with other specific functions to verify the algorithm. Secondly, with the extraction and analysis of response function lncRNA drought stress level for the sequence features, and then through a new combination forecasting two level structure of RNA folding simulation software of thermodynamic and kinetic theory of lncRNA; two for secondary structure prediction by structure characteristic analysis of the algorithm, including the base pair characteristics and the inner loop and hairpin loop and multi branch loop two level feature extraction and analysis; at the same time, considering the single feature may affect the function of the existence of contingency, through support vector machine SVM modeling of the characteristics of each kind of combination analysis, using the leave one out cross validation accuracy for calculation, thus ranking evaluation the optimal feature set. Finally, the validity of the lncRNA feature recognition algorithm with the response function of drought stress in maize was verified. In this paper, based on the feature recognition of known function of maize lncRNA, and use the support vector machine SVM modeling and evaluation method of evaluation results obtained can be used as drought stress response function lncRNA feature set, provides a new way for the study of plant lncRNA features, provide an effective way to study the regulation mechanism of maize drought stress response at the same time, increase production and the mechanism of drought resistance of maize crop to provide a theoretical basis for.
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:S513;TP18
【相似文献】
相关期刊论文 前9条
1 付微,黄竞伟,徐丽;RNA二级结构表示方法及其转换算法[J];计算机工程与应用;2004年14期
2 骆嘉伟;彭政;;基于快速动态权重匹配的RNA二级结构预测算法[J];计算机应用;2008年08期
3 梁成;骆嘉伟;李仁发;;一种新的RNA二级结构特征序列表示及相似性分析[J];计算机应用研究;2011年03期
4 单夫一;骆嘉伟;;一种新的RNA二级结构的三维图形表示[J];武汉理工大学学报(信息与管理工程版);2007年05期
5 林娟;钟一文;张骏;;离散蛙跳算法预测RNA二级结构[J];南京师范大学学报(工程技术版);2011年04期
6 刘琦;张引;叶修梓;俞荣栋;;基于离散Hopfield网络求解极大独立集的茎区选择算法以及在RNA二级结构预测中的应用[J];计算机学报;2008年01期
7 唐四薪;赵辉煌;周勇;;RNA二级结构预测:基于半监督学习的随机文法模型方法[J];计算机与应用化学;2013年09期
8 郑明;钟诚;;CPU/GPU系统上存储高效的RNA二级结构预测算法[J];小型微型计算机系统;2014年05期
9 ;[J];;年期
相关会议论文 前1条
1 张文炳;;RNA二级结构折叠动力学[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
相关博士学位论文 前8条
1 刘琦;RNA二级结构的若干计算生物学问题研究[D];浙江大学;2008年
2 岳媛;RNA二级结构调控Dscam和serpent互斥可变剪接的机制研究[D];浙江大学;2015年
3 赵培楠;RNA二级结构折叠动力学[D];武汉大学;2011年
4 舒文杰;RNA二级结构拓扑特征化关键技术及其应用研究[D];国防科学技术大学;2007年
5 杨峗;RNA二级结构在A-I RNA编辑和互斥剪接中的作用及其机制研究[D];浙江大学;2012年
6 刘海军;RNA二级结构预测的建模及其应用研究[D];上海大学;2005年
7 何静媛;RNA二级结构预测算法的研究[D];重庆大学;2009年
8 王文峰;RNA二级结构在果蝇Dscam基因外显子4和6互斥可变剪接中的作用研究[D];浙江大学;2013年
相关硕士学位论文 前10条
1 陆健;基于动态权重匹配的RNA二级结构预测算法[D];江苏大学;2007年
2 杨雪菲;调控水稻光敏不育基因的pms3的RNA二级结构测定和RPA3017蛋白的晶体结构研究[D];华中农业大学;2015年
3 陈冉;RNA二级结构在果蝇Dscam外显子簇6互斥可变剪接中的调控功能研究[D];浙江大学;2015年
4 黄进;基于启发式优化的RNA二级结构预测方法研究[D];江苏大学;2016年
5 徐沛彦;RNA二级结构能量计算加速器的设计与实现[D];南京航空航天大学;2016年
6 徐瑞;含假结的RNA二级结构预测算法研究[D];吉林大学;2017年
7 付琳晴;基于RNA二级结构的调控玉米干旱应激响应lncRNA特征识别算法研究[D];吉林大学;2017年
8 段学青;基于图像处理的RNA二级结构比较算法[D];吉林大学;2011年
9 杨卫东;基于弧图特征的RNA二级结构图形表示及相似性分析[D];湖南大学;2010年
10 满建芬;RNA二级结构预测方法研究[D];华中科技大学;2013年
,本文编号:1338414
本文链接:https://www.wllwen.com/shoufeilunwen/zaizhiyanjiusheng/1338414.html