基于随机森林算法预测真菌和水稻microRNA的研究
发布时间:2022-04-27 18:23
microRNA是一类内源性的长度约为20~24个核苷酸的单链非编码小RNA,具有高度进化保守性和表达特异性,在生物体内的各种生理和病理过程中发挥着广泛而重要的调控作用。迄今为止,科学家已经在动物、植物、病毒以及真菌等生物体中检测到了数以万计的microRNA,但是仍然有大量未知的microRNA等待着人们的发现。因此,更多新的microRNA的发现与识别,将有利于人们对它的功能以及它在复杂生物过程中的调控作用展开更深层更全面的研究与分析。新的microRNA的发现主要有生物实验检测和计算预测识别两类方法,前者虽然更为直接准确,但是其实验周期长,成本高,而且很难克隆特定组织、特定时期表达的microRNA。研究表明,基于计算的预测方法可以弥补实验方法的不足,近年来,随着生物信息学和机器学习的不断融合发展,基于机器学习的计算预测方法已成为当前的研究热点。因此,本论文以生物信息学为背景,基于机器学习中的随机森林算法构建了两个计算模型,mil RNApredictor和plant Mir P-rice,分别用来预测识别真菌和水稻的microRNA,具体的研究成果概括如下:(1)milRNAp...
【文章页数】:72 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
缩略语表
第1章 绪论
1.1 课题研究背景与意义
1.2 论文研究内容
1.3 论文结构安排
第2章 microRNA生物学知识及研究现状
2.1 microRNA的简介
2.1.1 microRNA的发现
2.1.2 microRNA的发生机制与特征总结
2.2 microRNA的预测与识别研究方法
2.2.1 实验方法
2.2.2 计算方法
2.3 microRNA的预测研究现状
2.3.1 真菌milRNA预测研究现状
2.3.2 植物microRNA预测研究现状
第3章 真菌microRNA(mil RNA)的预测
3.1 引言
3.2 数据集构建
3.3 特征提取
3.4 算法与性能评估
3.4.1 随机森林算法
3.4.2 性能评估
3.5 结果与讨论
3.5.1 mil RNApredictor的构建与性能评估
3.5.2 能量特征与常用k-mer特征的比较
3.5.3 milRNApredictor与 mirnovo的比较
3.5.4 关键参数对mil RNApredictor的影响
3.6 本章小结
第4章 水稻microRNA前体的预测
4.1 引言
4.2 数据集构建
4.3 特征提取
4.4 结果与讨论
4.4.1 riceMirP的构建与性能评估
4.4.2 riceMirP与其他预测方法比较
4.5 本章小结
第5章 总结与展望
参考文献
附录
致谢
【参考文献】:
期刊论文
[1]miRNA检测方法的研究进展[J]. 刘亮,肖瑶,张驰. 药物分析杂志. 2020(01)
[2]Identification of microRNA-like RNAs in Ophiocordyceps sinensis[J]. Wen Zhang,Xiaona Li,Lina Ma,Uzair Urrehman,Xilinqiqige Bao,Yujing Zhang,Chen-Yu Zhang,Dongxia Hou,Zhen Zhou. Science China(Life Sciences). 2019(03)
[3]生物信息学研究现状及发展趋势[J]. 赵屹,谷瑞升,杜生明. 医学信息学杂志. 2012(05)
[4]计算方法预测microRNA研究进展[J]. 万琳霞,丁建栋,关佶红. 计算机应用与软件. 2012(05)
[5]动物中microRNA的保守性和进化历程[J]. 罗艳,张群,梁宇君,张士璀. 中国科学:生命科学. 2012(02)
[6]microRNA计算发现方法的研究进展[J]. 侯妍妍,应晓敏,李伍举. 遗传. 2008(06)
[7]microRNA的组织特异性表达及其检测方法[J]. 郭志伟,钟照华. 国际免疫学杂志. 2010 (05)
本文编号:3648951
【文章页数】:72 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
缩略语表
第1章 绪论
1.1 课题研究背景与意义
1.2 论文研究内容
1.3 论文结构安排
第2章 microRNA生物学知识及研究现状
2.1 microRNA的简介
2.1.1 microRNA的发现
2.1.2 microRNA的发生机制与特征总结
2.2 microRNA的预测与识别研究方法
2.2.1 实验方法
2.2.2 计算方法
2.3 microRNA的预测研究现状
2.3.1 真菌milRNA预测研究现状
2.3.2 植物microRNA预测研究现状
第3章 真菌microRNA(mil RNA)的预测
3.1 引言
3.2 数据集构建
3.3 特征提取
3.4 算法与性能评估
3.4.1 随机森林算法
3.4.2 性能评估
3.5 结果与讨论
3.5.1 mil RNApredictor的构建与性能评估
3.5.2 能量特征与常用k-mer特征的比较
3.5.3 milRNApredictor与 mirnovo的比较
3.5.4 关键参数对mil RNApredictor的影响
3.6 本章小结
第4章 水稻microRNA前体的预测
4.1 引言
4.2 数据集构建
4.3 特征提取
4.4 结果与讨论
4.4.1 riceMirP的构建与性能评估
4.4.2 riceMirP与其他预测方法比较
4.5 本章小结
第5章 总结与展望
参考文献
附录
致谢
【参考文献】:
期刊论文
[1]miRNA检测方法的研究进展[J]. 刘亮,肖瑶,张驰. 药物分析杂志. 2020(01)
[2]Identification of microRNA-like RNAs in Ophiocordyceps sinensis[J]. Wen Zhang,Xiaona Li,Lina Ma,Uzair Urrehman,Xilinqiqige Bao,Yujing Zhang,Chen-Yu Zhang,Dongxia Hou,Zhen Zhou. Science China(Life Sciences). 2019(03)
[3]生物信息学研究现状及发展趋势[J]. 赵屹,谷瑞升,杜生明. 医学信息学杂志. 2012(05)
[4]计算方法预测microRNA研究进展[J]. 万琳霞,丁建栋,关佶红. 计算机应用与软件. 2012(05)
[5]动物中microRNA的保守性和进化历程[J]. 罗艳,张群,梁宇君,张士璀. 中国科学:生命科学. 2012(02)
[6]microRNA计算发现方法的研究进展[J]. 侯妍妍,应晓敏,李伍举. 遗传. 2008(06)
[7]microRNA的组织特异性表达及其检测方法[J]. 郭志伟,钟照华. 国际免疫学杂志. 2010 (05)
本文编号:3648951
本文链接:https://www.wllwen.com/projectlw/swxlw/3648951.html
教材专著