当前位置:主页 > 理工论文 > 生物学论文 >

基于高通量测序数据的跨界sRNA数据分析方法研究

发布时间:2020-07-18 18:50
【摘要】:Small RNA(sRNAs)是一类长度在几十至几百个核苷酸之间的非编码小分子RNA,在生物体内通过和靶mRNA碱基互补配对结合进而调控基因表达,从而参与控制细胞的多种生物过程。最初,sRNA由于长度过小,很难被检测到。随着高通量测序技术的出现,越来越多的sRNA不断被发现,其作为调控基因表达的重要调节因子也逐渐成为生命科学研究的热点问题。现有研究证实sRNA在跨界调控中起着重要作用。由于sRNA的序列及结构与其进入宿主细胞的能力息息相关,因此从序列及结构方面对跨界sRNA进行数据分析,进而寻找并识别类似的跨界sRNA,不仅可以发掘sRNA序列及结构和功能的相关性,也对有效识别未知的跨界sRNA有重要意义。截止到目前,有关sRNA的研究主要集中在对sRNA的序列分析和靶基因功能识别方面,而对于跨界sRNA序列的研究还处于初期研究阶段,且均是针对特定物种进行研究。本文从生物计算入手,在研究常见RNA数据分析方法基础上,基于真菌和植物、植物和人体sRNA高通量数据提出了一种跨界sRNA数据分析方法。首先应用统计学方法分析跨界sRNA序列及结构信息,其次在对差异表达的跨界sRNA分析的基础上,识别出可能影响sRNA进入宿主细胞参与跨界调控的分子特征,构建基于机器学习的跨界sRNA识别模型,用来识别可能被宿主吸收的外源性sRNA,进而挖掘跨界sRNA可能存在的生物学意义及生物功能。本文首先收集真菌和植物、植物和人体sRNA数据并对其进行质量、剪切识别等一系列预处理;然后,应用机器学习方法对sRNA序列及结构特征进行选择构建特征子集,进而构建跨界sRNA识别模型,用来对能够进入宿主细胞的sRNA进行识别;最后,对模型进行评估,并对识别的跨界sRNA进行靶基因筛选、功能富集分析及基因相互作用关系挖掘,从而分析出其在生物系统中的功能。本文选用真菌和植物数据以及人类和植物sRNA数据作为实例分别用本文提出的数据分析方法进行研究,其中,对真菌和植物模型的正确率在84.5%,植物和人体正确率在78.2%。本文提出针对跨界sRNA高通量测序数据的分析方法为研究跨界sRNA进入宿主细胞的能力与其结构和特征间的关系提供了新的研究思路,为今后研究sRNA的跨界调控机制提供了新的研究方向,同时在农作物,药物和疾病等方面都有部分指导意义。
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP181;Q811.4
【图文】:

序列,产生过程


第 2 章 sRNA 调控机理RNA 分子概述及作用机制A 的产生一般包括转录、加工和降解等过程,种类繁多且具有不同的A 在形成和发挥调控作用过程中所依赖的蛋白质及内切酶都是共享的物和植物中,基于 sRNA 的转录过程及生物发生途径,一般分为两和 siRNA[29]。其中,miRNA 来自非蛋白质编码基因,具有保守性。其先在细胞核中形成长达几千核苷酸的初级转录物 pri-miRNA;随后,pa-DGCR8 加工成前体转录物 pre-miRNA,这时的 miRNA 成发卡状结构ase III 型核糖核酸内切酶中的 Dicer 酶,pre-miRNA 被切割成成熟双),双链 miRNA 被切割成单链 miRNA。这个单链 miRNA 就是最终真因序列,具体过程如图 2.1 所示。

基于高通量测序数据的跨界sRNA数据分析方法研究


FastQC结果项-Adapter

真菌侵染,侵染,序列信息,宿主细胞


图 5.1 标准化后的部分跨界 sRNA 序列信息为了更高效率地探究能够进入宿主细胞的 sRNA,本文通过分析真菌 sRNA 序后表达量的变化,最终选取了真菌侵染后的 220 条及侵染后新产生的 146 条 作为阳性数据集,即正样本。在所有数据集中,去除阳性数据集,剩余 97981为阴性数据集,即负样本。由于正负数据集相差过大会造成类不平衡问题,从

【相似文献】

相关期刊论文 前10条

1 李思维;;大数据分析方法在量化评级中的应用探讨[J];时代金融;2016年33期

2 梁晓攀;;大数据分析方法在防范保险欺诈中的应用[J];审计月刊;2016年11期

3 张文霖;;数据分析方法一点通[J];数据;2013年12期

4 曹洋;樊文飞;袁腾飞;;有限资源下的大数据分析方法(英文)[J];数据分析与知识发现;2017年09期

5 孟涛;;Plackett-Burman饱和设计下数据分析方法的标准化研究[J];内江师范学院学报;2007年06期

6 刘兰平;;《行为科学研究与数据分析方法精要》一书介绍[J];心理学动态;1993年02期

7 黄敏;;大数据分析方法及应用初探[J];科技资讯;2017年18期

8 ;《局地天气预报的数据分析方法程序集》发行[J];气象;1984年12期

9 杨小宝;环梅;;《数据分析方法与应用》课程的研究性教学探讨[J];中国科教创新导刊;2010年11期

10 龙草芳;;大数据时代数据分析方法概述[J];电脑知识与技术;2019年14期

相关会议论文 前10条

1 张靓;彭娟;章晓春;汪胜和;周俊超;田传波;;数据分析方法在物资合同支付管理领域应用[A];2016智能电网发展研讨会论文集[C];2016年

2 高娟;涂立夫;;印证证明模式的反思与重塑——以大数据分析方法引入刑事诉讼事实认定为视角[A];司法体制综合配套改革与刑事审判问题研究——全国法院第30届学术讨论会获奖论文集(下)[C];2019年

3 吴梦洁;林文强;;化妆品感官评价数据分析方法[A];北京日化(2016年第1期 总第122期)[C];2016年

4 顾震;龙亿涛;;具有高准确度的纳米通道智能数据分析方法[A];中国化学会第30届学术年会摘要集-第二分会:分析装置及交叉学科新方法[C];2016年

5 刘红云;张雷;骆方;;多元追踪数据分析方法新进展与应用[A];全国教育与心理统计与测量学术年会暨第八届海峡两岸心理与教育测验学术研讨会论文摘要集[C];2008年

6 郭祥;;极具发展前景的数据挖掘[A];2008年中华临床医学工程及数字医学大会暨中华医学会医学工程学分会第九次学术年会论文集[C];2008年

7 关宏伟;;Snapshots法的一种推广应用[A];中国自动化学会华东六省一市学术年会论文摘要集[C];2018年

8 彭程;耿兵;;大数据在国民经济核算中的应用探讨[A];第十届海峡两岸统计与概率研讨会摘要集[C];2016年

9 于庆涛;周常勇;;实时定量PCR技术应用中的数据分析方法概述[A];庆祝重庆市植物保护学会成立10周年暨植保科技论坛论文集[C];2007年

10 张宁;陈红;;基于ParaWare MOLAP系统的PSC智能数据分析方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

相关重要报纸文章 前4条

1 姚韦阳;江苏省:运用大数据分析方法提升税收征管审计效能[N];中国审计报;2018年

2 记者 张晨晨;期市扩容将为分析师提供绝佳舞台[N];期货日报;2010年

3 王惜纯;北车ERP获评信息化示范工程[N];中国质量报;2010年

4 张昊华;病人满意度调查有了新工具[N];健康报;2007年

相关博士学位论文 前10条

1 蔡立军;基因分类及基因表达数据分析方法的研究[D];湖南大学;2007年

2 范霄文;基于粗糙集的定性数据分析方法研究[D];厦门大学;2008年

3 蔡伟达;证候研究中常用数据分析方法的文献研究及基于隐类模型的抑郁症隐变量分析[D];北京中医药大学;2015年

4 胡宇;函数型数据分析方法研究及其应用[D];东北师范大学;2011年

5 邓稳根;人格测验的项目反应过程与数据分析方法研究[D];江西师范大学;2009年

6 靳刘蕊;函数性数据分析方法及应用研究[D];厦门大学;2008年

7 余心杰;农产品无损检测中的模式识别问题研究[D];浙江大学;2015年

8 吴佳楠;基因表达数据分析方法及其应用研究[D];吉林大学;2013年

9 何彦;微生物组数据分析方法优化及人群肠道菌群分析应用[D];南方医科大学;2017年

10 董媛香;基于软集合的不完备不一致数据分析及决策方法研究[D];重庆大学;2014年

相关硕士学位论文 前10条

1 占萌苹;基于高通量测序数据的跨界sRNA数据分析方法研究[D];吉林大学;2019年

2 杜凝青;基于不同数据分析方法评价老年人穿不同鞋时的行走稳定性[D];北京体育大学;2017年

3 于雪;超饱和试验数据分析方法的系统比较[D];清华大学;2009年

4 田萌;基于数据挖掘的复杂仿真数据分析方法研究[D];哈尔滨工业大学;2010年

5 王静;考虑注水井影响的多井系统生产数据分析方法研究[D];西安石油大学;2012年

6 田华平;上证50指数成分股价量关系研究[D];首都经济贸易大学;2013年

7 孟涛;关于Plackett-Burman饱和设计数据分析方法的比较研究[D];华东师范大学;2008年

8 麻志成;水电机组运行稳定性试验数据分析方法研究及应用[D];华中科技大学;2011年

9 李宏龙;图像认知fMRI数据分析方法的研究与实现[D];大连海事大学;2012年

10 袁宏;fMRI数据分析方法研究[D];电子科技大学;2005年



本文编号:2761288

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/2761288.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fcff1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com