基于高通量RNA-seq数据的水稻亚种特异性编码基因鉴定及长非编码RNA识别
本文选题:水稻 切入点:转录组 出处:《华中农业大学》2017年硕士论文 论文类型:学位论文
【摘要】:水稻是世界上最重要的粮食作物之一,同时也是禾本科植物研究的重要模式物种。RNA-seq技术可以得到生物体在特定时期特定组织中全部的转录本,这使得我们可以从转录组的分析中挖掘出新转录本以及新基因。本文试图从不同品种、不同组织的水稻转录组数据中挖掘粳稻日本晴和籼稻MH63、ZS97参考基因组上不存在的新转录本和新基因,尽可能全面地补充水稻的注释信息。本文采用先组装后比对的策略,通过对NCBI数据库中2012年1月-2016年4月发表的共960个样本的亚洲栽培水稻(Oryza sativa)RNA-seq数据,分籼稻(indica)、粳稻(japonica)两个亚种进行de novo组装,得到28,352条籼稻及50,648条粳稻转录本。其中籼稻有6,939条新转录本、粳稻有11,875条新转录本均未比对到水稻日本晴、MH63以及ZS97参考基因组。通过对籼、粳转录本进行相互比对,发现仅有5.1%的籼稻转录本与3%的粳稻转录本相互间有大于60%的重叠区域,这说明绝大多数的新转录本具有亚种特异性。通过开放阅读框预测及与蛋白质非冗余数据库(nr库)进行同源序列比对,从新转录本中分别预测得到3,794条籼稻及6,181条粳稻高可信度蛋白编码序列。通过对其进行功能注释,3,380条(89.1%)籼稻及5,314条(86%)粳稻蛋白编码序列可在Pfam数据库中得到比对注释,1,648条(43.4%)籼稻及2,494条(40.3%)粳稻蛋白编码序列可通过KOG注释到23个蛋白功能分类中。2,489(65.6%)条籼稻及3,795条(61.4%)粳稻蛋白编码序列有GO注释结果。715条(18.8%)籼稻及1,046条(17.0%)粳稻蛋白编码序列在KEGG代谢途径分析中得到注释。并且发现大量基因参与水稻抗病及非生物胁迫响应过程。进一步分析籼、粳稻蛋白编码基因的同源基因家族发现,2,057条(54.2%)籼稻及4,404条(71.3%)粳稻蛋白编码基因是亚种特有的。另一方面,通过对籼、粳转录本组装结果进行编码能力预测及蛋白质同源序列比对的综合策略,预测得到16,600条长非编码RNA,为水稻长非编码RNA的分析提供基础。
[Abstract]:Rice is one of the most important food crops in the world, and it is also an important model species of gramineous plants. RNA-seq technology can obtain all transcripts of organisms in specific tissues at a given time. This allows us to extract new transcripts and new genes from transcriptome analysis. The new transcripts and new genes that do not exist in the reference genome of japonica rice MH63HZS97 were excavated from rice transcriptome data of different tissues, and the annotated information of rice was supplemented as comprehensively as possible. Two subspecies of indica indica (indica indica) and japonica (japonica) were assembled by de novo from 960 Asian cultivated rice (Oryza sativa)RNA-seq) data published in NCBI database from January 2012 to April 2016, and the two subspecies were divided into two subspecies: indica indica (Indica indica) and japonica (japonica). 28,352 indica and 50,648 japonica transcripts were obtained, of which 6,939 were new transcripts in indica rice and 11,875 in japonica rice. It was found that only 5.1% indica rice transcripts and 3% japonica rice transcripts had overlapping regions greater than 60%. This indicates that most of the new transcripts are subspecies specific. From the new transcripts, 3,794 indica rice and 6,181 japonica rice high-reliability protein coding sequences were predicted. The protein coding sequences of indica rice and 5,314 japonica rice can be compared in Pfam database by means of functional annotation of 3,794 indica rice and 5,314 japonica rice protein coding sequences. The protein coding sequence of indica rice and 2,494 japonica rice can be annotated into 23 functional classification of protein by KOG. The protein coding sequences of indica rice and 3,795 rice varieties have go annotated result .715 18.8) indica rice protein coding sequence and 1,046 japonica rice protein protein coding sequence can be divided into 17. 0% japonica rice. The coding sequence was annotated in the analysis of KEGG metabolic pathway, and a large number of genes were found to be involved in the response of rice to disease resistance and abiotic stress. The homologous gene family of protein coding genes of japonica rice has found that the protein coding genes of Indica rice and 4,404 japonica rice are endemic to subspecies, on the other hand, through the analysis of indica rice, The coding ability of japonica transcripts was predicted and the integrated strategy of protein homologous sequence alignment was used to predict 16,600 long non-coding RNAs, which provided the basis for the analysis of rice long non-coding RNA.
【学位授予单位】:华中农业大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:S511
【相似文献】
相关期刊论文 前10条
1 陆家训;绘制水稻基因图[J];河南科技;2000年07期
2 ;中国首先向世界公布水稻基因图[J];中国稻米;2002年03期
3 江泽民;在国际水稻大会上的讲话[J];中国稻米;2002年06期
4 ;我国科学家“解读”水稻基因[J];发明与革新;2002年06期
5 ;我国率先破译水稻基因 解决全球一半人吃饭问题[J];国土经济;2002年05期
6 ;水稻基因竟然比人的基因还多[J];科技广场;2002年05期
7 平;用中国水稻养活全世界[J];南方农村;2002年04期
8 道吉;首届国际水稻大会在京召开[J];南京农专学报;2002年03期
9 ;我国科学家“鸟枪”搞定水稻基因[J];农家之友;2002年05期
10 ;水稻基因“精细图”让中国农业吃了“定心丸”[J];江西农业科技;2003年01期
相关会议论文 前10条
1 赵基洪;;水稻与菰属间性状转移研究[A];新世纪 新机遇 新挑战——知识创新和高新技术产业发展(下册)[C];2001年
2 张国良;陈文军;戴其根;许轲;霍中洋;张洪程;;水稻耐1,2,,4-三氯苯胁迫基因型的筛选[A];中国作物学会栽培专业委员会换届暨学术研讨会论文集[C];2007年
3 裴忠有;;水稻T—DNA插入群体的建立及突变体筛选[A];2008中国作物学会学术年会论文摘要集[C];2008年
4 张桂权;丁效华;曾瑞珍;张泽民;李文涛;陈兆贵;刘冠明;何风华;AkshayTulukdar;刘芳;席章营;黄朝锋;朱文银;易懋升;秦利军;施军琼;赵芳明;冯明姬;单泽林;陈岚;郭晓琴;JaiChandRana;;水稻功能基因组学材料平台的建立[A];中国的遗传学研究——中国遗传学会第七次代表大会暨学术讨论会论文摘要汇编[C];2003年
5 王景余;孙海波;李艳萍;邹美智;;水稻遗传转化研究及应用进展[A];中国农业生物技术学会第三届会员代表大会暨学术交流会论文摘要集[C];2006年
6 姬生栋;秦广雍;耿飒;盛有名;薛华政;吴刘成;徐存拴;霍裕平;;离子束介导玉米基因组DNA的水稻后代遗传性状研究[A];全国作物生物技术与诱变技术学术研讨会论文摘要集[C];2005年
7 李阳生;朱英国;;水稻设计育种[A];中国的遗传学研究——中国遗传学会第七次代表大会暨学术讨论会论文摘要汇编[C];2003年
8 罗彦长;王守海;;分子标记辅助水稻抗病虫育种进展[A];现代农业理论与实践——安徽现代农业博士科技论坛论文集[C];2007年
9 沈辉;王宗阳;;水稻OsEBP89基因启动子的功能分析[A];中国植物生理学会全国学术年会暨成立40周年庆祝大会学术论文摘要汇编[C];2003年
10 陈石燕;王宗阳;;T-DNA介导的promoter trap系统[A];中国植物生理学会第九次全国会议论文摘要汇编[C];2004年
相关重要报纸文章 前10条
1 ;日本破译3.2万个水稻基因[N];今日信息报;2003年
2 田耕;水稻基因组图谱带来希望与困惑[N];大众科技报;2002年
3 本报记者 徐玲玲;杨焕明:评说水稻“基因大战”[N];科技日报;2001年
4 本报驻美国记者 王如君;水稻基因研究里程碑(科技大观)[N];人民日报;2002年
5 杨健、蒋建科;水稻基因“天书”被打开[N];人民日报;2005年
6 通讯员 娄沂春 记者 马瑛瑛;浙大成功开发大容量水稻基因芯片[N];浙江日报;2001年
7 记者 韩晓玲、通讯员 王景刚;水稻基因研究获突破性进展 将全面提升我国水稻国际竞争力[N];湖北日报;2006年
8 邓肯;永久保护世界水稻资源协议签订[N];科技日报;2007年
9 徐瑞哲;沪苏皖育出“软糯”水稻新品种[N];农民日报;2006年
10 刘新萍;高个水稻具有玉米特性[N];江苏科技报;2007年
相关博士学位论文 前10条
1 曾p瑶;基于小鼠15个组织RNA-seq数据的全基因组重注释[D];中国科学院北京基因组研究所;2015年
2 王兆海;水稻类病变相关基因SPL29的克隆和功能研究[D];武汉大学;2014年
3 杨慧;水稻精氨酸酶基因启动子表达模式及精氨酸酶基因的功能研究[D];中国农业科学院;2014年
4 李万昌;2个水稻苗期失绿叶基因的图位克隆[D];中国农业科学院;2013年
5 陈隽;水稻穗型与粒型调控基因FUWA的图位克隆与功能分析[D];中国农业科学院;2015年
6 黄立钰;水稻抗旱比较转录组学分析及候选基因OsDRAP1功能验证[D];中国农业科学院;2014年
7 刘小云;水稻H3K27甲基转移酶基因的功能研究[D];华中农业大学;2014年
8 崔迪;粳稻抗逆性关联分析及云南农家保护水稻地方品种遗传多样性的历时变化[D];中国农业科学院;2015年
9 崔彦茹;利用选择育种群体进行水稻高产、抗旱和耐盐QTL定位[D];中国农业科学院;2015年
10 陈伟;水稻代谢组的生化及遗传基础研究[D];华中农业大学;2015年
相关硕士学位论文 前10条
1 安s
本文编号:1592285
本文链接:https://www.wllwen.com/shoufeilunwen/zaizhiyanjiusheng/1592285.html