基于序列的RNA甲基化修饰位点预测研究
[Abstract]:Posttranscriptional modification of RNA is widespread in organisms and plays an important role in many biological processes. RNA methylation is an important branch of RNA posttranscriptional modification. RNA methylation refers to the methylation of RNA on some nucleotide molecules, including N6-methyladenosine N1-methyladenosine. Recent studies have shown that RNA methylation can affect the transcription, metabolism, splicing and stability of RNA, and can bind to related proteins to regulate gene expression. And RNA methylation is also associated with diseases such as cancer, obesity, and so on. Therefore, accurate identification of RNA methylation sites from RNA sequences is an important task. Traditional methods based on physicochemical experiments to identify RNA methylation sites are costly, time-consuming and small. In recent years, high-throughput sequencing methods can be used to identify RNA methylation sites on a large scale, but their essence is still based on biochemical experiments. Therefore, it is necessary to design a RNA methylation modification site prediction method based on machine learning theory. In this paper, the prediction of RNA methylation modification sites based on sequences is studied. The main work is as follows: (1) the basic properties of RNA are studied, and a new feature extraction method for RNA sequences is proposed. The idea of position specific preference has been successfully applied to the prediction of protein modified sites. Inspired by this, the idea of location-specific preference is applied to RNA sequences, and a location-specific nucleotide / dinucleotide preference feature is proposed for feature extraction of RNA sequences. Using statistical method, this idea calculates the occurrence frequency of each nucleotide in each position in the sequence of positive and negative sample sets, and encodes the features by using the difference between positive and negative samples. The experimental results show that this feature extraction method can further improve the accuracy of N6-methyladenosine site prediction. (2) Sequence-based prediction of N6-methyladenosine sites is studied. A prediction method called TargetM6A. TargetM6A is proposed to extract the RNA sequence by using the location-specific nucleotide / dinucleotide preference feature and combining with the traditional nucleotide component characteristics. Incremental feature selection method is used to screen the extracted features to select the more discriminant subset of feature components. Finally support vector machine algorithm is used to train the prediction model. The experimental results show that compared with the existing sequence-based prediction methods for N6-methyladenosine sites, The TargetM6A method proposed in this paper obtains better prediction results on the datum data set. (3) the prediction problem of N1-methyladenosine sites based on sequence is studied, and a prediction method called TargetM1A is proposed. According to the newly released experimental data of N1-methyladenosine, the data were processed and sampled. Three data sets based on N1-methyladenosine locus and six histiocyte-based data sets were constructed. TargetM1A method was used to extract several RNA sequence-based features. Using the LRT algorithm as the classifier. TargetM1A method has achieved good performance in the cross-validation experiments based on the prediction model based on species and tissue cells. It is a useful supplementary tool for the existing experiment-based methods to study N1-methyladenosine sites. (4) both the proposed TargetM6A and TargetM1A methods provide online predictive services for free use by other researchers.
【学位授予单位】:南京理工大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:Q811.4
【相似文献】
相关期刊论文 前10条
1 刘静;A Novel Vector for Abundant Expression of Antisense RNA, Triplex forming RNA and Ribozyme in vivo[J];High Technology Letters;2000年04期
2 鲁慧英;Detection of hepatitis C virus RNA sequences in cholangiocarcinomas in Chinese and American patients[J];Chinese Medical Journal;2000年12期
3 梁小兵 ,万国江 ,黄荣贵;Distribution and Variation of Ribonucleic Acid (RNA) and Protein and Its Hydrolysis Products in Lake Sediments[J];Chinese Journal of Geochemistry;2002年02期
4 Verheyden B ,徐其武;口服脊髓灰质炎疫苗核壳和RNA的稳定性[J];国外医学.预防.诊断.治疗用生物制品分册;2002年01期
5 CMBE译文组;探索小RNA的功能[J];现代临床医学生物工程学杂志;2004年03期
6 沈维干;RNA interference and its current application in mammals[J];Chinese Medical Journal;2004年07期
7 孙娣;汪洋;张丽娟;闫玉清;;一种简捷提取植物总RNA的方法[J];黑龙江医药;2005年06期
8 南海波;;小麦总RNA的提取[J];渤海大学学报(自然科学版);2006年01期
9 王冬来;;RNA干扰的成功与困惑[J];中国生物化学与分子生物学报;2008年06期
10 杨静;;试验性的小RNA药物可能引发失明[J];中国生物化学与分子生物学报;2009年05期
相关会议论文 前10条
1 金由辛;;面向21世纪的RNA研究[A];面向21世纪的科技进步与社会经济发展(下册)[C];1999年
2 ;第四届RNA全国研讨会大会报告日程安排[A];第四届全国RNA进展研讨会论文集[C];2005年
3 ;Function of Transfer RNA Modifications in Plant Development[A];植物分子生物学与现代农业——全国植物生物学研讨会论文摘要集[C];2010年
4 王峰;张秋平;陈金湘;;棉花总RNA的快速提取方法[A];中国棉花学会2011年年会论文汇编[C];2011年
5 关力;陈本iY;iJ云虹;郭培芝;魏重琴;邱苏吾;苗健;;关于动物}D~T中RNAn,定方法的研究[A];中国生理科学会学术会议论文摘要汇编(生物化学)[C];1964年
6 夏海滨;;小RNA在免疫学领域中的应用研究进展[A];中国免疫学会第五届全国代表大会暨学术会议论文摘要[C];2006年
7 ;The stability of hepatitis C virus RNA in various handling and storage conditions[A];中国输血协会第四届输血大会论文集[C];2006年
8 郭德银;;RNA干扰在病毒研究和控制中的应用[A];2006中国微生物学会第九次全国会员代表大会暨学术年会论文摘要集[C];2006年
9 甘仪梅;杨业华;王学奎;曹燕;杨特武;;棉花总RNA快速提取[A];中国棉花学会2007年年会论文汇编[C];2007年
10 ;Identification and characterization of novel interactive partner proteins for PCBP1 that is a RNA-binding protein[A];中国优生优育协会第四届全国学术论文报告会暨基因科学高峰论坛论文专辑[C];2008年
相关重要报纸文章 前10条
1 记者 冯卫东;研究人员发现可破坏肿瘤抑制基因的小RNA[N];科技日报;2009年
2 记者 储笑抒 通讯员 盛伟;人体微小RNA有望提前发出癌症预警[N];南京日报;2011年
3 泸州医学院副教授、科普作家 周志远;“大头儿子”与环状RNA[N];第一财经日报;2014年
4 麦迪信;小分子RNA可能有大作用[N];医药经济报;2003年
5 董映璧;美发现基因调控可回应“RNA世界”[N];科技日报;2006年
6 张忠霞;特制RNA轻推一下,就能“唤醒”基因[N];新华每日电讯;2007年
7 聂翠蓉;RNA:纵是配角也精彩[N];科技日报;2009年
8 冯卫东;RNA干扰机制首次在人体中获得证实[N];科技日报;2010年
9 冯卫东 王小龙;英在地球早期环境模拟条件下合成类RNA[N];科技日报;2009年
10 记者 常丽君;新技术让研究进入单细胞内RNA的世界[N];科技日报;2011年
相关博士学位论文 前10条
1 王赵玮;昆虫RNA病毒复制及昆虫抗病毒天然免疫机制研究[D];武汉大学;2014年
2 包纯;一类新非编码RNA的发现以及产生和功能的初探[D];华中师范大学;2015年
3 李语丽;基于MeRIP-seq的水稻RNA m6A甲基化修饰的研究[D];中国科学院北京基因组研究所;2015年
4 熊瑜琳;miR-122靶位基因STAT3调控长链非编码 RNA Lethe促进HCV复制的机制研究[D];第三军医大学;2015年
5 范春节;高通量测序鉴定毛竹小RNA及其功能分析[D];中国林业科学研究院;2012年
6 王加强;小鼠着床前胚胎特异ERV相关长非编码RNA的定向筛选及功能研究[D];东北农业大学;2015年
7 王业伟;非编码RNA SPIU的结构和功能研究和p19INK4D在APL发病中的作用[D];上海交通大学;2013年
8 邹艳芬;子痫前期中非编码RNA对滋养细胞功能的调控及机制探索[D];南京医科大学;2015年
9 朱乔;miR-10b在人肝细胞肝癌发生中的作用及其机制的初步探索[D];第四军医大学;2015年
10 蒋俊锋;长链非编码RNA BACE1-AS促进Aβ聚集及其调节BACE1和SERF1a的ceRNA机制研究[D];第二军医大学;2015年
相关硕士学位论文 前10条
1 陆聪儿;条纹斑竹鲨再生肝脏中差异RNA的研究[D];浙江理工大学;2015年
2 张晓辉;小鼠几种长链非编码RNA基因功能的初步研究[D];昆明理工大学;2015年
3 全弘扬;长链非编码RNA在细胞内质网应激反应中的相关作用及机制研究[D];北京协和医学院;2015年
4 胡亮;DDX19A识别PRRSV基因组RNA并激活NLRP3炎症小体[D];中国农业科学院;2015年
5 张帅兵;应用RNA干扰技术对旋毛虫Nudix水解酶基因功能的研究[D];郑州大学;2015年
6 郑芳芳;肺癌RNA-Seq数据中RNA编辑事件的识别算法和系统分析[D];苏州大学;2015年
7 陈瑞东;长链非编码RNA MEG3在胰腺癌发生发展中作用的实验研究[D];苏州大学;2015年
8 刘骏武;线虫和水稻中环状RNA的预测及分析[D];华中农业大学;2015年
9 李猷;利用RNA干扰技术提高番茄抗TMV侵染能力的研究[D];牡丹江师范学院;2015年
10 吴术盛;SVCV感染EPC细胞microRNA表达谱的初步研究[D];华中农业大学;2015年
,本文编号:2148287
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/2148287.html