基于mRNA等融合特征的单定位和多定位细胞凋亡蛋白质亚细胞定位预测
发布时间:2019-10-08 00:03
【摘要】:随着生物信息学的飞速发展,出现了大量的未知功能的蛋白质序列,其中细胞凋亡蛋白质得到研究人员越来越多的关注。在生命体中,细胞凋亡蛋白质的异常可能导致多种疾病的发生。这些蛋白质的功能与它们在细胞中的位置紧密相关,因此,准确的预测出细胞凋亡蛋白质的亚细胞位置能更好的了解其功能。本文构建了新的细胞凋亡蛋白质数据集,其中包含单定位数据集、多定位数据集以及以单定位为标准的含mRNA信息的mRNA-蛋白质数据集。在单定位预测中,通过特征筛选提取了氨基酸物理化学特性、氨基酸粘性特征和进化信息,并结合了两种mRNA信息:三阅读框3-mer mRNA序列频数信息、mRNA二级结构-序列模式信息,最后将各特征信息融合,利用支持向量机的算法,对四种不同亚细胞位置的细胞凋亡蛋白质进行预测。研究发现融合mRNA信息后预测效果更佳,在Jackknife检验下预测总精度达到82.18%,且独立测试集预测总精度达到78.26%。结果表明,mRNA的序列和结构特性有助于提高细胞凋亡蛋白质的亚细胞定位预测精度。多定位预测中,考虑到序列相似性对预测的影响,采用CD-HIT软件将单定位与多定位数据集的序列相似性降至80%以下,筛选出氨基酸二肽组分信息、蛋白质骨架信息、氨基酸物理化学特性和进化信息作为特征参数,采用离散增量的算法对多定位细胞凋亡蛋白质进行预测,融合特征的总体位置准确率能达到 79.57%。
【学位授予单位】:内蒙古大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:Q26
本文编号:2545990
【学位授予单位】:内蒙古大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:Q26
【参考文献】
相关期刊论文 前2条
1 韩国胜;喻祖国;Anh Vo;;Predicting the subcellular location of apoptosis proteins based on recurrence quantification analysis and the Hilbert Huang transform[J];Chinese Physics B;2011年10期
2 屈二军;胡建业;陈兰英;;细胞凋亡与疾病研究进展[J];临床和实验医学杂志;2008年08期
,本文编号:2545990
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/2545990.html