支持向量机在基因核心启动子识别中的应用研究
发布时间:2017-09-08 23:46
本文关键词:支持向量机在基因核心启动子识别中的应用研究
【摘要】:核心启动子是DNA转录起始位上游一段可以与引发转录但又不被转录的关键序列。目前启动子预测已经有许多的研究,但预测的准确程度仍有待提高。支持向量机是主要用于分类的一种机器学习方法,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势。本研究采用支持向量机的机器学习方法,以多聚体词频统计和核酸序列正交编码两种特征提取方式,使用公共数据库提供的测试数据,对若干包括启动子和非启动子的大量核酸样本序列进行启动子识别和10折的交叉校验研究,发现核酸序列正交编码方式预测的准确率优于多聚体方式,而支持向量机的四种核函数中RBF核函数预测的准确性最高。研究还发现采用不同的序列长度(起始从-249到-100),预测准确度都接近,反映启动子与非启动子的核酸序列模式差异主要位于转录起始位上游-100到下游+50这段区间内,启动子序列中碱基G和C出现的频率显著性高于A和T,而非启动子正好相反。
【作者单位】: 咸阳职业技术学院;西安交通大学;
【关键词】: 核心启动子 支持向量机 识别
【基金】:国家自然科学基金项目《基因调控序列的信息学识别及若干肿瘤相关基因调控序列的确定》(60601017)资助
【分类号】:Q811.4
【正文快照】: Research on Application of Support Vector Machine in the Identification ofGene Core PromoterLi Hongbin1,2*He Guangzhong1Wu Xiaoming21 Xianyang Vocational and Technical College,Xianyang,712000;2 Xi'an Jiaotong University Xi'an,710049*Corresponding author,
【相似文献】
中国期刊全文数据库 前10条
1 张忠东;成军;钟彦伟;杨倩;董菁;杨艳杰;张树林;;羧肽酶N调节乙型肝炎病毒核心启动子表达活性的研究[J];世界华人消化杂志;2003年08期
2 侯婧逸;李华;康亚妮;孙洁林;;裂殖酵母核心启动子结构的初步研究[J];核技术;2013年03期
3 彭R,
本文编号:817051
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/817051.html
最近更新
教材专著