当前位置:主页 > 理工论文 > 生物学论文 >

GM12878细胞系CTCF活性结合位点的预测

发布时间:2021-06-11 17:51
  转录因子的结合能够影响下游目标基因在特定时间、空间的转录和表达.转录因子结合具有细胞特异性,受到染色质开放特征、多种组蛋白修饰以及其他转录因子结合等多种因素影响.以GM12878细胞系为研究对象,构建了CTCF活性结合位点数据集(正集,876个位点)与非活性结合位点数据集(对照组,负集,231130个位点)。根据DNase-seq、H3k4me2、H4k20me1、H3K4me3、H3K27me3、H3K9me3、H3K9ac、RAD21、SMC3这九种特征,分别利用支持向量机(SVM,Jackknife检验)和随机森林(RF,5-fold交叉验证)这两种方法,对CTCF的活性结合位点进行预测,九种特征融合的预测准确度分别达到93.87%和94.46%,平均预测的准确度分别是94.78%和95.40%。结果显示,这九种特征对GM12878细胞系转录因子CTCF的结合具有重要的调控作用,而SMC3的结合对CTCF结合的调控尤为重要。 

【文章来源】:内蒙古大学学报(自然科学版). 2020,51(02)北大核心

【文章页数】:7 页

【部分图文】:

GM12878细胞系CTCF活性结合位点的预测


GM12878细胞系CTCF结合的活性位点数据集与非活性数据集的构建流程

准确度,特征组,方法,特征融合


表2中两种预测方法得到的结果均显示,第13组九种特征融合在一起时,预测准确度最高;单独采用H3K27me3(第5组)特征时,AccRF是61.67%,AccSVM是53.41%,两种方法的预测准确度都是最低的,这也可以从图2(a)中最低点看出,此组特征值差异小,SVM不能很好地区分同时此组得到的敏感性也是最低且两种预测方法得到的敏感性差异最大,SVM与RF得到的敏感性分别为5.71%和59.29%,后者高出前者53.38%,而其他组敏感性差异都远远小于此组。不采用特征融合,利用单一特征对活性位点进行预测时,九种特征中单独采用SMC3时预测准确度最高,AccSVM是91.9%,AccRF是90.67%,单独采用RAD21的预测准确度仅次于单独采用SMC3,AccSVM是88.59%,AccRF是88.06%。表中还显示第8、11、12、13、15组的预测准确度都在90%以上,只有第15组是采用单个特征SMC3预测,第8组与11组都采用了SMC3与RAD21进行预测,因此对此次预测最至关重要的特征是转录因子SMC3,其次是RAD21,这一结果也印证了转录因子组合Rad21+SMC3+CTCF具有极强的相关性。应用九种特征融合,将负集样本分成100组,进行100次预测,并求取平均值SVM方法的Sn、Sp、Acc、MCC分别为87.35%、97.61%、94.78%、86.74%;RF方法的Sn、Sp、Acc、MCC依次为90.26%、97.34%、95.40%、88.37%,RF四种评价指标的结果除特异性均高于SVM,RF的平均预测准确度仅比SVM高出0.62%。

折线图,线图,准确度,折线图


应用九种特征融合,将负集样本分成100组,进行100次预测,并求取平均值SVM方法的Sn、Sp、Acc、MCC分别为87.35%、97.61%、94.78%、86.74%;RF方法的Sn、Sp、Acc、MCC依次为90.26%、97.34%、95.40%、88.37%,RF四种评价指标的结果除特异性均高于SVM,RF的平均预测准确度仅比SVM高出0.62%。图3(a)的箱线图,显示了SVM与RF方法100次预测结果四种评价指标的分布情况,对于SVM的分布情况而言:四个评价指标(敏感性、特异性、Acc、MCC)的大部分数据都在箱线图内,少部分异常值均为100次预测结果的较大值与较小值。图3(a)中还显示了RF的Sn、Acc、MCC的箱线图中值分布均明显高于SVM,而Sp中值略低于SVM,与平均值的结果一致。

【参考文献】:
期刊论文
[1]Systematic identification and annotation of multiple-variant compound effects at transcription factor binding sites in human genome[J]. Si-Jin Cheng,Shuai Jiang,Fang-Yuan Shi,Yang Ding,Ge Gao.  Journal of Genetics and Genomics. 2018(07)
[2]转录因子和组蛋白修饰的分布特征[J]. 薛高高,张利绒,闫甜甜,刘俊杰.  内蒙古大学学报(自然科学版). 2016(04)



本文编号:3225004

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/3225004.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户20634***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com