基于蛋白质侧链信息的B细胞表位预测的机器学习方法
发布时间:2017-12-29 02:08
本文关键词:基于蛋白质侧链信息的B细胞表位预测的机器学习方法 出处:《东北师范大学》2012年硕士论文 论文类型:学位论文
更多相关文章: 构象性B细胞表位预测 蛋白质氨基酸侧链信息 机器学习 支持向量机
【摘要】:B细胞表位预测是免疫信息学中非常重要的一个研究方面。B细胞表位是一组有自身特征性的位点,它们分布在抗原表面,依照线性或者构象性的方式排列,从而来引起抗原-抗体的相互绑定、介导体液免疫应答,因此表位的预测对于疫苗的开发和疾病的诊断都具有非常重要的作用。根据结构不同,B细胞表位分为线性表位和构象性表位两种,目前线性B细胞表位预测方面已经取得很多的成绩,,而构象性B细胞表位预测方面的研究则相对缓慢,随着实际应用需求的增加和实验手段的进步,越来越多的研究人员开始专注于构象性B细胞表位的预测研究,一些预测算法和软件相继发布。 本文提出了一种基于划分的策略来进行构象性B细胞表位预测,方法选取抗原的六个基于蛋白质氨基酸侧链信息的表位特征,使用支持向量机的方法对抗原氨基酸进行分类,进而预测可能的表位。该方法的有效性在161条包含了抗原-抗体复合体结构的数据集以及非复合体的抗原数据集上得到验证,使用非复合体的抗原数据集,算法预测的准确性可以达到:敏感性53.6%、准确性20.5%、曲线下面积(AUC)的值为0.627;对于复合体结构的数据集,算法的AUC值下降到0.609,但是在敏感性、准确性上略有提高。本文预测结果与EPCES进行比较发现,预测性能较高于EPCES,这个结果说明了结合机器学习和特征选择的方法进行表位预测是有效的;另一方面,方法整体预测性能仍然不能令人满意,还有待建立更全面的表位和非表位数据集、寻找或结合更多更有效的表位特征、开发更有效的算法来进一步提高预测性能。
[Abstract]:......
【学位授予单位】:东北师范大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:R392
【参考文献】
相关期刊论文 前1条
1 刘胥影;吴建鑫;周志华;;一种基于级联模型的类别不平衡数据分类方法[J];南京大学学报(自然科学版);2006年02期
本文编号:1348352
本文链接:https://www.wllwen.com/xiyixuelunwen/1348352.html
最近更新
教材专著