基于子图扩展的抗原表位发现
发布时间:2020-06-12 23:25
【摘要】:子图扩展就是对子图进行重叠聚类的过程,这是为了解决传统聚类算法无法聚出重叠聚簇的缺陷而提出。本文利用网络中子图的结构特征以及子图的点边属性,对传统非重叠图聚类算法的非重叠聚簇进行再扩展,使得最终的聚类结果具有重叠性质。基于以上思路,本文先后提出两个子图扩展模型Glep和GKCE,其中Glep首先通过构建非重叠聚簇的14维图属性特征来近似描述一个子图的结构信息,然后使用词频-逆文本技术来优化这14维特征的权重。最后在经过优化的14维特征基础上,基于14维特征的稳定性完成对非重叠聚簇的重叠扩展。而GKCE不仅利用了子图的结构特征,更进一步地结合了子图的点边属性,通过图核技术分析了扩展过程中子图之间的相似程度,完成对非重叠聚簇的重叠扩展,最终得到具有重叠性质的聚类结果。抗原表位是抗原上被抗体接触的部分氨基酸残基,抗原表位的发现即是定位那些位于抗原链上被抗体链接触的氨基酸残基位置。对于一条抗原链而言,根据其上的抗原表位的数量差异和位置关系这两方面信息,可将抗原表位划分为单个分开,多个分开和多个重叠这三种情况。目前大部分抗原表位预测模型集中在单个抗原表位的预测上,很少有模型能实现对多个分开抗原表位的预测,至于能实现对多个重叠抗原表位预测的模型就更少了。目前的研究已经表明抗原表位在抗原链的空间结构上具有特异性,表面化,聚集性和重叠性这四个特性,这些特性使得目前基于结构的预测模型是抗原表位预测研究领域的热门方向。本文从抗原链上氨基酸残基的结构网络入手,设计了两个重叠子图聚类模型,从不同的角度分析抗原链上的抗原表位,很好地解决目前大多数抗原表位预测模型预测情况单一、预测效果不佳这两大问题。实验结果显示,相比较目前最好的同类模型,本文表现最好的重叠子图聚类模型GKCE的Fl分数平均值在单个抗原表位,多个分开抗原表位和多个重叠抗原表位上有67%,81%,37%的提升。
【图文】:
重原子有多条不同的边连接,如此便只保留一条。经过以上的过程,可以提取每个抗原逡逑链上的氨基酸残基网络,,为了直观观察抗原链上的氨基酸残基网络,现对一个网络规模逡逑较小的抗原链氨基酸残基网络进行可视化,其网络情况看图2-2。逡逑2273-TW逡逑\逦|/NB一逡逑一逦了’逡逑^vT7T2*?-GUI逦233A4BJ逡逑2mw逡逑2X84^逡逑1逦刀',丨逡逑逦^邋^逦逦逦逡逑咖似逦ama逡逑图2-2复合物liqd抗原链C链的氨基酸残基网络逡逑Fig.邋2-2邋Amino邋acid邋network邋of邋complex邋1邋iqd邋antigen邋C邋chain逡逑图2-2中是复合物liqd的抗原链C链上的氨基酸残基网络,网络中每个节点标签由逡逑两部分组成,第一部分表示该氨基酸残基在抗原链上的编号,第二部分指明氨基酸残基逡逑11逡逑
分析子结构的信息,邻居图核分析了节点的周围信息,最终的分类结果是不同图核对子逡逑图在不同方向上分析的综合。逡逑图3-1直观展示了使用多图核机制对重叠聚簇进行分类的过程,从图中我们可以看逡逑出,该分类的过程一共分为三步,第一步是使用包括真实抗原表位在内的数据作为训练逡逑集,用该数据集训练多个图核;第二步是在完成多图核训练后,初步得到对每个图核对逡逑重叠聚簇的分类结果,根据每个图核的分类的效果选择优秀的图核作为投票员;第三步逡逑是使用投票员的“一票决定制”对预测进行投票。总的来说,前面两步是对多图核进行逡逑筛选,这是因为我们不清楚哪些图核能在具体的氨基酸残基网络中起作用,最后一步是逡逑验证该分类机制的准确性。逡逑在分类过程中需要注意的是,对于某个抗原的分类处理时,并不是所有图核都能参逡逑与投票,一个图核在该抗原上的表现必须优秀才可以被选为投票员,所谓足够优秀可以逡逑是图核在该抗原上的分类效果达到一定的比例
【学位授予单位】:广西大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R392;O157.5
本文编号:2710261
【图文】:
重原子有多条不同的边连接,如此便只保留一条。经过以上的过程,可以提取每个抗原逡逑链上的氨基酸残基网络,,为了直观观察抗原链上的氨基酸残基网络,现对一个网络规模逡逑较小的抗原链氨基酸残基网络进行可视化,其网络情况看图2-2。逡逑2273-TW逡逑\逦|/NB一逡逑一逦了’逡逑^vT7T2*?-GUI逦233A4BJ逡逑2mw逡逑2X84^逡逑1逦刀',丨逡逑逦^邋^逦逦逦逡逑咖似逦ama逡逑图2-2复合物liqd抗原链C链的氨基酸残基网络逡逑Fig.邋2-2邋Amino邋acid邋network邋of邋complex邋1邋iqd邋antigen邋C邋chain逡逑图2-2中是复合物liqd的抗原链C链上的氨基酸残基网络,网络中每个节点标签由逡逑两部分组成,第一部分表示该氨基酸残基在抗原链上的编号,第二部分指明氨基酸残基逡逑11逡逑
分析子结构的信息,邻居图核分析了节点的周围信息,最终的分类结果是不同图核对子逡逑图在不同方向上分析的综合。逡逑图3-1直观展示了使用多图核机制对重叠聚簇进行分类的过程,从图中我们可以看逡逑出,该分类的过程一共分为三步,第一步是使用包括真实抗原表位在内的数据作为训练逡逑集,用该数据集训练多个图核;第二步是在完成多图核训练后,初步得到对每个图核对逡逑重叠聚簇的分类结果,根据每个图核的分类的效果选择优秀的图核作为投票员;第三步逡逑是使用投票员的“一票决定制”对预测进行投票。总的来说,前面两步是对多图核进行逡逑筛选,这是因为我们不清楚哪些图核能在具体的氨基酸残基网络中起作用,最后一步是逡逑验证该分类机制的准确性。逡逑在分类过程中需要注意的是,对于某个抗原的分类处理时,并不是所有图核都能参逡逑与投票,一个图核在该抗原上的表现必须优秀才可以被选为投票员,所谓足够优秀可以逡逑是图核在该抗原上的分类效果达到一定的比例
【学位授予单位】:广西大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R392;O157.5
【参考文献】
相关期刊论文 前6条
1 肖梦晴;;个体化癌症疫苗通过黑色素瘤早期试验[J];国际生物制品学杂志;2018年01期
2 胡庆生;雷秀娟;;PPI网络的改进马尔科夫聚类算法[J];计算机科学;2015年07期
3 田浩兵;朱嘉钢;陆晓;;基于特征贡献度加权高斯核函数的粗糙one-class支持向量机[J];计算机科学;2015年06期
4 李淑芳;王芬;;人SFRP1基因及其编码蛋白基本特性及抗原表位的生物信息学分析[J];现代肿瘤医学;2013年05期
5 黄艳新;鲍永利;李玉新;;抗原表位预测的免疫信息学方法研究进展[J];中国免疫学杂志;2008年09期
6 印春生;支海兵;;合成肽ELISA试验中肽抗原序列的筛选[J];中国兽药杂志;2007年03期
本文编号:2710261
本文链接:https://www.wllwen.com/yixuelunwen/jichuyixue/2710261.html