基于蛋白质序列和深度集成架构的B细胞表位预测研究
发布时间:2021-06-13 15:22
表位是抗原与机体相互作用过程中,刺激机体的免疫系统发生特异性免疫应答的基本单位。B细胞表位是指抗原表面可以被抗体或B细胞受体(BCR)识别、诱导机体产生免疫反应的区域。识别B细胞表位有助于设计能够模拟真正表位结构和功能的分子,并在抗体诊断和治疗中取代它,设计出更加安全的疫苗。研究B细胞表位预测一方面有助于推动基础免疫学的发展,另一方面也有助于疾病的预防与诊断。定位B细胞表位最可靠的方法是实验方法,如X射线晶体学和核磁共振技术,但它们既耗时又昂贵。因此,在生物实验之前,通过计算方法选择的候选表位可以显著降低实验成本,提高工作效率。目前,根据算法输入的数据类型和计算方法所采用的策略,可以将基于计算方法的B细胞表位预测分为三类:一是基于抗原三维结构的B细胞表位预测、二是基于模拟表位的B细胞表位预测,三是基于抗原序列的B细胞表位预测。基于抗原三维结构方法通过从数据库获取的抗原结构的数据,提取与抗原表位相关联的几何属性、理化性质等表位相关的特征,进而通过评分规则或者机器学习方法来预测抗原表位;基于模拟表位信息的预测方法使用来自于噬菌体展示实验中获得的模拟表位序列数据信息,同时还需要抗原的三维结构...
【文章来源】:东北师范大学吉林省 211工程院校 教育部直属院校
【文章页数】:44 页
【学位级别】:硕士
【部分图文】:
YY9在PDB中对应的记录
东北师范大学硕士学位论文132.1.2IEDB数据库IEDB[51]数据库全程是ImmuneEpitopeDatabase,是存储免疫表位信息较全的数据库。IEDB是由NIAIDz(美国国家过敏和传染病研究所)资助建设,该数据库中包含了较为全面的抗原、抗体和表位数据,其中包含人类、非人类的灵长类动物、其他动物,还有一些病毒、细菌的数据。该数据库的URL为http://www.iedb.org,通过该网址可以得到分子间的接触和接触区域的数据,以及相关表位信息数据。IEDB不仅提供搜索功能,还提供抗原表位分析和预测服务,可以对B细胞和T细胞表位的预测和相关分析。该数据库当前包含T细胞表位信息、B细胞表位信息和主要组织相容性复合物配体信息。图2.2展示了复合体1YY9.pdb在IEDB中的记录。图2.21YY9在IEDB数据库中的记录2.1.3CED数据库CED(ConformationalEpitopeDatabase)[52]是收录储存经实验验证的构象性表位相关信息的数据库,网址为http://immunet.cn/ced/。CED数据库是由黄健研究组创建以及维护,当前已经发布了第三版。CED界面简介,层次清楚,用户可以通过数据库中的多个字段实现多条件搜索。CED数据库中包含大量的构象性B细胞表位信息,主要涵盖了表位ID、表位残基构成及其在抗原中的位置、相应的抗原信息、表位性质、对应的抗体信息、实验算法、对应发表的文献PubMedID以及注释信息等字段。我们从中广泛的搜集构象性表位ID、表位残基及其在抗原中的位置、抗原名称和序列等信息,CED的数据查询界面如图2.3所示。
东北师范大学硕士学位论文14图2.3CED数据查询界面示例操作2.1.4AAindex数据库蛋白质的组成包含20种不同的氨基酸,因此在做蛋白质相关研究时,首先想到的特征就是借助氨基酸将蛋白质数值化。AAindex[53]是包含氨基酸指数的一个常用生物信息学数据库,网址为https://www.genome.jp/aaindex/。该数据库有三部分组成:AAindex1、AAindex2和AAindex3。AAindex1包含了已发表的氨基酸指数集合,AAindex2包含了发表的氨基酸突变矩阵的集合,而AAindex3则包含统计的蛋白接触电位。所有数据均来已发表的文献。本文中使用的氨基酸理化性质均来自于AAindex1。目前,AAindex共收集了五百多种氨基酸指数。对于疏水性的其中一条查询结果如下图所示:图2.4AAindex数据库中的一个疏水性指数信息
本文编号:3227783
【文章来源】:东北师范大学吉林省 211工程院校 教育部直属院校
【文章页数】:44 页
【学位级别】:硕士
【部分图文】:
YY9在PDB中对应的记录
东北师范大学硕士学位论文132.1.2IEDB数据库IEDB[51]数据库全程是ImmuneEpitopeDatabase,是存储免疫表位信息较全的数据库。IEDB是由NIAIDz(美国国家过敏和传染病研究所)资助建设,该数据库中包含了较为全面的抗原、抗体和表位数据,其中包含人类、非人类的灵长类动物、其他动物,还有一些病毒、细菌的数据。该数据库的URL为http://www.iedb.org,通过该网址可以得到分子间的接触和接触区域的数据,以及相关表位信息数据。IEDB不仅提供搜索功能,还提供抗原表位分析和预测服务,可以对B细胞和T细胞表位的预测和相关分析。该数据库当前包含T细胞表位信息、B细胞表位信息和主要组织相容性复合物配体信息。图2.2展示了复合体1YY9.pdb在IEDB中的记录。图2.21YY9在IEDB数据库中的记录2.1.3CED数据库CED(ConformationalEpitopeDatabase)[52]是收录储存经实验验证的构象性表位相关信息的数据库,网址为http://immunet.cn/ced/。CED数据库是由黄健研究组创建以及维护,当前已经发布了第三版。CED界面简介,层次清楚,用户可以通过数据库中的多个字段实现多条件搜索。CED数据库中包含大量的构象性B细胞表位信息,主要涵盖了表位ID、表位残基构成及其在抗原中的位置、相应的抗原信息、表位性质、对应的抗体信息、实验算法、对应发表的文献PubMedID以及注释信息等字段。我们从中广泛的搜集构象性表位ID、表位残基及其在抗原中的位置、抗原名称和序列等信息,CED的数据查询界面如图2.3所示。
东北师范大学硕士学位论文14图2.3CED数据查询界面示例操作2.1.4AAindex数据库蛋白质的组成包含20种不同的氨基酸,因此在做蛋白质相关研究时,首先想到的特征就是借助氨基酸将蛋白质数值化。AAindex[53]是包含氨基酸指数的一个常用生物信息学数据库,网址为https://www.genome.jp/aaindex/。该数据库有三部分组成:AAindex1、AAindex2和AAindex3。AAindex1包含了已发表的氨基酸指数集合,AAindex2包含了发表的氨基酸突变矩阵的集合,而AAindex3则包含统计的蛋白接触电位。所有数据均来已发表的文献。本文中使用的氨基酸理化性质均来自于AAindex1。目前,AAindex共收集了五百多种氨基酸指数。对于疏水性的其中一条查询结果如下图所示:图2.4AAindex数据库中的一个疏水性指数信息
本文编号:3227783
本文链接:https://www.wllwen.com/projectlw/swxlw/3227783.html