在细胞免疫中,主要组织相容性复合物(Major histocompatibility complex, MHC)结合抗原多肽并将其提呈至细胞表面从而被T细胞受体(T-cell receptor, TCR)识别。与MHC分子结合并引起T细胞应答的多肽称之为T细胞表位(epitope),是研究免疫系统特异性的重要组件,表位肽的鉴定可以促进防治病毒感染、自身免疫性疾病以及肿瘤等疾病的多肽疫苗的研究和开发。多肽与MHC分子的结合具有高度特异性,是其被T细胞识别的必要条件,然而实验室鉴定MHC分子结合肽是个费时费力的过程;采用计算机预测方法可以大大降低需要合成和检测的多肽的数量,使得抗原表位的大规模筛选成为可能。 人MHC基因称为白细胞抗原(Human leukocyte antigen, HLA),其中多数HLA-Ⅰ类分子根据其结合肽的特异性划分为特定的超型(supertype),与特定HLA分子结合的多肽往往可以与对应超型中多个HLA分子结合,这种泛宿主性的结合多肽称为超型特异性结合肽(supertype specific binders),是开发具有高人群覆盖率疫苗的优先选择对象。然而,每个HLA分子都有自己独特的多肽结合倾向,一条多肽与特定HLA分子结合并不意味着该肽就可以和对应超型中其他HLA分子结合。因此,预测HLA-Ⅰ类分子超型特异性结合肽需要区分多肽与同超型不同HLA分子间的交叉结合能力。同时,理解多肽各位点残基对其与同超型HLA分子交叉结合能力的贡献将为高人群覆盖率疫苗的设计提供重要的参考。 预测模型的建立依赖于可利用的实验数据。在本研究中,我们首先遍历当前互联网上的免疫表位数据库,提取HLA-Ⅰ类分子限制性的多肽结合数据,根据HLA-Ⅰ类分子超型对多肽数据整合,采用多肽与同超型不同HLA分子的交叉结合能力来描述多肽序列,建立了HLA-I类分子超型特异性表位(结合肽)数据库(HLA Supertype Specific Binder Database, HLASSB_DB)。该数据库收录了18157条多肽与同超型HLA分子交叉结合的数据,涵盖了10个HLA-Ⅰ类超型的主要38种等位基因限制性。HLASSB DB提供了三种检索方式:多肽序列检索、超型及其等位基因检索、蛋白序列检索,为基于表位的疫苗设计,尤其是具有高人群覆盖率的疫苗的设计提供参考。 预测模型的性能取决于建模过程中多肽数据的性质,然而当前可用的多肽数据多是不均衡的,因为免疫学家更倾向于鉴定带特定HLA结合基序的候选多肽与对应HLA分子的结合能力。我们在此研究中探索了多肽性质对建模性能的影响。结果显示,采用不均衡多肽数据建立的模型对生物学数据(biological dataset)的预测性能较差(从指定抗原分子中预测特定HLA分子限制性结合肽的能力)。同时我们发现预测模型在预测生物数据和区分含基序多肽时存在冲突:多肽数据中不含超基序的非结合肽(non-motif containing non-binders, NMNs)的存在可以改善预测模型对生物学数据的预测性能却降低了对含基序多肽的预测准确率(区分多肽与同超型HLA分子交叉结合的能力)。目前多数HLA-I类分子可以划分为特定的超型,同超型HLA分子具有相似的结合特异性,为了克服多肽数据带来的负面影响,我们提出一种基于超型(supertype-based)的建模方法:首先采用超基序筛选与同超型中HLA分子结合的候选肽,然后采用含超基序多肽建立的模型预测多肽与超型中特定HLA分子的结合能力。我们分别采用三种基于矩阵和一种基于机器语言的算法建立了A1、A2、A3、A24、B44和B7超型20种等位基因的预测模型,采用标准化数据评估对应模型的性能,结果显示这种基于超型的建模方法可以改善HLA-Ⅰ类分子结合肽预测模型的性能,且对基于分类算法的预测模型具有普适性。 将这种基于超型的建模方法应用于平均相对结合能力矩阵算法mARB (multiplicative Average Relative Binding)中,我们建立了预测和设计HLA超型特异性结合肽的在线工具HLASSB_PreD (Prediction and Design of HLA Supertype Specific Binders)。基于标准化数据的比较研究显示HLASSB_PreD对HLA-I类分子结合肽的预测能力要比一般常用的基于分类算法的预测工具(SVMHC、RANKPEP、YKW)性能好。更重要的是,HLASSB_PreD中同超型尤其是多肽数据比较丰富的A2和A3超型中不同等位基因的预测模型存在收敛的阈值,使得HLASSB_PreD的矩阵模型可以用来分析多肽中各个位点残基对多肽与同超型HLA分子交叉结合贡献,从而来指导HLA超型表位的设计。我们采用HLASSB_PreD中的结合矩阵定义了A2及A3超型的多肽交叉结合基序,并在具有不同交叉结合能力的多肽数据集中得到了验证。为了进一步验证此工具的性能,我们评估了HLASSB_PreD对聚丙氨酸点突变类似物以及表位HBcAg18-27的点突变类似物的预测性能,结果显示HLASSB_PreD对聚丙氨酸点突变类似物结合能力的预测准确率为93%,对表位HBcAg18-27的点突变类似物的预测准确率为100%。此外,我们采用HLASSB_PreD筛选HBV相关抗原HBcAg和HBsAg的A3超型特异性表位,预测得到的5条候选表位经酶联免疫斑点(ELISPOT)实验检测后,证实每条多肽均可以引起两种或两种以上A3超型等位基因限制性的T细胞应答。此结果提示HLASSB_PreD可以有效地从抗原蛋白分子中筛选HLA-Ⅰ类分子超型特异性表位。 HLA分子具有高度多态性,每个编码的HLA分子都识别一系列不同的多肽,而大多数HLA分子的结合多肽的特异性没有得到实验验证。建立只有极少或者没有多肽结合数据的HLA分子结合肽预测模型的方法,又称为pan特异性预测方法,成为此领域的研究热点。Pan特异性预测方法是采用多个HLA分子(来源等位基因)的多肽数据建立不仅可以预测来源等位基因又可以预测只有很少或者没有结合数据的等位基因(目标等位基因)限制性多肽的方法。在本研究中,我们提出了一种基于超型模块(modular)实现pan特异性预测的方法,参考结合肽各个位点残基在对应HLA分子中结合环境的相似性(modular),采用A2和A3超型中已建立的等位基因矩阵模型生成pan特异性预测模型。我们建立的pan特异性预测模型可以分别实现A2超型35种和A3超型37种等位基因限制性多肽的预测。留一(等位基因)交叉验证法的结果显示,当给定的HLA分子只有极少已鉴定的多肽结合数据时,建立的pan特异性预测模型的性能要优于采用自身多肽数据建立的allele特异性模型的性能;应用建立的pan特异性预测模型筛选HBcAg的HLA-A*3303限制性表位,ELISPOT检测结果显示采用此模型预测得到的10条候选表位肽中有7条可以诱导HLA-A*3303阳性的健康人PBMC应答,证实了所建pan特异性模型的有效性。 本研究中提出的方法及结果对如何提高表位预测模型的性能有着重要提示。其中建立的超型特异性表位数据库(HLASSB_DB)和预测工具(HLASSB_PreD)可以通过http://www.immunoinformatic.net访问,且对所有用户免费。相信我们的研究对加速基于表位的疫苗设计和开发,尤其是对具有高人群覆盖率疫苗的设计有重要的推动作用。
【学位单位】:第三军医大学
【学位级别】:博士
【学位年份】:2013
【中图分类】:R392
【文章目录】:缩略语表
Abstract
摘要
第一章 前言
DB'>第二章 HLA-Ⅰ类分子超型特异性表位数据库:HLASSB
DB
2.1 材料与方法
2.2 结果
2.3 讨论
2.4 小结
第三章 采用基于超型的建模方法改进HLA-Ⅰ类分子结合肽预测算法的性能
3.1 材料与方法
3.2 结果
3.3 讨论
3.4 小结
PreD'>第四章 HLA-Ⅰ类分子超型特异性表位预测及设计工具HLASSB
PreD
PreD'> 4.1 基于mARB矩阵的HLA超型表位预测及设计工具HLASSB
PreD
PreD预测性能的实验验证'> 4.2 HLASSB
PreD预测性能的实验验证
4.3 讨论
4.4 小结
第五章 HLA-Ⅰ类分子结合肽的Pan特异性预测方法的建立及初步验证
5.1 HLA-Ⅰ类分子结合肽Pan特异性预测方法的建立
5.2 HLA-Ⅰ类分子结合肽Pan特异性预测模型的初步验证
5.3 讨论
5.4 小结
全文总结
参考文献
文献综述
参考文献
附件
博士研究生期间发表的论文
致谢
【共引文献】
相关期刊论文 前9条
1 林治华,全学军,周跃钢;多肽序列的结构特征与其免疫原性关系的研究[J];重庆工学院学报;2003年01期
2 陈启伟;王永录;;T细胞表位预测及其在抗口蹄疫病毒疫苗研发中的应用研究进展[J];江苏农业科学;2009年06期
3 支轶,吴玉章,万瑛;生物信息学方法在CTL表位预测中的应用[J];免疫学杂志;2005年02期
4 麦璟莹;梁广明;梁雪清;高志岩;马长玲;袁竹青;;肺炎链球菌自溶酶(LytA)蛋白T细胞表位的预测、筛选及确定[J];免疫学杂志;2014年01期
5 郭乐;刘昆梅;秦玉红;李小康;段相国;杨华;徐广贤;奚涛;;rCtUBE的生物信息学分析及其表达优化(英文)[J];中国生物工程杂志;2013年10期
6 ;BiodMHC:an online server for the prediction of MHC class Ⅱ-peptide binding affinity[J];遗传学报;2009年05期
7 邵东华;冯新港;;辅助T细胞表位预测及其在抗寄生虫疫苗研发中的应用[J];中国寄生虫学与寄生虫病杂志;2008年03期
8 林琳;江斌;吴胜会;张世忠;;猪丹毒杆菌SpaA基因的克隆与生物信息学分析[J];中国兽医学报;2013年08期
9 车勇良;陈如敬;王隆柏;江斌;吴学敏;刘玉涛;庄向生;周伦江;;副猪嗜血杆菌神经氨酸酶的克隆测序与生物信息学分析[J];中国兽医学报;2013年09期
相关博士学位论文 前10条
1 林治华;QSAR分析结合实验方法用于T细胞表位快速筛选的研究[D];第三军医大学;2003年
2 曹胜利;血吸虫病多肽疫苗的设计与合成研究[D];北京医科大学;1997年
3 黄兰青;小鼠点突变p53抗原肽的预测及其诱导肽特异性CTL的研究[D];中国协和医科大学;1997年
4 罗进;基于T细胞表位肽的树突细胞介导的靶向性细胞杀伤机制的研究[D];第四军医大学;2008年
5 刘涛;支持向量机方法在T细胞表位预测中的应用[D];大连理工大学;2009年
6 宋哲;PLS方法在T细胞表位预测中的应用[D];大连理工大学;2009年
7 唐帅;Eppin优势表位自组装纳米避孕疫苗的构建及实验研究[D];第三军医大学;2013年
8 李海波;基于多亚单位Th表位的幽门螺杆菌疫苗的研究[D];第三军医大学;2013年
9 陈礼诚;朱鹮基因组BAC文库及MHC基因组精细物理图谱的构建[D];浙江大学;2013年
10 罗铭;酿酒酵母谷氧还蛋白Grx6与七鳃鳗免疫受体VLRB的结构与功能研究[D];中国科学技术大学;2013年
相关硕士学位论文 前10条
1 侯艳霞;H5亚型禽流感病毒NP中鸡MHC限制性CTL表位的预测及鉴定[D];中国农业科学院;2011年
2 陈启伟;口蹄疫A型病毒AF/72株主要B细胞表位的筛选鉴定[D];甘肃农业大学;2010年
3 支轶;基于柔性分子对接的CTL表位预测方法研究[D];第三军医大学;2005年
4 汤旭东;小鼠肝素酶H-2K~b限制性CTL表位的预测、鉴定及其体内抗肿瘤免疫效应研究[D];第三军医大学;2007年
5 陈婷;肝素酶HLA-A2.1限制性CTL表位的预测、鉴定及其抗肿瘤的免疫效应研究[D];第三军医大学;2007年
6 王凤娟;JEV多表位基因重组痘苗病毒安卡拉株(rMVA-mep)及其免疫效果评价[D];南京农业大学;2011年
7 刘泉;日本脑炎病毒多表位基因与法氏囊活性肽的串联表达及其免疫特性研究[D];南京农业大学;2011年
8 侯昕;表达猪繁殖与呼吸综合症病毒多表位肽重组猪痘病毒的构建[D];南京农业大学;2012年
9 杨武晨;幽门螺杆菌尿素酶B亚单位HLA限制性CD4~+T细胞表位的筛选与鉴定[D];第三军医大学;2013年
10 李霞;支持向量回归机在风电场短期风速预测中的应用研究[D];华北电力大学;2013年
本文编号:
2856296