当前位置:主页 > 医学论文 > 内分泌论文 >

基于组合分类算法的蛋白质过敏原预测方法研究和平台开发

发布时间:2017-10-20 16:07

  本文关键词:基于组合分类算法的蛋白质过敏原预测方法研究和平台开发


  更多相关文章: 过敏原预测 氨基酸组成 氨基酸指数 组合分类方法 网上平台


【摘要】:近年来,蛋白质过敏原预测作为一个核心问题被深入讨论,在免疫学领域中占据着十分重要的位置。在传统的生物医学领域,主要使用生物实验或者分析临床病例的方式预测过敏原。然而生物学检测过敏原的方法耗时长、成本高,无法满足对海量蛋白质的预测的需求。随着生物学测序的快速发展,人们已经对大量蛋白质进行了测序,获取了它们的序列信息。在这样的时代背景下,计算生物学思想逐渐成熟起来。先用计算的方法进行过敏原预测,再佐以生物实验技术进行检测和验证是当前过敏原预测的主流方法,将计算预测方法与生物实验技术相结合极大地加快了过敏原预测的速度。已有大量的机构和学者采用计算方法预测蛋白质过敏原。国际食品生物技术委员会和国际生命科学变态反应免疫学研究所提出了用来评价转基因食物中蛋白质致敏性的决策树法,世界卫生组织和联合国粮农组织在此基础上改进了该决策树,并提出了基于序列相似性的蛋白质过敏原预测方法。即如果一个蛋白质序列与某个或某些已知过敏原序列非常相似,那么该蛋白质很可能是过敏原。随后又有学者提出了基于motif的蛋白质过敏原预测方法,并且得到了更好的预测结果。从计算机领域来考虑蛋白质过敏原预测的问题,会发现这是一个典型的二分类问题。如果能够数值化的衡量蛋白质的某些生物化学特征,就可以使用机器学习的方法对其进行分类。广为采用的数值特征包括氨基酸组成、二肽组成和B描述符等,都取得了较好的效果。与此同时,支持向量机和人工神经网络等现有的分类方法,也被应用于蛋白质过敏原预测中。因此,本文采用主成分分析来提取氨基酸指数特征中的主要信息,并将其与氨基酸组成结合起来作为一种新的特征描述符。在大多数情况下,多数人表决的判断结果往往要比一个人的判断更为准确,所以本文尝试在过敏原预测中使用组合分类方法,并期待有更好的预测结果。为了验证本文的想法,本文设计了一个对比实验。本文使用三个特征集合进行实验,包括氨基酸组成、氨基酸指数和两者相结合的特征。使用三种分类算法,包括支持向量机、AdaboostM1和 LogitBoost。每种分类算法分别在每种特征数据集下进行一次十重交叉验证的实验。结果表明,氨基酸组成和氨基酸指数相结合的特征比单独某一项特征包含了更多的信息,LogitBoost算法的预测效果相对支持向量机和AdaboostM1更好。因此,基于组合分类器的过敏原预测方法是可行的,且优于之前的方法。此外,本文建立了一个过敏原预测网上平台,为免疫学和医学研究者提供了过敏原相关信息的查询及下载服务,还包括单条或批量蛋白序列的预测服务等。
【关键词】:过敏原预测 氨基酸组成 氨基酸指数 组合分类方法 网上平台
【学位授予单位】:东北师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.52;R593.1
【目录】:
  • 摘要4-5
  • Abstract5-10
  • 第一章 绪论10-16
  • 1.1 研究背景10-11
  • 1.2 研究意义11-12
  • 1.3 研究现状12-15
  • 1.3.1 过敏原预测研究现状12-14
  • 1.3.2 存在问题和挑战14-15
  • 1.4 本文主要工作和组织结构15-16
  • 1.4.1 主要工作15
  • 1.4.2 章节安排15-16
  • 第二章 蛋白质过敏原预测的理论研究16-24
  • 2.1 过敏原预测基本框架16-19
  • 2.1.1 基于序列对比的过敏原预测16-17
  • 2.1.2 基于特征的过敏原预测方法17-19
  • 2.2 过敏原预测代表方法19-22
  • 2.2.1 WHO/FAO方法19
  • 2.2.2 Motif-based方法19-20
  • 2.2.3 基于指纹描述符的过敏原预测方法20-22
  • 2.2.4 基于支持向量机的方法22
  • 2.3 本章小结22-24
  • 第三章 基于组合分类器的蛋白质过敏原预测方法24-32
  • 3.1 实验数据集24-25
  • 3.2 特征提取25-26
  • 3.3 特征降维26-28
  • 3.3.1 主成分分析26-28
  • 3.3.2 生成特征28
  • 3.4 分类方法28-29
  • 3.4.1 组合分类算法28-29
  • 3.4.2 Boosting29
  • 3.5 交叉验证29-30
  • 3.6 预测算法的评价标准30-31
  • 3.7 本章小结31-32
  • 第四章 对比实验32-36
  • 4.1 实验设备与环境32
  • 4.2 实验设计32
  • 4.3 实验结果与分析32-34
  • 4.3.1 准确率32-33
  • 4.3.2 查全率33-34
  • 4.3.3 F1综合评定指标34
  • 4.4 附加实验34-35
  • 4.5 本章小结35-36
  • 第五章 蛋白质过敏原预测服务平台分析与设计36-50
  • 5.1 可行性研究36
  • 5.2 需求分析36-37
  • 5.3 概要设计37
  • 5.4 详细设计37-40
  • 5.4.1 过敏原信息查询模块37-39
  • 5.4.2 过敏原预测模块39-40
  • 5.5 编码实现40-43
  • 5.5.1 Maven Web APP40-41
  • 5.5.2 数据库长连接41
  • 5.5.3 Spring MVC框架41-42
  • 5.5.4 上传/下载文件42-43
  • 5.5.5 DisplayTag43
  • 5.6 系统测试43-49
  • 5.6.1 软硬件环境测试43
  • 5.6.2 性能测试43-44
  • 5.6.3 功能测试44-49
  • 5.7 本章小结49-50
  • 第六章 总结与展望50-52
  • 6.1 总结50
  • 6.2 展望50-52
  • 参考文献52-54
  • 致谢54

【相似文献】

中国期刊全文数据库 前10条

1 ;国外氨基酸在医药方面的发展动态[J];医药工业;1976年02期

2 张慧云;樊兰芝;;氨基酸输液[J];中原医刊;1992年01期

3 余敦寿;氨基酸在医药及食品产业的发展趋势[J];中国食品卫生杂志;1999年05期

4 杨靖华,汪云松,王琳,赵静峰,李祖强;苦果中氨基酸的含量[J];云南民族学院学报(自然科学版);1999年03期

5 曾文;;氨基酸VS健康[J];现代健康人;2003年09期

6 纪庆芳;;氨基酸医药应用简介[J];氨基酸通讯;1980年01期

7 毕蔚如;;简谈氨基酸输液[J];安徽医学;1986年01期

8 何东;;正常人也需补充氨基酸吗[J];求医问药;2012年05期

9 李文硕;实施联合氨基酸输液[J];天津护理;2003年01期

10 马寿成;;氨基酸并非多多益善[J];家庭科技;2010年04期

中国重要会议论文全文数据库 前6条

1 丁明;李伟;张玉梅;王小莉;赵艾;赵晓慧;王培玉;申海生;;中国北方地区妇女饮食与母乳中氨基酸组成的相关性分析[A];营养与慢性病——中国营养学会第七届理事会青年工作委员会第一次学术交流会议论文集[C];2010年

2 李纪标;史永红;;河北山羊绒纤维结构及氨基酸组成的研究[A];第十次全国电子显微学会议论文集(Ⅰ)[C];1998年

3 向怡卉;苏秀榕;;海参体壁及消化道的氨基酸和脂肪酸分析[A];浙江省生物化学与分子生物学学术交流会论文集[C];2005年

4 赵国琦;贾亚红;陈小连;孙龙生;赵健亚;周为琴;郭玉华;;不同日粮对山羊可吸收氨基酸组成的影响[A];中国畜牧兽医学会动物营养学分会——第九届学术研讨会论文集[C];2004年

5 马万伦;刘茗;刘敏雄;艾晓杰;;ISCA对瘤胃原虫和微生物蛋白质含量及氨基酸组成的影响[A];中国畜牧兽医学会动物营养学分会第六届全国会员代表大会暨第八届学术研讨会论文集(上)[C];2000年

6 赵国芬;敖长金;赵志恭;张宇宏;赵春艳;;沙葱和油料籽实对羊肉中氨基酸组成的影响[A];全国动物生理生化第九次学术交流会论文摘要汇编[C];2006年

中国重要报纸全文数据库 前7条

1 马寿成;氨基酸并非多多益善[N];中国中医药报;2008年

2 ;氨基酸[N];中国畜牧兽医报;2008年

3 本报记者 谢玲;应试生考前“打吊瓶”补充能量不靠谱[N];中国食品报;2012年

4 记者 张晔邋通讯员 罗静;锁定抗艾滋氨基酸“包围圈”在缩小[N];科技日报;2008年

5 成器;青石斑鱼[N];中国畜牧水产报;2000年

6 龚畅;氨基酸断代法古人类考古“新武器”[N];中国石油报;2004年

7 魏风;食素者长寿[N];云南政协报;2000年

中国硕士学位论文全文数据库 前9条

1 陶淑云;龟足白垩腺结构及胶体的初步研究[D];福建师范大学;2015年

2 李园园;白鲢p38 MAPK,c-fos,c-jun基因克隆及其微囊藻毒素暴露后的表达分析[D];河南师范大学;2015年

3 杨祺福;海蜇胶原蛋白的提取及其热稳定性研究[D];大连工业大学;2015年

4 王琳;基于组合分类算法的蛋白质过敏原预测方法研究和平台开发[D];东北师范大学;2016年

5 邓明霞;氨基酸组成对鱼胶原性能的影响研究[D];武汉轻工大学;2016年

6 向其林;基于结构特征与伪氨基酸组成的蛋白质结构类预测研究[D];湖南大学;2012年

7 熊钢;鲫鱼LAT2和PEPT1基因克隆、序列分析及组织表达研究[D];湖南农业大学;2009年

8 代小芳;苹果籽、南瓜籽对团头鲂(Megalobrama amblycephala)生长、部分生理机能、鱼体脂肪酸和氨基酸组成的影响[D];苏州大学;2010年

9 华国洪;鹅TLR2-1、15基因的克隆、组织表达谱分析[D];广东海洋大学;2012年



本文编号:1068078

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/nfm/1068078.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a250a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com