当前位置:主页 > 医学论文 > 药学论文 >

基于序列的蛋白质—药物相互作用预测研究

发布时间:2017-06-09 13:16

  本文关键词:基于序列的蛋白质—药物相互作用预测研究,,由笔耕文化传播整理发布。


【摘要】:蛋白质是生命科学和医药化学中一类重要的有机大分子,蛋白质担负着各种生理功能,是生命活动的重要承担者。因此研究蛋白质与药物之间相互作用机制,对于促进人类健康具有十分重要的意义。蛋白质(Protein)与药物(Drug)相互作用的识别在研究基因组药物过程中起着关键的作用。传统的生物实验方法确定蛋白质与药物相互作用,从时间和费用两个方面来说代价都是昂贵的。因此,利用模式识别技术,直接从蛋白质序列出发预测蛋白质与药物相互作用就成了一项重要的工作。本文提出了一种基于序列的蛋白质-药物相互作用预测方法:从蛋白质序列出发提取了进化信息PSSM_ACT特征和伪氨基酸组成(PseAAC)特征,从药物分子结构出发提取了分子指纹特征,并对分子指纹特征分别进行了离散傅里叶变换和离散小波变换,然后通过特征组合方法将蛋白质特征和药物特征组合为不同蛋白质-药物对向量作为训练样本。在预测阶段,采用基于证据理论K近邻、支持向量机(SVM)和随机森林(Random Forest)计算出每个样本发生相互作用的概率,然后选取适当的阈值判定相互作用对。在两个标准数据集上的留一法验证结果表明,本文基于序列的预测方法在一定程度上提升了预测精度。与iGPCR_Drug、pNN_FGBF、LargeScale、三种常见的预测方法的结果比较表明,本文提出的方法预测性能最优,说明了本文方法的有效性。
【关键词】:相互作用预测 蛋白质-药物对 特征组合 支持向量机 随机森林
【学位授予单位】:南京理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:R96
【目录】:
  • 摘要3-4
  • ABSTRACT4-7
  • 1 绪论7-13
  • 1.1 引言7
  • 1.2 研究背景7-9
  • 1.3 研究意义9-10
  • 1.4 国内外研究概况10-11
  • 1.5 论文主要研究内容11
  • 1.6 本文结构11-13
  • 2 蛋白质-药物相互作用预测概述13-23
  • 2.1 蛋白质结构及其分子组成13-17
  • 2.1.1 蛋白质概述13-15
  • 2.1.2 蛋白质结构层次15-16
  • 2.1.3 蛋白质面向计算机表示方法16-17
  • 2.2 药物概述17
  • 2.2.1 药物基本信息17
  • 2.2.2 药物作用17
  • 2.3 蛋白质与药物相互作用预测研究方法17-21
  • 2.3.1 文本挖掘方法18-19
  • 2.3.2 基于结构的方法19-20
  • 2.3.3 基于序列的方法20-21
  • 2.4 本章小结21-23
  • 3 特征提取及预测模型建立23-38
  • 3.1 蛋白质特征提取23-27
  • 3.1.1 PSSM ACT23-24
  • 3.1.2 PSEAAC24-27
  • 3.2 药物特征提取27-29
  • 3.2.1 药物分子指纹特征提取27-29
  • 3.3 特征组合29-30
  • 3.4 建立预测模型30-34
  • 3.4.1 基于证据理论的K近邻(OET-KNN)30-31
  • 3.4.2 支持向量机(SVM)31-33
  • 3.4.3 随机森林(RF)33-34
  • 3.5 结果评价及验证策略34-36
  • 3.5.1 评价指标34-35
  • 3.5.2 交叉验证35-36
  • 3.5.3 独立测试验证36
  • 3.6 预测框架36-37
  • 3.7 本章小结37-38
  • 4 结果与讨论38-52
  • 4.1 数据集38-39
  • 4.1.1 标准数据集38
  • 4.1.2 独立测试集38-39
  • 4.2 实验参数配置39-42
  • 4.2.1 分类器参数配置39-40
  • 4.2.2 闽值配置40-42
  • 4.3 实验结果及分析42-49
  • 4.3.1 DB1860_GPCR数据集的预测结果42-48
  • 4.3.2 DB258_NR数据集的预测结果48-49
  • 4.4 预测系统设计与实现49-51
  • 4.5 本章小结51-52
  • 5 总结与展望52-54
  • 5.1 工作总结52
  • 5.2 工作展望52-54
  • 致谢54-55
  • 参考文献55-61
  • 附录61

【参考文献】

中国期刊全文数据库 前2条

1 方匡南;吴见彬;朱建平;谢邦昌;;随机森林方法研究综述[J];统计与信息论坛;2011年03期

2 李端;徐红;曾衍霖;;药物吸收速率常数的计算[J];中国药学杂志;1982年06期


  本文关键词:基于序列的蛋白质—药物相互作用预测研究,由笔耕文化传播整理发布。



本文编号:435584

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyaoxuelunwen/435584.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户14074***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com