当前位置:主页 > 医学论文 > 军医论文 >

生物小分子与通路相互作用预测方法研究

发布时间:2017-05-26 12:06

  本文关键词:生物小分子与通路相互作用预测方法研究,,由笔耕文化传播整理发布。


【摘要】:药物研发是一个漫长而复杂的过程,除了挖掘生物小分子与靶蛋白之间的关系外,更重要的是找到生物小分子在组织内发挥作用的代谢或传导途径,即挖掘小分子与全局生理过程之间的潜在作用关系。由于传统的实验方法受到实验条件和成本等很多方面的限制,难以对生物小分子与通路之间的相互作用关系进行全面的研究,而有效的机器学习方法恰好能弥补这些方面的不足。本文以生物小分子(包括药物和化合物)和通路为研究对象,通过挖掘各类生物知识,预测生物小分子与通路之间的相互作用关系,为临床实验提供有价值的信息。主要内容如下:1.基于多特征整合方法,预测KEGG数据库中与癌症相关的通路和药物之间的相互作用关系。具体来讲是将化学结构空间信息,药物的官能团信息整合构成药物特征谱;将与通路关联的基因信息(包括基于NCI-60实验中的基因表达数据的平均值和方差值,基因本体语义信息)整合构成通路特征谱;同时在特征谱中加入药物-通路相互作用网络拓扑信息。文章选择三种半监督学习算法对药物-通路相互作用进行预测,实验结果证明特征整合是有效的,并且有一些潜在的药物-通路相互作用在权威的数据库中能够得到验证。2.基于改进的旋转森林算法预测化合物与通路之间的相互作用关系。本章拓宽研究范围,以cMap数据库中的基因为依据筛选出78条通路,并从实验使用的1309个化合物小分子中筛选出147个化合物,构建得到化合物-通路相互作用数据集。特征构建相比之前也更有针对性,使用基于该实验的基因微阵列数据计算化合物和通路特征谱。我们对传统的旋转森林集成学习算法进行改进,选择Relief算法作为特征旋转算法,基于图的半监督学习算法作为基础分类器,并将改进后的方法简称为RGRF (ReliefGBSSL-Rotation Forest)算法。实验结果表明RGRF算法比原始的旋转森林算法性能要好,并且预测得到的部分化合物-通路相互作用关系在数据库和文献中都能得到验证。3.实现了基于RGRF算法的可视化预测工具。该工具可以提供化合物在KEGG数据库中基本信息,同时实现对cMap实验中包括的几乎全部的化合物与相关通路的相互作用预测,并按照预测出的相互作用概率值给出一个相关通路列表。
【关键词】:药物-通路相互作用 多特征整合 化合物-通路相互作用 集成学习 RGRF算法
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:R917;TP311.13
【目录】:
  • 摘要6-8
  • Abstract8-13
  • 第一章 绪论13-19
  • 1.1 研究背景,目的及意义13-14
  • 1.2 国内外研究现状14-16
  • 1.3 论文主要工作16-17
  • 1.4 论文结构17-19
  • 第二章 相关知识19-29
  • 2.1 通路知识19-24
  • 2.1.1 通路的概念19-20
  • 2.1.2 相关数据库20-24
  • 2.2 机器学习方法概述24-26
  • 2.2.1 监督学习25
  • 2.2.2 无监督学习25-26
  • 2.2.3 半监督学习26
  • 2.2.4 集成学习26
  • 2.3 模型选择方法26-27
  • 2.4 模型评价方法27-29
  • 第三章 基于多特征整合方法预测药物-通路相互作用29-42
  • 3.1 引言29-30
  • 3.2 构建数据集30-31
  • 3.3 方法概述31-35
  • 3.3.1 药物特征构建31
  • 3.3.2 通路特征构建31-33
  • 3.3.3 基于高斯内核的规范化最小二乘算法33
  • 3.3.4 基于图的半监督学习算法33-34
  • 3.3.5 分图局部模型34-35
  • 3.4 结果与讨论35-41
  • 3.4.1 性能评价35-38
  • 3.4.2 预测结果38-41
  • 3.5 本章小结41-42
  • 第四章 基于改进的旋转森林方法预测化合物-通路相互作用42-58
  • 4.1 引言42-44
  • 4.2 构建数据集44-45
  • 4.3 方法概述45-51
  • 4.3.1 化合物结构特征45-46
  • 4.3.2 化合物的MOA特征46-47
  • 4.3.3 通路的基因空间特征47-48
  • 4.3.4 旋转森林48-49
  • 4.3.5 Relief特征过滤和GBSSL基础分类49-50
  • 4.3.6 RGRF算法描述50-51
  • 4.4 结果与讨论51-56
  • 4.4.1 性能评价51-53
  • 4.4.2 预测结果53-55
  • 4.4.3 验证分析55-56
  • 4.5 本章小结56-58
  • 第五章 RGRF算法工具的设计与实现58-62
  • 5.1 设计目的58
  • 5.2 设计原理58-59
  • 5.3 输入与输出59
  • 5.4 用户界面59-61
  • 5.5 本章小节61-62
  • 第六章 总结与展望62-64
  • 6.1 论文工作总结62-63
  • 6.2 工作展望63-64
  • 参考文献64-71
  • 致谢71-72
  • 附录 攻读学位期间发表论文目录72

【相似文献】

中国期刊全文数据库 前1条

1 李清玉;司民真;邓莉兰;李永铸;董勤;;FT-IR对药用蕨类植物节节草的分析[J];光散射学报;2008年02期

中国硕士学位论文全文数据库 前1条

1 宋美s

本文编号:396744


资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yxlw/396744.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b4e80***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com