当前位置:主页 > 科技论文 > 搜索引擎论文 >

分子相似性网络中关键化合物发现算法研究

发布时间:2017-05-19 17:26

  本文关键词:分子相似性网络中关键化合物发现算法研究,由笔耕文化传播整理发布。


【摘要】:新药研发是一个十分复杂且昂贵耗时的过程。虚拟筛选技术需要使用一系列计算方法从庞大的化合物数据库中选出一定数量的先导化合物。具有相似结构的化合物可能具有相似的理化性质,基于相似性的虚拟筛选计算高度依赖于特定靶标的结构活性关系。在药物发现的初期阶段,根据分子间的相似性确定化学库中的首要研究对象,或预测药物专利申请书中的关键化合物,将有助于制定合理的药物研发计划,降低成本,缩短药物研发周期。分子网络中的关键化合物是占据网络拓扑图中关键节点位置的分子。在药物发现初期阶段涉及的分子中,关键化合物将是具有最优物化性质、药代动力学特征或生物活性的分子。对专利说明书中的示例化合物集合,关键化合物很可能就是候选药物。本文针对基于分子相似性的虚拟筛选,将网络分析方法使用到分子筛选研究中。在分析一个分子集合时,发现其中的关键化合物并首先对其进行分析研究,将加快对整个集合分子物化特性以及生物性质的分析和把握。本文基于指纹的分子相似性计算算法构建分子相似性网络。借鉴Google搜索引擎用于页面评分的PageRank算法的主要思想,提出用于分子相似性网络中发现关键化合物的MolecularRank算法。使用MolecularRank算法对分子进行评分,化合物的MolecularRank值越高(MolecularRank值高的分子占据了分子相似性网络的关键节点)则表示该化合物在分子集合中越重要。该算法通过求分子相似性网络对应邻接矩阵特征向量计算化合物的MolecularRank 分值并进行排序,能够准确地发现分子相似性网络中占据重要节点的分子。本文以用于药物发现的大型生物活性数据库ChEMBL为数据来源对算法进行了实例分析。为满足海量数据的计算需求,论文进一步研究了MolecularRank算法在云计算平台下的并行化,实现了其在MapReduce框架下的并行化计算。最后,使用MolecularRank算法预测药物专利中的关键化合物,并与H attori等人提出的CSA (Cluster Seed Analysis)算法进行对比分析,结果显示本文提出的MolecularRank算法在实验参数设定及实验结果上均优于CSA算法,可以作为一种预测专利中关键化合物行之有效的方法。
【关键词】:虚拟筛选 分子网络 关键化合物发现 MolecularRank算法
【学位授予单位】:兰州大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.13
【目录】:
  • 中文摘要3-4
  • Abstract4-7
  • 第一章 绪论7-16
  • 1.1 研究背景和意义7-10
  • 1.1.1 药物发现和虚拟筛选7-8
  • 1.1.2 大数据环境下药物发现面临的机遇和挑战8-9
  • 1.1.3 化学专利中关键化合物的预测9-10
  • 1.2 国内外研究现状10-14
  • 1.2.1 基于相似性的虚拟筛选研究10-12
  • 1.2.2 分子网络的研究与应用12-13
  • 1.2.3 化学专利的分析研究13-14
  • 1.3 本文研究的内容14-15
  • 1.4 本文组织结构15-16
  • 第二章 相关理论技术16-25
  • 2.1 基于指纹的分子相似性16-19
  • 2.1.1 分子描述符16-18
  • 2.1.2 分子相似性度量18-19
  • 2.2 分布式系统架构Hadoop19-25
  • 2.2.1 HDFS21-22
  • 2.2.2 MapReduce分布式并行编程模型22-24
  • 2.2.3 Sqoop24-25
  • 第三章 基于指纹的分子相似性计算25-41
  • 3.1 分子预处理25-32
  • 3.1.1 ChEMBL数据库25-28
  • 3.1.2 分子数据预处理28-32
  • 3.2 基于指纹的分子相似性计算32-34
  • 3.3 相似性计算结果分析34-40
  • 3.4 本章小结40-41
  • 第四章 关键化合物发现的MolecularRank算法41-61
  • 4.1 分子相似性网络41-42
  • 4.2 PageRank算法42-44
  • 4.3 基于PageRank的MolecularRank算法44-51
  • 4.3.1 MolecularRank算法思想44-45
  • 4.3.2 MolecularRank算法模型45-47
  • 4.3.3 算法实例分析47-51
  • 4.4 MolecularRank算法的并行化51-56
  • 4.4.1 分布式计算模型51-52
  • 4.4.2 MolecularRank并行算法实现52-56
  • 4.5 与CSA算法的对比分析56-61
  • 4.5.1 CSA算法56-57
  • 4.5.2 实验数据57-58
  • 4.5.3 实验结果对比分析58-61
  • 第五章 总结与展望61-63
  • 5.1 本文总结61
  • 5.2 研究展望61-63
  • 参考文献63-67
  • 研究生间参与的项目67-68
  • 致谢68

【二级参考文献】

中国期刊全文数据库 前1条

1 王珊;王会举;覃雄派;周p,

本文编号:379346


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/379346.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a309f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com