基于失衡数据分类模型的药物蛋白质虚拟筛选方法

发布时间:2017-12-18 05:28

  本文关键词:基于失衡数据分类模型的药物蛋白质虚拟筛选方法


  更多相关文章: 虚拟筛选 机器学习 聚类采样 集成学习


【摘要】:随着人类基因组计划的完成,生物信息学,生物化学等领域的理论研究不断深入,药物发现的方法和技术也在不断更新。由于计算机处理信息的高效性,模式识别,机器学习等方法逐渐渗入到药物发现领域。计算机辅助药物设计(Computer-aided Drug Design,CADD)、高通量筛选、生物芯片等高新科技的发展和完善为药物发现提供了新的技术手段和有力工具,极大地拓宽了药物发现的途径。基于分子对接的虚拟筛选是计算机辅助药物设计的重要方法之一,因其较好的普适性,已被大多数机构和制药公司所认可。但同时,这种策略的准确度很大程度上依赖于打分函数的精度。从目前来看,一方面,对于打分函数的研究还受理论和方法的限制,因此目前仍没有一种完全正确的方法。另一方面,虚拟筛选过程中,非活性候选化合物数量所占比例更大,错误的对接构象会对实验结果造成影响,这是典型的失衡数据分类问题,数据集的失衡使得筛选结果更倾向于负类,从而降低了筛选结果的准确率。基于这个背景,本文提出基于失衡数据挖掘的虚拟筛选方法,将虚拟筛选技术与失衡数据分类方法相结合,对传统的虚拟筛选流程进行改进。首先,在传统的虚拟筛选过程中,由于打分函数的不准确性,分子对接构象会产生误判,导致先导化合物的筛选结果很低。为了解决这一问题,本文利用Pharm-IF交互指纹来编码分子对接构象,以此作为分类算法的输入,在替代打分函数的同时,用一维的交互指纹数据表示分子间交互作用,有利于对数据集进行采样和分类。其次,在实际的虚拟筛选过程中,非活性化合物的数量比例较高,大量的错误对接构象造成数据失衡。考虑到失衡数据的自身特点:数据分类面倾斜会导致数据淹没,少数类数据信息匮乏,采样后会导致有效信息损失等,这些因素都会降低先导化合物的筛选质量。为了解决上述问题,在数据层面采用基于密度聚类的簇边界采样方法,对数据进行处理,在降低失衡比的同时尽可能的保留了更多的有效信息,有助于提升分类器的泛化性能。在分类算法层面引入集成学习思想,通过多层迭代将多个弱分类器转化为强分类器,增强分类器的稳定性,改善了候选项集中错误对接结果对筛选结果的影响,优化了传统的虚拟筛选流程。最后,在实验构建与分析部分,本文采用PDB数据库和St ARLITe数据库中的相关数据所提出的方法进行验证。实验结果表明,本文提出的方法能够有效的提升虚拟筛选的准确率,对新药物的研制有着一定实际指导作用。
【学位授予单位】:哈尔滨理工大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:Q811.4

【相似文献】

中国期刊全文数据库 前6条

1 詹冬玲;韩葳葳;刘景圣;;角鲨烯合成酶抑制剂的高通量虚拟筛选[J];吉林大学学报(理学版);2012年02期

2 洪雪梅;林毅;张光亚;;蛋白质突变仿真&虚拟筛选系统的开发和应用[J];计算机与应用化学;2012年03期

3 谷万港;陈雪琴;张丽;张旋;;基于结构的CXCR4抑制剂的虚拟筛选[J];昆明医科大学学报;2014年09期

4 黄勇;陈晨;张志毅;童贻刚;赵勇;;Autodock Vina与Discovery Studio在虚拟筛选耐药蛋白抑制剂中的比较[J];生物信息学;2012年04期

5 余浩源;陈亨野;杨冬;;利用计算机模拟筛选可特异性结合并抑制FtsZ聚合的小分子化合物[J];北京师范大学学报(自然科学版);2013年06期

6 ;[J];;年期

中国重要会议论文全文数据库 前10条

1 田盛;侯廷军;;多构象并行虚拟筛选策略的构建和评估[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年

2 侯廷军;;虚拟筛选中几种优化策略的研究[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年

3 朱维良;;虚拟筛选策略的再探索[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年

4 王希诚;李洪林;;药物分子虚拟筛选和靶向虚拟筛选方法[A];中国力学学会学术大会'2005论文摘要集(下)[C];2005年

5 刘艾林;;计算机辅助筛选技术[A];新观点新学说学术沙龙文集23:新药发现——寻找维护人类健康的武器[C];2008年

6 王立言;卢伟强;袁虎;张寿德;黄瑾;单磊;李洪林;;基于虚拟筛选的基质金属蛋白酶天然抑制剂的发现及优化[A];2011年全国药物化学学术会议——药物的源头创新论文摘要集[C];2011年

7 邓乾民;孙清;陈娟;时国庆;;高通量虚拟筛选植物源蛋白酶体抑制剂[A];中国药理学会第十次全国学术会议专刊[C];2009年

8 李剑;张键;陈静;贵春山;柳红;沈旭;蒋华良;陈凯先;;亲环素A抑制剂的发现:综合运用基于结构的虚拟筛选,基于碎片的化合物库设计,化学合成和生物测试[A];“以岭医药杯”第八届全国青年药学工作者最新科研成果交流会论文集[C];2006年

9 初燕燕;陈显军;杨弋;唐峗;;虚拟筛选方法用于寻找Ero1p的小分子抑制剂[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年

10 司原琦;刘振明;张亮仁;;基于结构的虚拟筛选方法及其在全新CD38受体抑制剂发现中的应用[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年

中国重要报纸全文数据库 前1条

1 刘春英;掌握理论技术 推进源头创新[N];中国医药报;2009年

中国博士学位论文全文数据库 前3条

1 李洪林;药物发现及靶向虚拟筛选的算法与程序设计[D];大连理工大学;2005年

2 曹冉;基于受体结构的虚拟筛选在先导化合物发现中的应用[D];天津大学;2013年

3 胡国平;虚拟筛选方法评价和靶向HIV-1整合酶与人类LEDGF/p75蛋白相互作用界面的抑制剂发现研究[D];华东理工大学;2012年

中国硕士学位论文全文数据库 前10条

1 王丹;钯催化的室温suzuki反应及基于产物结构的靶标受体蛋白的虚拟筛选[D];四川农业大学;2015年

2 匡鸣;肝纤维化新靶标BRD4蛋白抑制机制研究与虚拟筛选[D];广东药科大学;2016年

3 杨森;中药方剂桃仁红花煎的计算药理学研究[D];郑州大学;2016年

4 卢玉林;新德里金属-β-内酰胺酶-1抑制剂的虚拟筛选[D];华中农业大学;2016年

5 马磊;嗅觉气味分子的GPCR靶标虚拟筛选及与金属卟啉环结合作用的量子化学计算[D];安徽医科大学;2015年

6 孙亮亮;特异性选择环氧化酶-2小分子的虚拟筛选、合成及其毒理学和药效学初步评价[D];安徽中医药大学;2016年

7 黄梦楠;α-葡萄糖苷酶抑制剂的虚拟筛选和分子动力学模拟[D];大连理工大学;2016年

8 王梦禹;基于机器学习的药物蛋白虚拟筛选方法研究[D];哈尔滨理工大学;2016年

9 陈文;基于失衡数据分类模型的药物蛋白质虚拟筛选方法[D];哈尔滨理工大学;2017年

10 赵健;组蛋白去乙酰化酶抑制剂的虚拟筛选和实验验证[D];东北师范大学;2015年



本文编号:1303004

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/1303004.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c5bcf***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com