当前位置:主页 > 科技论文 > 自动化论文 >

药物互作数据的挖掘与预测研究

发布时间:2020-05-22 01:58
【摘要】:药物研发是一个漫长的过程,一种新药从研发到最终上市会耗费十几年的时间,而期间投入的成本甚至高达上亿美元。随着大数据时代的到来,与药物研发相关的数据呈爆炸式地增长,采用传统的实验手段处理这些数据已变得十分棘手。因此研究者们尝试使用计算的方法来辅助药物研发,解决药物研发中的各种问题。本论文重点围绕药物研发中药物相互作用的相关问题,挖掘潜在的数据关系并进行深入分析,构建相应的预测模型。主要开展基于传统机器学习算法构建蛋白质热点残基的预测模型,以及基于深度学习的算法分别构建药物-靶标相互作用的预测模型和QSAR药物活性筛选模型。药物研发的第一步是确定药物靶点。热点残基在蛋白质相互作用结合界面中起着关键性的作用,常作为潜在的药物靶点应用于药物设计领域中。但是采用实验的方法定位和识别热点残基非常耗时耗力,现已提出了许多基于序列或结构化表征的计算方法用于预测蛋白质热点残基。目前,绝大多数蛋白质的三维结构信息是未知的,这使仅从蛋白质的氨基酸序列中识别热点残基变得更加有意义。本文的研究工作旨在提出一种新的蛋白质序列特征编码方法,用于构建蛋白质热点残基的预测模型。该模型主要将氨基酸序列编码得到的理化特征与溶剂相对可及表面积结合起来,使用集成投票的方法得到最终结果。确定药物靶点后还需要寻找和验证药物与靶标蛋白之间潜在的相互作用关系。所谓的相互作用是指在生物体中靶标蛋白能够与其他小分子(如配体或药物)相结合,且引起生物体行为或功能的变化,产生治疗疾病的作用。本文提出了一个基于深度学习的预测模型,用于鉴定药物与靶标之间的相互作用。深度学习的网络模型有助于提取到更精细、更深层次的药物与靶标间的互作特征,从而进一步提升模型的预测性能。同时,由于药物与靶标互作的负样本数量众多,本文给出了一个较为合理的基于特征距离的负样本选择方法。该方法主要思想是计算每一个可能的负样本与整个正样本集之间的特征距离,若距离越大,则说明其与正样本之间的差距越大,那么该负样本的可靠性就越高。实验结果表明,预测模型在两种不同来源的数据上均表现出较优异的性能,可应用于识别药物-靶标相互作用的研究中。药物相互作用研究的最后一步是筛选出先导化合物。定量构效关系(QSAR)是一种基于配体的药物虚拟筛选方法,是准确识别新的先导化合物的有效方法之一。过去几十年中,在计算机技术的帮助下,QSAR的相关研究工作已取得丰硕成果。近年来,深度学习技术的兴起和大规模可访问化学数据库的出现,为深度学习在QSAR药物活性筛选方面提供了广阔的发展空间。因此,本文设计了一个基于深度学习端到端的预测模型来实现QSAR药物活性筛选,并使用两种训练方案对模型进行评估。该模型中编码-解码化学模型用于生成表征化学分子的中间特征;卷积神经网络结构则以中间特征作为输入向量对模型进行训练得到预测结果。两种训练方案均能证实模型的有效性。综上所述,本文旨在解决药物相互作用研究的相关问题,通过机器学习和深度学习算法,对相关数据进行挖掘和深入分析,寻找其中的潜在关系,构建泛化能力好、鲁棒性较强的预测模型。通过与其他模型比较,本文提出的预测模型均能产生较好的预测性能。因此,本文的研究内容可以为药物研发节约成本,缩短研发周期,同时也可作为药物研发中的辅助工具,为相关实验提供理论指导。
【图文】:

示意图,近邻算法,示意图,样本


A近邻算法属于机器学习中的有监督模型,对于某个样本尤来说,在特征逡逑空间中计算尤与其附近样本之间的距离,根据距离的大小找到最近邻的)t个样逡逑本,并通过这it个样本的类别划分该样本的类别,如图3.3所示。对于两个/J维逡逑空间的样本x和y,计算它们之间的空间距离主要有欧式空间距离d(x,y)=逡逑和曼哈顿距离d(x,y)邋=逦h邋_刈这两种方法。逡逑_算法的最终分类结果仅依赖于最近邻的一个或几个样本的类别,在实逡逑施类别决策时,待分样本所属的类别其实依赖于极少数的近邻样本数据,与判别逡逑类域的方法并无太大关系。因此,_算法尤其适用于分类类域交叉或有较多逡逑重叠部分的样本数据。事实上,_算法对于分类任务和回归任务同样适用。逡逑在回归任务中,一个样本数据的属性是由其)t个最近邻数据决定的,找

时间序列,主流网络,学习领域,无监督学习


人工特征提取的工作量。目前,在深度学习领域中己有许多的主流网络模型,其逡逑应用的领域也是方方面面,依据不同的实现目标,深度学习网络模型可以大致划逡逑分为基于监督学习的神经网络模型和基于无监督学习的神经网络模型(如图2.1逡逑所示)。逡逑深度神经网络(Deep邋Neural邋Networks,DNN)就?是前■所提到的人工yL经逡逑网络,但是不同的是它的隐藏层数量更多。在机器学习领域中约定,,深度神经网逡逑络是指隐藏层的数量超过5?7层的网络结构。卷积神经网络(Convolutional邋Neural逡逑Network,邋CNN)是深度学习中较为经典的网络结构之一,在图像的检测、分类和逡逑识别等任务上表现十分突出。循环神经网络(Recurrent邋Neural邋Networks,RNN)逡逑也是目前深度学习中应用最广泛的网络结构,它主要用于处理有序列依赖性的数逡逑据,如时间序列等,在对语音识别、非分割手写字符识别的建模上表现优异。逡逑I.邋m;逦l:'.逦..v::逡逑图2.1目前深度学习的主流网络模型的分类逡逑Fig邋2.1邋The邋classification邋of邋deep邋learning邋architectures逡逑无监督学习的神经网络模型又可以分为深度生成模型(Deep邋Generative逡逑Models)和自编码器(Auto-encoder,AE)两个部分。深度生成模型中深度置信逡逑网络(Deep邋Belief邋Neural邋Networks
【学位授予单位】:安徽大学
【学位级别】:博士
【学位授予年份】:2019
【分类号】:TP18;R96

【相似文献】

相关期刊论文 前10条

1 凌云;王建东;;浅析4~#高炉的炉缸侵蚀预测模型[J];南钢科技与管理;2007年03期

2 谷鸿秋;王俊峰;章仲恒;周支瑞;;临床预测模型:模型的建立[J];中国循证心血管医学杂志;2019年01期

3 周媛;叶烨;王新彦;周宏根;王筱蓉;;零转弯半径割草机连续翻滚特性参数化预测模型[J];农机化研究;2018年01期

4 刘洪太;郭云霞;;基于情景数据的火灾预测模型设计与实现[J];科技创新与应用;2018年26期

5 王伟卿;;灰色预测模型在预测话音网关故障中的研究与应用[J];计算机测量与控制;2016年11期

6 韩文倩;;灰色预测模型在山东省保费预测中的应用[J];保险职业学院学报;2017年01期

7 杨萌;;基于灰色预测模型的山西省批发零售业人员需求分析[J];数学的实践与认识;2017年04期

8 崔剑;巴合提努尔·巴赞;李书钦;;烧结过程SO_2排放预测模型研究[J];资源节约与环保;2017年08期

9 张春涛;关文忠;刘学飞;;混沌时间序列的2阶预测模型[J];数学的实践与认识;2016年05期

10 夏静;;建设项目环境影响评价预测模型发展现状[J];绿色科技;2016年08期

相关会议论文 前10条

1 匡启帆;李益洲;李梦龙;;对于药物不良反应预测模型的系统研究[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年

2 肖健华;吴今培;;基于支持向量机的预测模型及应用[A];2003年中国智能自动化会议论文集(下册)[C];2003年

3 王坤龙;;天津地区雾霾的成因及预测模型建立的研究[A];科学发展·协同创新·共筑梦想——天津市社会科学界第十届学术年会优秀论文集(中)[C];2014年

4 郭庆春;;基于人工神经网络的空气污染指数预测模型[A];Proceedings of Conference on Environmental Pollution and Public Health(CEPPH 2012)[C];2012年

5 王亮;刘豹;徐德民;;预测模型的选择及其智能化实现[A];科学决策与系统工程——中国系统工程学会第六次年会论文集[C];1990年

6 罗荣桂;黄敏镁;;基于自适应神经模糊推理系统的服务业发展预测模型[A];Well-off Society Strategies and Systems Engineering--Proceedings of the 13th Annual Conference of System Engineering Society of China[C];2004年

7 李阳旭;邓辉文;;一种新的企业市场预测模型及其比较研究[A];2004年中国管理科学学术会议论文集[C];2004年

8 张晓f^;;全球煤炭产量的灰色预测模型[A];中国现场统计研究会第十三届学术年会论文集[C];2007年

9 曾练平;燕良轼;;大学师范生可就业能力预测模型的建构[A];增强心理学服务社会的意识和功能——中国心理学会成立90周年纪念大会暨第十四届全国心理学学术会议论文摘要集[C];2011年

10 林春艳;;一种新的灰色预测模型及其在留学管理中的应用[A];2001年中国管理科学学术会议论文集[C];2001年

相关重要报纸文章 前10条

1 记者 黄辛;上海交通大学 提出基于信号通路的肝癌风险预测模型[N];中国科学报;2019年

2 记者 康民;全球首个流感预测模型落户重庆[N];中国保险报;2017年

3 北京大学肿瘤医院 刘晨;筛查食管癌有了风险预测模型[N];健康报;2017年

4 特约记者 刘京涛;华东化工销售员工设计价格预测模型见成效[N];中国石油报;2010年

5 本报记者 张超;预测模型:推算SARS起落潮[N];科技日报;2003年

6 刘庆;“预测模型”要缓行[N];网络世界;2006年

7 记者 华凌;颗粒物成云新理论有助改进预测模型[N];科技日报;2015年

8 四川农业大学 王立志 贾刚 王康宁;饲料有效磷的评定及预测模型的“雏形”[N];中国畜牧兽医报;2006年

9 张琳 赵伟;巧用Excel构建利润预测模型[N];财会信报;2007年

10 中兴通讯 曾志 杨毅;建立移动用户流失分析预测模型[N];通信产业报;2014年

相关博士学位论文 前10条

1 胡姗姗;药物互作数据的挖掘与预测研究[D];安徽大学;2019年

2 支元杰;大气环境下小样本金属材料腐蚀的数据驱动预测模型[D];北京科技大学;2019年

3 李金金;天津市慢性病队列研究及风险预测模型的建立[D];天津医科大学;2018年

4 陈玲;孕期及产后压力性尿失禁风险预测模型的构建、验证及应用[D];南方医科大学;2018年

5 云科;MSM人群HIV感染风险预测模型的建立及应用[D];中国医科大学;2018年

6 林开阳;急诊经皮冠状动脉介入术后对比剂肾病的危险因素分析及风险预测模型构建[D];南方医科大学;2018年

7 王美萍;城镇供热系统层级热量结算点中短期热负荷预测方法研究[D];太原理工大学;2017年

8 黄登高;用于公交车辆行驶油耗优化的工况预测模型及其自学习策略[D];天津大学;2017年

9 史健翔;基于生物信息学的非小细胞肺癌肿瘤标志物筛选和预测模型构建[D];郑州大学;2018年

10 陈磊;基于全矢谱的设备故障预测方法研究[D];郑州大学;2018年

相关硕士学位论文 前10条

1 肖艳杰;轨道交通客流预测模型优化及应用研究[D];武汉理工大学;2018年

2 吴越;大数据环境下的消费者流失预测模型[D];厦门大学;2018年

3 窦瑞华;大数据环境下预测模型的自动化构建与优化[D];中国石油大学(华东);2017年

4 单婷;基于蛋白质结构特征的折叠速率预测模型[D];大连交通大学;2016年

5 霍德磊;车辆纵向编队实用技术研究[D];长沙理工大学;2017年

6 李贤;汽车销售点的品牌销量预测模型与运用研究[D];西华大学;2017年

7 王天豪;高校公共建筑能耗影响因素与预测模型构建研究[D];西安建筑科技大学;2018年

8 叶颖;分布式光伏发电全气象系统及出力预测方法研究[D];浙江工业大学;2017年

9 梁霞;基于模糊时间序列预测模型在我国风力发电量上的应用研究[D];兰州交通大学;2018年

10 张琦;短期光伏发电出力预测方法研究[D];广东工业大学;2018年



本文编号:2675268

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2675268.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户410b6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com