当前位置:主页 > 医学论文 > 药学论文 >

基于多源数据的计算药物重定位技术研究与实现

发布时间:2020-06-05 21:29
【摘要】:计算药物重定位旨在利用计算方法为已有药物寻找新的用途。与传统创新药物的设计研究相比,计算药物重定位有着投入低和周期短的特点。此外,已经批准上市的药物经过严格的临床实验,其毒副作用通过了严格的评估,安全性有保证。因而根据这些药物新用途制备的药物更容易通过监管部门的审核。计算药物重定位对于新药的研发有着重要的意义。研究人员针对计算药物重定位问题提出了多种模型。但这些模型在两个方面有待改进:一方面是模型采用的数据不够充分,没有借助生物信息领域丰富的数据信息;另一方面是采用的模型在学习能力上存在不足,无法从数据中学习到更高层次的药物-疾病关系。因而本文针对这两个方面的问题,对计算药物重定位进行了如下研究工作:(1)多源数据的利用。为了使得学习到的药物-疾病关系更加可靠,本文不仅考虑已有的药物和疾病间的治疗关系,还考虑到药物、疾病、基因的自身属性信息,采用多种数据信息,丰富药物-疾病关系。(2)基于异质网络多源游走的药物重定位模型。本文采用多源数据信息,利用图模型对药物、疾病和基因关系进行建模,提出了异质网络多源随机游走模型(Multi-Random Walk on Heterogeneous network,HMRW)。HMRW模型首先构造一个包含药物、疾病和基因三种不同类型节点的三层异质网络,并利用分别从药物节点和疾病节点出发的随机游走,计算药物和疾病节点间的关联程度。实验结果表明,与未引入基因信息的模型相比,HMRW有更好的模型表现。(3)基于混合泛化矩阵分解的药物重定位模型。本文受推荐系统启发,尝试利用协同过滤技术解决重定位问题。在泛化矩阵分解模型的基础上,本文提出了混合泛化矩阵分解模型(Hybrid Generalized Matrix Factorization,HGMF)。HGMF模型从药物和疾病两个方面添加侧面信息,利用自动编码器对药物和疾病属性进行特征提取,将提取的药物和疾病特征作为药物隐向量和疾病隐向量参与协同过滤。实验结果表明,HGMF模型的预测效果优于仅依赖药物-疾病关系的泛化矩阵分解模型,也优于上述的异质网络多源随机游走模型。
【图文】:

权重矩阵,隐藏层,激活函数,维度


图 2-1 自动编码器基本 构 ,其中包含 m 个训练样编码器中间隐藏层维度为 K。首本进行编码,W N×K。图 2- ( ) = ( ) 示非线性激活函数。类似的,自对编码的数据进行解码: ( ) = ( ( ) ) 的算法对网络的权重矩阵进行更 ( )

示意图,示意图,药物,子结构


图 3-1 三 异质网络示意图构造药物间相似度网络物的属性信息包括药物的化学结构信息、副作用信息、靶标的序列信息等等物的结构信息作为描述药物特征的属性。在 DrugBank 数据库中,药物的结化分子线性输入规范(simplified molecular input line entry specification,SM存储为 ASCII 字符串。CDK(chemical development kit)[47]提供将药物的 S列转化为化学子结构向量的函数。对于药物的SMILES序列,,先使用CDK得药物子结构向量。如果药物包含某一子结构,则对应向量位置值为 1,否则为药物的子结构向量 和 ,可以利用 Tanimoto score 计算两个药物子结构向 ( ) = ( ) ( ) 表示序列的第 k 个元素, 和 分别表示向量元素的与、或操作。往的药物重定位工作发现,相似度低的关系对于药物-疾病关系预测的贡献
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:R91;TP301.6

【参考文献】

相关期刊论文 前2条

1 黄宏斌;梁芳;熊炜;李小玲;曾朝阳;李桂源;;生物信息技术加速开发旧药新用途[J];生物化学与生物物理进展;2012年01期

2 郭宗儒;;药物的杂泛性[J];药学学报;2011年04期



本文编号:2698641

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyaoxuelunwen/2698641.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b7287***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com