基于文本挖掘的潜在药物不良反应发现
发布时间:2017-05-06 16:06
本文关键词:基于文本挖掘的潜在药物不良反应发现,,由笔耕文化传播整理发布。
【摘要】:生物医学技术的发展为人类提供了大量的药品用以治疗各种疾病。一方面,药物对于治疗人类疾病,改善人类健康水平,延长人类寿命起到重要作用;另一方面,药物不良反应又使得药物在某些情况下对人类身体健康产生严重危害,而这些危害甚至可能是致命的。药物不良反应不仅对个人健康产生危害,而且给整个社会带来巨大的经济损失。如何及时高效而又全面地发现药物所导致的不良反应成为医学界和学术界所关注的热点。药物流向市场之前必须进行综合的临床试验。但由于其局限性,临床试验不能保证揭露药物所有的不良反应。药物上市后,药物不良事件报告系统成为监控药物安全、发现药物不良反应的主要依托。随着Web2.0技术的发展以及互联网广泛的普及,健康社交网站积累了大量的用药者评论,这些用药者评论数据蕴含丰富的药物不良反应信息,为挖掘潜在药物不良反应、监控药物安全提供了新的数据源。针对药物不良事件报告系统中的数据,本文利用非序列化Skip-gram模型,训练生成药物和不良反应的分布式实体向量,利用向量之间的运算来计算药物和不良反应之间的关联性达到挖掘潜在药物不良反应的目的。实验表明,非序列化Skip-gram模型生成的分布式实体向量,有效地捕捉了药物和不良反应之间的关联性,可以用于进行潜在药物不良反应的发现。针对社交网络中的用药者评论数据,本文利用信息熵和字典匹配的方法从用户评论中挖掘药物不良反应。但是,从用户评论中挖掘到的药物不良反应是“潜在”意义的不良反应,尚未得到临床意义上的验证,而验证潜在药物不良反应的真伪性是耗时耗力的过程。因此,本文利用非序列化Skip-gram模型,生成生物医学实体的分布式向量,对于药物d和不良反应a,利用所生成的分布式实体向量,尽最大努力发现药物d和不良反应a之间的关联蛋白质,为生物医学专家最终确定其真实性提供蛋白质级别的参考,从而缩短确定潜在不良反应真实性的时间,实现及时发现药物潜在风险的目标。
【关键词】:药物不良反应 非序列化Skip-gram 分布式向量
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:R96;TP311.13
【目录】:
- 摘要4-5
- Abstract5-9
- 1 绪论9-15
- 1.1 研究背景9-11
- 1.2 研究现状11-13
- 1.2.1 基于不良事件报告系统的研究现状11-12
- 1.2.2 基于社交网络的研究现状12-13
- 1.3 本文工作13
- 1.4 本文结构13-15
- 2 相关资源和算法15-23
- 2.1 生物医学数据资源15-18
- 2.1.1 SIDER15
- 2.1.2 Semantic MEDLINE Database15-16
- 2.1.3 MeSH16-17
- 2.1.4 DrugBank17-18
- 2.2 生物医学工具18-19
- 2.3 相关算法19-22
- 2.3.1 非序列化Skip-gram模型19-21
- 2.3.2 信息熵21-22
- 2.4 本章小结22-23
- 3 面向不良事件报告的潜在药物不良反应发现23-31
- 3.1 问题引出23
- 3.2 实验数据23-24
- 3.3 研究框架24
- 3.4 方法24-28
- 3.4.1 药名文本去噪24-25
- 3.4.2 药名实体识别(MetaMap)25
- 3.4.3 语义类型过滤25-27
- 3.4.4 生成分布式实体向量27-28
- 3.4.5 计算药物和不良反应之间关联度28
- 3.5 实验分析28-30
- 3.6 本章小结30-31
- 4 面向社交网络的潜在药物不良反应发现31-44
- 4.1 问题引出31
- 4.2 研究框架31-33
- 4.2.1 数据获取模块32
- 4.2.2 潜在不良反应识别模块32
- 4.2.3 关联蛋白质寻求模块32-33
- 4.3 识别潜在药物不良反应33-36
- 4.3.1 生成“疾病和不良反应”词典33
- 4.3.2 基于信息熵和字典匹配的“疾病和不良反应”实体识别33-34
- 4.3.3 基于DrugBank和Semantic MEDLINE的适应症标记34-35
- 4.3.4 基于SIDER的已知药物不良反应标记35
- 4.3.5 潜在药物不良反应标记35-36
- 4.4 寻求潜在不良反应的证据36-37
- 4.4.1 关联度36-37
- 4.4.2 基于Skip-gram模型的生物实体关联度37
- 4.5 实验结果分析37-43
- 4.5.1 不良反应识别结果38-40
- 4.5.2 分布式实体向量40-41
- 4.5.3 关联蛋白质41-43
- 4.6 本章小结43-44
- 结论44-46
- 参考文献46-49
- 攻读硕士学位期间发表学术论文情况49-50
- 致谢50-51
【参考文献】
中国期刊全文数据库 前1条
1 魏建香;孙越泓;朱云霞;徐厚明;孙俊;帅友良;;一种基于互信息的药品不良反应信号检测方法[J];南京大学学报(自然科学版);2010年06期
本文关键词:基于文本挖掘的潜在药物不良反应发现,由笔耕文化传播整理发布。
本文编号:348699
本文链接:https://www.wllwen.com/yixuelunwen/yxlw/348699.html