基于多核学习的肿瘤—药物—基因语义关系提取
本文关键词: 文献挖掘 语义关系提取 多核学习 个体化用药 肿瘤-药物-基因关系 出处:《北京协和医学院》2015年硕士论文 论文类型:学位论文
【摘要】:在科学研究发展的推动下,肿瘤类疾病的药物治疗进入针对个体基因特征的个性化治疗阶段。生物医学文献作为科学研究成果重要呈现方式之一,记录了大量有关肿瘤、药物和基因的数据,为深入研究和发现肿瘤个体化用药治疗方案提供重要的数据支持。然而,面对海量生物医学文献信息资源,从这类非结构化数据中自动地挖掘有价值的信息,尤其是肿瘤、基因和药物三者相互作用关系,需要借助于信息处理技术与方法实现。本研究采用多核机器学习方法从呈指数增长的海量生物医学文献中自动提取肿瘤—药物—基因三者之间的语义关联关系。多核机器学习的核函数选取方面,针对文献信息数据结构特点,分别从词形、语法和语义三方面选择向量空间核(Vector Space Kernel)和字符串核(String Kernel)作为词汇核(Lexical Kernel, LK),卷积树核(Tree Kernel)作为句法核(Syntax Kernel, SyK),以及基于WordNet的语义核(Semantic Kernel, SeK)。实验语料主要是从CTD数据库(The Comparative Toxicogenomics Database, http://ctdbase.org/)中的采集经过人工审编的肿瘤-药物、肿瘤-基因和药物-基因等相互作用关联关系数据及其来源于PubMed数据库文献信息。利用SVM训练多种方式组合核函数语义分类器并测试其分类性能。利用词汇核、句法核和语义核三者构成的线性组合核方法提取语义关系的性能优于其他核方法。构建基于多核机器学习的肿瘤—药物—基因语义关系提取模型,实现了自动提取肿瘤—药物、药物—基因和肿瘤—基因三种关系的具体语义关系类型。实验结果表明,肿瘤-药物关系的F-值为88.41%,肿瘤-基因关系的F-值为85.68%,以及药物-基因关系的F-值为71.31%,本研究的方法优于其他方法。在此基础上,本研究结合共现关联关系方法和多核学习语义关系提取模型,设计并实现了面向肿瘤个体化用药的语义关系提取原型系统。该系统可以从生物医学文献中自动识别和提取肿瘤—药物一基因三者间语义关系,并且支持用户对多个命名实体的多种组合查询和查询结果批量下载。
[Abstract]:With the development of scientific research, the drug therapy for tumor diseases has entered the stage of individualized treatment for individual genetic characteristics. As one of the important presentation methods of scientific research achievements, biomedical literature has recorded a large number of tumors. The data of drugs and genes provide important data support for the further study and discovery of individualized drug therapy for cancer. However, in the face of vast amounts of biomedical literature and information resources, The automatic mining of valuable information from such unstructured data, in particular the interaction of tumors, genes and drugs, The multi-core machine learning method is used to automatically extract the semantic relationship between tumor, drug and gene from a large number of biomedical literature with exponential growth. The kernel function selection aspect of multicore machine learning, According to the characteristics of the data structure of literature information, respectively from the word form, In syntax and semantics, vector space kernel Space Kernel and string kernel string Kernelare selected as lexical Kernel, LKO, convolutional tree Kernel. as syntactic cores Syntax Kernel, Sykneland semantic kernels based on WordNet, semantic Kernel. Sekel. the experimental corpus is mainly from CTD data. In the Comparative Toxicogenomics Database, http: r / ctdbase.org / r / ctdbase.org / r / c / ctdbase.org / r / ctdbase.org. Tumor-gene and drug-gene interaction correlation data and their sources from PubMed database literature information. Using SVM to train a variety of ways to combine kernel function semantic classifier and test its classification performance. The linear combination kernel composed of syntactic kernels and semantic kernels is superior to other kernel methods in extracting semantic relations. A model of extracting tumor-drug-gene semantic relationship based on multicore machine learning is constructed to extract tumor-drug automatically. The specific semantic relationship types of drug-gene and tumor-gene relationships. The F- value of the tumor-drug relationship is 88.41, the F- value of the tumor-gene relationship is 85.68, and the F- value of the drug-gene relationship is 71.31. The method in this study is superior to other methods. In this study, the co-occurrence correlation method and the multi-core learning semantic relation extraction model are combined. A prototype system of semantic relation extraction for tumor individualized drug use is designed and implemented, which can automatically identify and extract the semantic relationship between tumor and drug gene from biomedical literature. And support users to multiple named entities of multiple combinations of queries and query results download batch.
【学位授予单位】:北京协和医学院
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:R-05;G254
【相似文献】
相关期刊论文 前10条
1 花栗鼠;;量身定做来治病——个体化用药[J];大众科学;2013年08期
2 黄民;;个体化用药进展及临床应用[J];今日药学;2009年02期
3 徐希奇;个体化用药促使临床试验发生转变[J];中国分子心脏病学杂志;2005年05期
4 和喜梅,刘学武,李逊霞;临床个体化用药的研究现状和评价[J];中国临床药理学与治疗学;2003年02期
5 杨金奎;;口服降糖药的个体化用药[J];中国处方药;2006年05期
6 黄立峰;;抗感染治疗个体化用药策略的分析[J];抗感染药学;2009年04期
7 周国华;单核苷酸多态性(SNP)与个体化用药[J];中国药学杂志;2004年02期
8 陈灵;王健;李居怡;邹吉利;吴金虎;;CYP2C9基因多态性与临床个体化用药[J];国际药学研究杂志;2012年06期
9 李有花;;临床药学的个体化用药的应用[J];中国药物经济学;2013年01期
10 周淦;郭栋;周宏灏;;医科院校“基因导向”个体化用药教学现状经验及发展策略[J];中南药学;2011年09期
相关会议论文 前9条
1 陈超;;个体化用药集成体系[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(上册)[C];2007年
2 周宏灏;;新世纪个体化用药模式的转换[A];中国药理学会第八次全国代表大会论文摘要集(第一部分)[C];2002年
3 余姝妮;张华;;CYP2C19基因多态性与氟西汀个体化用药[A];中华医学会第七次全国中青年检验医学学术会议论文汇编[C];2012年
4 周宏灏;;新世纪个体化用药模式的转换[A];中国药理学会第八次全国代表大会暨全国药理学术会议论文摘要汇编[C];2002年
5 王鸿利;;血栓与止血实验项目的优化组合应用及在实验监测下的个体化用药[A];第九届西北五省(区)检验医学学术会议论文汇编[C];2005年
6 何晓静;;卡马西平个体化用药模式探索与临床实践[A];2012年全国医院药学学术年会暨第72届世界药学大会卫星会大会报告[C];2012年
7 倪静;黄伟萍;孙艳群;;社区老年患者个体化用药信息卡的应用研究[A];全国第13届老年护理学术交流暨专题讲座会议、全国中医、中西医结合护理学术交流暨专题讲座会议论文汇编[C];2010年
8 刘昭前;;个体化用药与新药临床试验[A];传承与发展,,创湖南省生理科学事业的新高——湖南省生理科学会2011年度学术年会论文摘要汇编[C];2011年
9 袁进;吴新荣;石磊;;计算机辅助设计万古霉素个体化用药方案[A];广东省药学会2007学术年会论文集[C];2008年
相关重要报纸文章 前10条
1 编译 北京中医药大学 李勇;个体化用药成为药物开发新动力[N];中国医药报;2011年
2 记者 尹慧文 通讯员 王洁 罗闻;基因检测:实现个体化用药[N];大众卫生报;2014年
3 中国工程院院士 中南大学临床药理研究所和遗传药理研究所所长 周宏灏;解读遗传变异 走向个体化用药[N];人民政协报;2010年
4 白玉杰;基因检测 推进个体化用药[N];健康报;2010年
5 李勇;个体用药逼近,新药开发抢鲜[N];医药经济报;2011年
6 王雪飞;个体化用药很重要[N];健康报;2005年
7 编译 李勇;个体化用药改变销售模式[N];医药经济报;2010年
8 王树平;糖尿病合并高血压,须个体化用药[N];医药经济报;2013年
9 本报记者 王丹 实习记者 吴刚;“基因处方”实现个体化用药[N];健康报;2009年
10 孙金花;个体化用药 开发升温凸显CRO价值[N];中国医药报;2011年
相关博士学位论文 前1条
1 姜浩;二氢嘧啶脱氢酶时辰变化规律及指导氟嘧啶类化疗药物个体化用药标志物的研究[D];中国协和医科大学;2002年
相关硕士学位论文 前2条
1 王逯姚;基于多核学习的肿瘤—药物—基因语义关系提取[D];北京协和医学院;2015年
2 王琪;肿瘤相关基因RRM1和TUBB3 mRNA表达水平的检测在个体化用药中的初步应用[D];西北大学;2013年
本文编号:1534456
本文链接:https://www.wllwen.com/tushudanganlunwen/1534456.html