疾病-病症和病症-治疗物质的关系抽取研究
本文关键词: 信息抽取 半监督学习 Tri-training 集成学习 出处:《计算机工程与应用》2017年10期 论文类型:期刊论文
【摘要】:随着生物医学文献的快速增长,在海量的生物医学文献中存在大量有关疾病、病症和治疗物质的信息,这些信息对疾病的治疗和药物的研制有着重要的意义。针对疾病与治疗物质之间的信息抽取,重点训练两个模型,即疾病与病症模型和病症与治疗物质模型。疾病与病症模型判断一种疾病是否会存在或者导致一种生理现象的产生;病症与治疗物质模型判断一种物质是否改变人的生理现象或者生理过程。使用半监督学习的Tri-training的方法,利用大量未标注数据辅助少量有标注数据进行训练提高分类性能。实验结果表明,Tri-training方法中利用未标注数据有助于提高实验结果;且在训练过程中使用集成学习的思想将三个分类器器集成在一起,提高了学习性能。
[Abstract]:With the rapid growth of biomedical literature, there is a large amount of information about diseases, diseases and therapeutic substances in the vast amount of biomedical literature. This information is of great significance to the treatment of diseases and the development of drugs. Disease and disease model and disease and treatment material model. Disease and disease model to determine whether a disease will exist or lead to a physiological phenomenon; Disease and Therapeutic substances Model determines whether a substance changes a person's physiological phenomena or processes. A semi-supervised learning method called Tri-training, A large amount of unlabeled data is used to train a small amount of labeled data to improve the classification performance. The experimental results show that the use of unlabeled data in the Tri-training method is helpful to improve the experimental results. The three classifiers are integrated in the training process using the idea of integrated learning, which improves the learning performance.
【作者单位】: 大连理工大学计算机科学与技术学院;
【基金】:国家自然科学基金(No.61070098,No.61272373,No.61340020) 新世纪优秀人才支撑计划(No.NCET-13-0084) 中央高校基本科研业务费专项资金(No.DUT13JB09,No.DUT14YQ213)
【分类号】:TP181;TP391.1
【相似文献】
相关期刊论文 前10条
1 陈华;魏连;郑志娴;许榕生;;基于集成学习的网络取证模型[J];福建电脑;2007年10期
2 时雷;虎晓红;席磊;段其国;;集成学习技术在农业中的应用[J];安徽农业科学;2008年26期
3 周绪川;钟勇;;集成学习分布式异常检测方法[J];计算机工程与应用;2011年18期
4 牛小飞;马军;马少平;张冬梅;;基于遗传规划集成学习的网络作弊检测[J];中文信息学报;2012年05期
5 文益民;李健;杜飞明;陈方;;集成学习算法在不平衡分类中的应用研究[J];计算技术与自动化;2009年02期
6 游生福;汪荣贵;戴经成;张冬梅;;自适应嵌套级联的在线集成学习方法研究[J];计算机工程与应用;2014年05期
7 孙建文;杨宗凯;刘三(女牙);王佩;;基于集成学习与遗传算法的网络书写纹识别研究[J];计算机科学;2011年06期
8 孔英会;景美丽;;基于混淆矩阵和集成学习的分类方法研究[J];计算机工程与科学;2012年06期
9 文益民;王耀南;;基于训练集平行分割的集成学习算法研究[J];小型微型计算机系统;2009年05期
10 何鸣;李国正;袁捷;;医学诊断中集成学习技术的研究[J];计算机工程与应用;2006年28期
相关会议论文 前2条
1 刘伍颖;王挺;;一种多过滤器集成学习垃圾邮件过滤方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
相关博士学位论文 前4条
1 尹华;面向高维和不平衡数据分类的集成学习研究[D];武汉大学;2012年
2 方育柯;集成学习理论研究及其在个性化推荐中的应用[D];电子科技大学;2011年
3 孙永宣;集成学习下的图像分析关键问题研究[D];合肥工业大学;2013年
4 刘增荣;视听觉情感语义相干及应用研究[D];太原理工大学;2012年
相关硕士学位论文 前10条
1 高伟;基于半监督集成学习的情感分类方法研究[D];苏州大学;2015年
2 汤莹;迁移与集成学习在文本分类中的应用研究[D];江苏科技大学;2015年
3 刘政;基于知识元和集成学习的中文微博情感分析[D];大连理工大学;2015年
4 丘桥云;结合文本倾向性分析的股评可信度计算研究[D];哈尔滨工业大学;2014年
5 李想;基于多示例的集成学习理论与应用研究[D];合肥工业大学;2014年
6 李震宇;基于集成学习的数字图像隐写定量分析[D];解放军信息工程大学;2014年
7 陈范曙;基于信息整合的药物相关信息挖掘方法研究[D];华东师范大学;2016年
8 游攀利;基于集成SVM的文本分类方法研究[D];华中科技大学;2014年
9 陶杰;基于集成学习的短文本主客观分类研究[D];安徽工业大学;2016年
10 徐燕会;基于神经影像的进展型轻度认知功能障碍识别研究[D];安徽工业大学;2016年
,本文编号:1543193
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1543193.html