在线医疗文本中的实体识别研究
发布时间:2018-01-01 07:45
本文关键词:在线医疗文本中的实体识别研究 出处:《北京大学学报(自然科学版)》2016年01期 论文类型:期刊论文
【摘要】:针对在线医疗文本,设计考虑医疗领域特性的识别特征,并在自建数据集上进行实体识别实验。针对常见的5类疾病:胃炎、肺癌、哮喘、高血压和糖尿病,采用近年来较先进的机器学习模型条件随机场,进行训练和测试,抽取目标实体包括疾病、症状、药品、治疗方法和检查5类。通过采用逐一添加特征的实验方式,验证所提特征的有效性,取得总体上81.26%的准确率和60.18%的召回率,随后对识别特征给出进一步分析。
[Abstract]:According to the online medical text recognition, feature design considering the characteristics of the medical field, and entity recognition experiment in self built data sets. For 5 kinds of common diseases, gastritis, lung cancer, asthma, hypertension and diabetes in recent years, with the more advanced machine learning model of CRFs, training and testing, including the target entity extraction diseases, symptoms, drug, treatment and examination of 5 class. The experimental way through one by one to add features, to verify the effectiveness of the proposed feature, achieved recall rate of overall accuracy rate of 81.26% and 60.18%, as well as the recognition features are further analyzed.
【作者单位】: 南开大学计算机与控制工程学院(软件学院);
【基金】:天津市科技支撑项目(13ZCZDGX01098) 天津市自然科学基金(14JCQNJC00600) 中国民航信息技术科研基地开放课题(CAAC-ITRB-201303)资助
【分类号】:TP391.1
【正文快照】: 天津市科技支撑项目(13ZCZDGX01098)、天津市自然科学基金(14JCQNJC00600)和中国民航信息技术科研基地开放课题(CAAC-ITRB-201303)资助随着生活水平的提高,人们对于健康问题日益关注。互联网行业的迅猛发展催生一大批在线医疗社区和医疗信息网站,为患者提供了多元化的医疗信息
【参考文献】
相关期刊论文 前2条
1 杨锦锋;于秋滨;关毅;蒋志鹏;;电子病历命名实体识别和实体关系抽取研究综述[J];自动化学报;2014年08期
2 叶枫;陈莺莺;周根贵;李昊e,
本文编号:1363572
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1363572.html