基于条件随机场的症状信息抽取研究与应用
发布时间:2017-08-25 09:32
本文关键词:基于条件随机场的症状信息抽取研究与应用
更多相关文章: 症状信息抽取 命名实体识别 条件随机场 药品推荐
【摘要】:随着信息化社会的快速发展,“互联网+”的思想已经逐步渗入到各行各业改革创新的浪潮当中。“互联网+医疗”已成为了当今社会对医疗体验的迫切需求。症状信息抽取是医疗信息整合及药品推荐系统等多种应用的技术支撑之一。本文对症状信息抽取进行了分析研究。研究内容包括:1、研究基于条件随机场的症状信息自动抽取方法。对药品说明书文本结构及表达方式进行分析,在此基础上提取症状信息的关键特征:症状主体及症状表达形式特征;利用条件随机场模型结合其他基本本文特征建立症状信息抽取模型。2、研究并提出了基于症状信息文本自动标注结果的症状信息交叉匹配算法。通过分析症状主体和症状表现形式的自动标注结果与症状信息识别结果的关联性,提出了症状信息交叉匹配方法,根据后期识别的症状信息交叉验证症状主体及症状表现形式识别的结果。3、研究基于药品适应症症状库的药品推荐方法。分析了适应症与药品的相关关系以及用户输入文本与推荐药品间的关系。依据TF-IDF权重计算方法提出了症状权重量化方法,并以此为基础结合症状集最大覆盖原则推导了相关药品排名算法。4、设计多组对照实验研究了基于条件随机场的症状信息抽取方法的有效性。实验结果表明,基于条件随机场的分步症状抽取方法可以获取症状的分解信息,并相较于单纯的基于条件随机场模型和基于隐马尔科夫模型的症状信息抽取能达到更高的准确率及召回率。实验证明,基于条件随机场的症状信息抽取方法能够提高症状信息抽取的准确率及召回率,且能较准确地识别出症状主体与症状表现形式。药品推荐有效性实验证明本文提出的症状权重量化算法方法对相关推荐药品的排名结果是合理的,可解释的。
【关键词】:症状信息抽取 命名实体识别 条件随机场 药品推荐
【学位授予单位】:北京化工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:R-05;TP391.1
【目录】:
- 摘要4-6
- ABSTRACT6-15
- 第一章 绪论15-21
- 1.1 研究背景和意义15-16
- 1.2 国内外研究现状16-18
- 1.2.1 信息抽取研究现状16-17
- 1.2.2 推荐系统研究现状17-18
- 1.3 主要研究工作及创新点18-19
- 1.3.1 主要研究工作18-19
- 1.3.2 创新点19
- 1.4 本文章节安排19-21
- 第二章 相关理论21-29
- 2.1 信息抽取相关技术21-24
- 2.1.1 信息抽取概述21
- 2.1.2 隐马尔科夫21-23
- 2.1.3 条件随机场23-24
- 2.1.4 有监督的实体关系抽取24
- 2.1.5 半监督的实体关系抽取24
- 2.2 加权方法24-26
- 2.2.1 布尔函数25
- 2.2.2 TF-IDF权重25-26
- 2.3 推荐技术26-27
- 2.3.1 推荐技术概述26
- 2.3.2 基于内容的推荐26
- 2.3.3 基于协同过滤的推荐26-27
- 2.3.4 基于知识的推荐27
- 2.4 本章小结27-29
- 第三章 基于条件随机场的医药领域症状信息抽取29-37
- 3.1 症状信息抽取流程29-30
- 3.2 标注集选择及标注方案30-32
- 3.2.1 标注集选择30-31
- 3.2.2 标注方案31-32
- 3.3 特征选择32-33
- 3.3.1 词性特征32-33
- 3.3.2 上下文窗口特征33
- 3.3.3 症状主体特征和症状表现形式特征33
- 3.4 症状信息交叉匹配33-35
- 3.4.1 自动标注产生的问题33-34
- 3.4.2 症状信息交叉匹配方法34-35
- 3.5 本章小结35-37
- 第四章 药品推荐系统37-49
- 4.1 系统总体设计37-38
- 4.2 症状库设计38-39
- 4.3 症状信息抽取模块39-43
- 4.3.1 症状信息抽取模型训练39-41
- 4.3.2 症状信息抽取41-43
- 4.4 症状权重计算模块43-44
- 4.5 症状匹配模块44-45
- 4.6 药品推荐模块45-47
- 4.6.1 药品排名算法45-46
- 4.6.2 药品推荐46-47
- 4.7 本章小结47-49
- 第五章 实验分析49-59
- 5.1 实验数据采集49-50
- 5.2 症状信息抽取有效性验证实验50-56
- 5.2.1 实验方案50-52
- 5.2.2 实验评价方法52-53
- 5.2.3 实验结果及分析53-56
- 5.3 药品推荐系统效果验证实验56-57
- 5.4 本章小结57-59
- 第六章 总结与展望59-61
- 6.1 总结59
- 6.2 展望59-61
- 参考文献61-65
- 致谢65-67
- 研究成果及发表的学术论文67-69
- 作者及导师介绍69-71
- 附件71-72
【参考文献】
中国期刊全文数据库 前10条
1 王巍;赵铁军;辛国栋;徐永东;;基于条件随机域模型的比较要素抽取研究[J];自动化学报;2015年08期
2 王龙;王嘉伦;程转丽;李然;张引;;基于张量分解的药品个性化推荐[J];计算机科学;2015年05期
3 刘凯;周雪忠;于剑;张润顺;;基于条件随机场的中医临床病历命名实体抽取[J];计算机工程;2014年09期
4 刘建伟;黎海恩;罗雄麟;;概率图模型表示理论[J];计算机科学;2014年09期
5 胡勋;孟祥武;张玉洁;史艳翠;;一种融合项目特征和移动用户信任关系的推荐算法[J];软件学报;2014年08期
6 孙光福;吴乐;刘淇;朱琛;陈恩红;;基于时序行为的协同过滤推荐算法[J];软件学报;2013年11期
7 顾进广;罗超;黄智生;;基于中文自然语言的合理用药查询[J];工业控制计算机;2013年08期
8 叶枫;陈莺莺;周根贵;李昊e,
本文编号:736341
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/736341.html