当前位置:主页 > 医学论文 > 医卫管理论文 >

面向中文医疗问题检索的语义匹配技术研究

发布时间:2020-07-10 07:47
【摘要】:随着医疗问答社区逐渐兴起,越来越多的用户通过这些医疗服务平台进行在线查询和问诊。目前医疗问答社区主要通过搜索引擎提供问题检索服务,基于精确匹配的检索方法不能充分地理解用户查询的语义,同时难以应对多样的医学实体表述。有监督学习方法是解决语义匹配任务的常用方法,由于中文医疗领域缺乏语义匹配标注数据,难以很好地利用有监督的语义匹配模型提升医疗社区的问题检索效果。因此,本文重点研究了面向医疗问题检索的语义匹配方法,通过数据集构建、模型改进和迁移学习等方法缓解医疗领域缺乏问句匹配标注数据的问题。本文主要工作包括如下几个方面:·中文医疗领域语义匹配数据集的构建为了解决中文医疗领域缺乏问句匹配标注数据的问题,本文提出了一种半自动化的语料挖掘和数据集构建方法。基于医疗社区的公开问答数据,构建了大规模的中文医疗相似问句对数据集(CMSQP数据集)。为了正确理解和区分医学实体多样化的表述,本文利用开源知识库和医疗垂直网站的百科知识,获取医学实体及其多种表述,构建大规模的中文医疗实体表述词典。·基于Transformer改进的语义匹配模型由于大多数基于LSTM的深度语义匹配模型存在复杂度高、计算速度慢等问题,本文在Transformer模型基础上进行改进,提出了一种面向语义匹配任务的TMTransformer模型。该模型利用Multi-Head Attention机制同时学习语义表示和语义交互特征。在本文构建的CMSQP数据集和公开数据上进行实验,TMTransformer模型比现有工作实验效果更好、复杂度更低,验证了该模型在语义匹配任务上的有效性。·基于迁移学习的语义匹配方法本文设计了两种迁移学习方法提升医疗领域语义匹配任务的效果:跨领域的迁移学习和跨任务的迁移学习。跨领域迁移学习方法实现了不同数据源之间的知识迁移过程;跨任务迁移学习方法通过预训练多分类任务提升语义匹配模型的性能。通过实验验证了两种迁移策略对医疗领域语义匹配任务的提升作用,对比分析了两种迁移策略的效果、收敛速度及适用场景。
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.1;R-05
【图文】:

整体流,问题,答案,详情


个医生的回复。相关问答信息包含网站提供的意图相近或相关的问题及其答案列表,从中抽取医疗问句及其相关的问题。以抽取“中风”类别下的问题为例,说明寻医问药网的数据抽取流程。如图3.6所示,寻医问药网按照一级科室(内科)、二级科室(心血管内科)和疾病(中风)的类别对问答数据进行分类,从问题列表页可以得到该分类下所有问题的详情页面。在问题“到哪里看中风”的详情页面,在问题信息板块抽取标题、病情描述和部分相似问题列表。答案信息板块仅有一名医生提供答案,但未能提供用户需要的信息。相关问答板块有多个网站编辑的候选相似问题及其答案。抽取问题详情页的所有相似问题构成候选问题列表 q C = Q1, Q2, ..., Qm。23

数据集,神经网络模型,模型,注意力


说明只采用其中一种注意力编码层的建模作用是有限的。通过结合两种注意力编码层才能使得 TMTransformer 模型整体效果达到较高水平。对比各模型在公开数据集上的性能 图4.4展示了各个模型在 Financial2018 数据集上的 F1 指标。从图中分析可知,TMTransformer 模型比 ESIM 和 BiMPM 的性能更高,说明了本文提出的模型具有良好的泛化能力,在语义匹配任务上比大多数模型表现更好。综合来看,在该数据集上表现最好的是 SSE 模型,主要原因是该模型使用了三层 BiLSTM 作为句特征编码器,极大程度上保留了更多文本语义特征。47

对比图,模型训练,变化情况,对比图


Loss的影响 为了进一步验证跨任务迁移学习方法的效果,本文对比了该迁移策略对 TMTransformer 模型训练 Loss 的影响,如图5.6所示。从图中结果分析,该迁移策略可以有效降低 Loss,使得模型收敛到更优。图 5.6: TMTransformer 模型训练阶段 Loss 变化情况对比图从上述分析结果可知,本文设计的跨任务迁移学习方法可以在一定程度上缓解63

【相似文献】

相关期刊论文 前10条

1 张佩云;黄波;孙亚民;;面向服务组合的服务语义匹配机制[J];电子科技大学学报;2008年06期

2 郝玫;马建峰;;基于特征观点对语义匹配的产品评论可信度研究[J];现代情报;2019年06期

3 贾君枝;毛海飞;;基于法律框架网络本体的语义匹配技术研究[J];情报理论与实践;2008年01期

4 糜德吉;周良;丁秋林;;一种基于命名空间过滤的服务语义匹配算法[J];中国制造业信息化;2009年23期

5 邢华桥;武昊;侯妙乐;侯东阳;;顾及语义匹配类别的遥感处理服务组合方法[J];地理与地理信息科学;2015年05期

6 罗安;王艳东;龚健雅;;顾及上下文的空间信息服务组合语义匹配方法[J];武汉大学学报(信息科学版);2011年03期

7 姚俊良;乐小虬;;科技查新查新点语义匹配方法研究[J];数据分析与知识发现;2019年06期

8 吴少洪;彭敦陆;苑威威;陈章;刘丛;;MGSC:一种多粒度语义交叉的短文本语义匹配模型[J];小型微型计算机系统;2019年06期

9 梁汝鹏;邓克波;毛泽湘;徐沛;;基于军事知识图谱的作战预案语义匹配方法研究[J];指挥与控制学报;2019年02期

10 张燕;王锋;张睿;;基于本体的网格服务语义匹配方法[J];计算机工程;2007年07期

相关会议论文 前6条

1 李耀春;徐羽琼;李石坚;潘纲;;面向任务迁移的组件语义匹配机制[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年

2 李贵;张兆鑫;李征宇;韩子洋;;WEB环境下基于领域本体的语义匹配技术研究[A];科学发展与社会责任(A卷)——第五届沈阳科学学术年会文集[C];2008年

3 臧立丽;王卓;冯晓宁;;一种基于语义的软构件检索方法[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年

4 吴桂芳;刘俊;张倩倩;谷雨;;基于本体的语义匹配技术研究[A];2014第二届中国指挥控制大会论文集(上)[C];2014年

5 林小青;李毕琴;;刺激属性的不一致对工作记忆内容捕获注意的影响[A];第二十一届全国心理学学术会议摘要集[C];2018年

6 白东伟;彭泳;陈俊亮;;一种语义支持的综合业务发现框架[A];2006年全国通信软件学术会议论文集[C];2006年

相关博士学位论文 前8条

1 黄涛;知识服务的语义匹配机制研究[D];华中师范大学;2007年

2 许楠;基于本体的上下文感知计算关键技术研究[D];大连海事大学;2015年

3 钱剑锋;分布式语义发布/订阅系统的若干关键技术研究[D];浙江大学;2011年

4 蔺旭东;基于语义的XML查询及规范化研究[D];北京交通大学;2010年

5 高建波;本体模型及其在信息安全评估领域的应用研究[D];上海交通大学;2015年

6 杨柳;模糊本体建模方法及语义信息处理策略研究[D];中南大学;2011年

7 陈科;语义支持的空间信息服务组合关键技术研究[D];解放军信息工程大学;2012年

8 江志雄;基于动态语义的Web服务描述[D];复旦大学;2008年

相关硕士学位论文 前10条

1 金丽娇;基于深度学习的答案选择方法研究[D];华东师范大学;2019年

2 王坤;面向中文医疗问题检索的语义匹配技术研究[D];华东师范大学;2019年

3 吴承泽;面向社区论坛多轮对话线索的连贯性评估方法研究[D];哈尔滨工业大学;2018年

4 胡宇;面向数据融合的文本语义匹配的研究与实现[D];东北大学;2015年

5 张杰;基于地理语义匹配的信息一体化检索[D];中南大学;2013年

6 邢昆明;基于语义匹配的Web服务发现和选择问题的研究[D];中国石油大学(华东);2013年

7 李玲;工作记忆内容的语义匹配对注意捕获效应的影响[D];江西师范大学;2017年

8 邓憧;基于CNN语义匹配的自动问答系统构建方法研究[D];哈尔滨工业大学;2017年

9 陈志俊;语义Web服务发现机制研究[D];合肥工业大学;2011年

10 江萍;基于领域本体的云制造服务语义匹配模型的研究[D];合肥工业大学;2013年



本文编号:2748635

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/2748635.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户67709***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com