当前位置:主页 > 硕博论文 > 医学硕士论文 >

基于深度神经网络的中文医疗社区问答匹配技术研究

发布时间:2021-01-17 11:18
  随着移动通信技术的发展,越来越多的人在面对健康问题时会通过手机、电脑等电子设备在互联网上搜索相关问题。针对这一现象,各大医疗平台纷纷开发了多个在线医疗问答社区平台,但是面对着越来越多的健康问题,医生的资源是有限的,因此如何通过分析现有的医疗健康问答数据来快速自动回答患者所提出的问题是一个关键的问题。针对这个问题,医疗问题答案如何正确选择是构建自动医疗问答系统的关键内容,因此我们研究了一系列方法尝试从众多候选答案中找出与问题相对应的准确答案。本文主要研究了中文医疗健康领域的问答匹配问题,主要包括两个关键问题:1.如何将文本信息准确的表示为计算机可以处理的向量形式。2.如何构建神经网络模型可以在文本的向量表示中准确捕捉其中的语义信息。针对第一个问题,我们尝试了“分词”与“分字”两种文本表示方法,发现针对中文医疗领域由于目前的分词工具分词的不准确性,直接表示为字向量的方式既可以减少表示矩阵的维度,减少内存和计算需求,还可以提高最终模型的准确率。针对第二个问题,首先我们验证了传统的CNN、RNN以及其变种LSTM与BiGRU神经网络模型在cMedQA、cMedQA2数据集上的问答匹配性能,分析... 

【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校

【文章页数】:68 页

【学位级别】:硕士

【部分图文】:

基于深度神经网络的中文医疗社区问答匹配技术研究


卷积神经网络结构图

结构图,神经网络,结构图,梯度


电子科技大学硕士学位论文10图2-2循环神经网络结构图如上图2-2所示,是循环神经网络的结构示意图[29]。RNN允许信息的持久化,对当前的状态保留记忆。对于同一个RNN来说,其“A结构”共享了一套参数。上图为传统RNN结构的一部分,其中表示t时刻的输入,表示t时刻的输出,tanh表示激活函数。在单个结构里面t时刻的输入和上一时刻的隐藏状态1经过激活函数tanh激活,输出此时的结果,并把结果作为记忆信息输入到下一时刻。=(+1+)(2-14)()=()=+(2-15)传统的RNN在处理长文本的情况时,可以有效捕捉到序列信息,它采取线性序列结构不断从前往后捕捉输入的信息,但这种线性序列结构在反向传播的时候存在优化困难的问题,因为如果反向传播路径太长,会导致严重的梯度消失或梯度爆炸问题。为了解决这个问题,引入了LSTM和门控循环神经网络(GatedRecurrentUnit,GRU)模型,通过增加中间状态信息直接向后传播,以此缓解梯度消失或梯度爆炸的问题。图2-3LSTM结构示意图上图2-3为LSTM结构示意图[29],LSTM有称作为“门”的结构来去除或者

示意图,示意图,梯度,激活函数


电子科技大学硕士学位论文10图2-2循环神经网络结构图如上图2-2所示,是循环神经网络的结构示意图[29]。RNN允许信息的持久化,对当前的状态保留记忆。对于同一个RNN来说,其“A结构”共享了一套参数。上图为传统RNN结构的一部分,其中表示t时刻的输入,表示t时刻的输出,tanh表示激活函数。在单个结构里面t时刻的输入和上一时刻的隐藏状态1经过激活函数tanh激活,输出此时的结果,并把结果作为记忆信息输入到下一时刻。=(+1+)(2-14)()=()=+(2-15)传统的RNN在处理长文本的情况时,可以有效捕捉到序列信息,它采取线性序列结构不断从前往后捕捉输入的信息,但这种线性序列结构在反向传播的时候存在优化困难的问题,因为如果反向传播路径太长,会导致严重的梯度消失或梯度爆炸问题。为了解决这个问题,引入了LSTM和门控循环神经网络(GatedRecurrentUnit,GRU)模型,通过增加中间状态信息直接向后传播,以此缓解梯度消失或梯度爆炸的问题。图2-3LSTM结构示意图上图2-3为LSTM结构示意图[29],LSTM有称作为“门”的结构来去除或者

【参考文献】:
期刊论文
[1]基于注意力长短时记忆网络的中文词性标注模型[J]. 司念文,王衡军,李伟,单义栋,谢鹏程.  计算机科学. 2018(04)
[2]基于注意力机制的双向LSTM模型在中文商品评论情感分类中的研究[J]. 成璐.  软件工程. 2017(11)



本文编号:2982777

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/mpalunwen/2982777.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e819b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com