当前位置:主页 > 医学论文 > 医卫管理论文 >

基于机器学习与链路预测的医疗问答检测与推荐系统

发布时间:2020-05-22 22:34
【摘要】:随着“互联网+医疗”的政策不断推动,市场上以患者为中心的医患问答平台越来越多,人们现在可以轻松的在网上进行一些医疗咨询与疾病诊断。但是目前还是存在许多问题,比如各个医患问答平台的数据不互通、平台医生的质量良莠不齐、不能在用户有限时间内回答问题、医生根据片面的描述容易误诊等。本文通过市场调研和分析,开发一个在B/S架构下的医疗问答检测与推荐系统,该系统使用命名实体识别算法和链路预测算法,来实现诸如问答分析、疾病自查、历史记录检索、误诊疾病预测、疾病预测等功能。不仅如此,系统还可以进行新的疾病、症状以及问答记录的更新,可以让系统不断注入新数据。具体来说,本文主要有以下几个方面工作:首先,利用java的htmlunit工具类,针对目前使用频次最多的几个医患问答平台依次编写相应的爬虫规则,爬取当前已经记录的疾病、病症以及医患问答记录,并对数据进行结构化处理。其次,使用双向长短时记忆网络和条件随机场算法,对每个问答记录进行命名实体识别,提取出每个问答的疾病和症状的相关信息,并构建相应的“疾病-症状”网络。然后,本文针对实际数据的特点提出一个更能表现单节点预测正确率的N点连接精确度指标,并在已有的链路预测算法上进行改进,提出NIS算法来进行疾病之间连边的预测和症状之间连边的预测。同时,本文分析了医患平台上疾病频次的分布以及症状在每个疾病中的分布,提出了两种权重矩阵的计算方法来进行疾病的预测。最后,使用SSM框架来搭建该系统,在系统中集成了命名实体识别算法、链路预测算法以及疾病预测算法。系统的前端开发,使用AJAX异步传输所有信息,提升用户使用系统的流畅度。为了提高系统的可维护性,在开发该系统时候,采用前后端分离,前后端的交互利用JSON格式传输数据。同时对外提供了API接口,方便其他开发人员使用本系统的方法和结果。
【图文】:

展开图,循环神经网络,展开图


和 NIS 算法。2.1 命名实体识别相关算法命名实体识别[20]就是在一句或者一段话中,识别一些具有特殊含义或者某一领域的实体,这些实体可以是字、词也可以是特殊文本片段。目前业界较为常用的模型是长短时记忆网络(LSTM)模型,该模型可以很好的处理和预测序列数据。在命名实体识别任务中,词嵌入是较为重要的预训练方法,,目前大多使用的是字嵌入或者词嵌入。在中文词嵌入的研究上,RongchaoYin 等提出 MGE[21]模型,该模型可以结合偏旁部首信息。Shaosheng Cao 等提出以笔画粒度来进行训练[22]。在本文中,我们需要的实体就是“疾病”和“病症”这两类相对应的词语。我们的任务就是在得到的医疗问答中,提取提及到的相应的疾病和病症。2.1.1 循环神经网络循环神经网络可以记住以前的信息,并且利用已经记录下来的以前信息来影响后续信息的输出。

结构示意图,记忆单元,信息输入,状态


图 2-2 LSTM 结构示意图图 2-2 所示,LSTM 在时刻 t 的输入有 3 个,分别是:当前的信息输入 X(t);刻的输出 A(t-1);上一时刻的单元状态 C(t-1)。为了控制长期状态 C,LSTM些“门”来让信息有选择性的来影响网络的输出。图 2-3 长短时记忆单元结构示意图
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP181;TP391.3;R-05

【参考文献】

相关期刊论文 前4条

1 汪鹏;吴昊;;国内外移动互联网医疗应用现状及未来发展趋势探讨[J];中国数字医学;2014年01期

2 袁小毅;;在线医疗革命重启:医疗APP成开路先锋[J];互联网周刊;2012年19期

3 吕琳媛;;复杂网络链路预测[J];电子科技大学学报;2010年05期

4 沈丽宁;;国外健康信息服务现状扫描及启示[J];医学信息学杂志;2010年06期



本文编号:2676712

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/2676712.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ad29d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com