基于知识图谱的医疗问答系统研究与开发
发布时间:2021-09-23 07:26
随着互联网和人工智能技术的飞速发展,自动问答系统成为一种新的人机交互方式。医疗健康问题是人们生活中最关心的问题之一,网络上的各类医疗信息也越来越丰富。目前,网上各类医疗知识存在主观性较强,缺乏针对性,而且由于医疗领域知识专业且复杂,现有的医疗科普网站难以根据用户的各种问题给出针对性强的回答。知识图谱以接近人类认知思维的形式对数据进行组织和理解,为互联网上海量、异构、动态的大数据管理和使用提供了一种优秀的解决方案。论文设计并开发了基于医疗知识图谱的问答系统,可以帮助用户在海量医疗数据中筛选出问题的精准答案并返回给用户。本文针对问答系统的研究内容主要包含以下方面:(1)研究如何构建一个高质量的医学领域知识图谱,主要分为数据收集、数据清洗和知识存储。首先,利用网络爬虫在医疗网站上抽取数据,并通过设置停用词库过滤数据和词汇切分的方式对数据进行清洗,然后对得到的数据进行医疗实体、实体关系和实体属性的定义,再将它们写入Neo4j图数据库;(2)研究如何实现问答系统的问答任务。首先针对缺乏问答训练语料和标注数据的问题进行了问答语料生成,并对原始语料进行自动标注,得到训练语料,再对用户问句进行语义解析...
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
图3.7医疗实体关系类型数量分布图??知识图谱的实体属性类标签包含以下8种类型:疾病名称、疾病简介、疾病病??因、预防措施、治疗周期、治疗方式、治愈概率、易感人群
?相对较校如句子“我头疼发烧流鼻涕,这是什么病??”与句子“这是什么病?我??最近发烧流鼻涕头疼”虽然整体和局部的语序都有变化,但其句子意图并没有发生??改变,因而用卷积神经网络对短文本进行语义表示可以取得较好的效果,如今CNN??常被用于表示句子级别的信息以及短文本分类的任务。??textCNN是利用卷积神经网络对文本进行分类的算法,文中釆用textCNN网络??对用户问句进行语义解析,利用被识别的医疗实体和语义关系实现对用户问句的类??别分类。其中textCNN网络的模型结构如图4.6所示。??5*d*k??/IS?—??l_t===?2,日’?5\??吃??????_?y?_?—??n?—?國??■??? ̄?*k?Q?p?1? ̄1?*c?disease_drug??—睡一,麗\@*m/??\?3*d*k?I?/??ESL;LJi:?Lj?Z1-1??\?mu?I_?I??[j*k??v?v?v?y??/—v—’K?v?J?K ̄ ̄v—’v ̄v ̄J??g?convolutional?flattening?fully-c〇nnecti〇n?softmax?prediction??max-pooling??图4.6?textCNN文本分类模型结构图??35??
让用户对医疗专业知识有更直观和全面的认识,我们考虑实现一个知识检??索的交互功能,该功能使知识以结构化、有关联度的可视化图谱形式展现在用户面??前。文中通过Bask对Ne〇4j图数据库的结果查询界面进行访问,再通过Ajax与后??台进行数据传递,使用户能在web端进行疾病信息检索的UI交互。??5.2系统总体架构设计??由以上的需求分析,本章将整合上文的问答服务和前端界面,构建一个以知识??图谱作为数据基础的医疗自动问答服务系统,该系统名称为“医易达”辅助诊疗系??统,整体架构图如图5.1所示。??(?r?\??应用服务层?医疗辅助问答服务?疾病信息检索??、?匕?^?」?J??(?( ̄生成器_ ̄ ̄〕「」」、口]旬傭〕( ̄ ̄査询逻辑映射 ̄^??知识库?「?数据冷启动?!?医疗实体识别!?,?,??—二二二二二二二二二二二:二?一?!?Cycher?语句映射?|??I?口J?口辰?「一?一—丨?丨医疗实体关系/属i映射丨?'?"??V?vv?J?V ̄ ̄?^?J?V?/??(?(^?獅—驗____、1?f?医疗知识表示与存储?^1??:网络爬虫爬取半结构化数据丨?产?-、??知识库,二二::-厂二-二-^二二1、一格式化一匕?_3体、—属JLJ??构建层!?tm?!?!?Sli?i?!?SS?|?「创建节点:关系_,—写又数据??^?丨、???I?VJP^T?J?I???????I?、?^?^?J??图5.1系统整体架构图??具体上,“医易达”系统的搭建自底向上主要有知识图谱构建层、知识图谱问答??层、应用服务层。??(1)知识图谱构
【参考文献】:
期刊论文
[1]基于LSTM-SPA的医学领域问答技术研究[J]. 毕铭文,左敏,张青川. 山东工业技术. 2019(01)
[2]基于专家生成内容的领域知识图谱构建[J]. 李保珍,苏菁. 情报科学. 2018(10)
[3]基于图计算和知识图谱的疾病辅助诊别研究[J]. 李苗苗,邢凯,张利萍,钟春琳,龚海华. 电子技术. 2018(09)
[4]基于甲状腺知识图谱的自动问答系统的设计与实现[J]. 马晨浩. 智能计算机与应用. 2018(03)
[5]人工智能在医学诊断知识图谱构建中的应用研究[J]. 聂莉莉,李传富,许晓倩,朱川川,徐志鹏,武红利. 医学信息学杂志. 2018(06)
[6]医学百科知识图谱构建[J]. 刘燕,傅智杰,李姣,侯丽. 中华医学图书情报杂志. 2018(06)
[7]面向知识自动化的自动问答研究进展[J]. 曾帅,王帅,袁勇,倪晓春,欧阳永基. 自动化学报. 2017(09)
[8]医学知识图谱构建技术与研究进展[J]. 袁凯琦,邓扬,陈道源,张冰,雷凯. 计算机应用研究. 2018(07)
[9]国外医学领域自动问答系统研究现状及启示[J]. 张芳芳,马敬东,王小贤,卢乃吉,夏晨曦. 医学信息学杂志. 2017(03)
[10]信息抽取研究综述[J]. 郭喜跃,何婷婷. 计算机科学. 2015(02)
硕士论文
[1]基于Flask技术的分布式Android产品验证系统[D]. 陈一欣.电子科技大学 2019
本文编号:3405292
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
图3.7医疗实体关系类型数量分布图??知识图谱的实体属性类标签包含以下8种类型:疾病名称、疾病简介、疾病病??因、预防措施、治疗周期、治疗方式、治愈概率、易感人群
?相对较校如句子“我头疼发烧流鼻涕,这是什么病??”与句子“这是什么病?我??最近发烧流鼻涕头疼”虽然整体和局部的语序都有变化,但其句子意图并没有发生??改变,因而用卷积神经网络对短文本进行语义表示可以取得较好的效果,如今CNN??常被用于表示句子级别的信息以及短文本分类的任务。??textCNN是利用卷积神经网络对文本进行分类的算法,文中釆用textCNN网络??对用户问句进行语义解析,利用被识别的医疗实体和语义关系实现对用户问句的类??别分类。其中textCNN网络的模型结构如图4.6所示。??5*d*k??/IS?—??l_t===?2,日’?5\??吃??????_?y?_?—??n?—?國??■??? ̄?*k?Q?p?1? ̄1?*c?disease_drug??—睡一,麗\@*m/??\?3*d*k?I?/??ESL;LJi:?Lj?Z1-1??\?mu?I_?I??[j*k??v?v?v?y??/—v—’K?v?J?K ̄ ̄v—’v ̄v ̄J??g?convolutional?flattening?fully-c〇nnecti〇n?softmax?prediction??max-pooling??图4.6?textCNN文本分类模型结构图??35??
让用户对医疗专业知识有更直观和全面的认识,我们考虑实现一个知识检??索的交互功能,该功能使知识以结构化、有关联度的可视化图谱形式展现在用户面??前。文中通过Bask对Ne〇4j图数据库的结果查询界面进行访问,再通过Ajax与后??台进行数据传递,使用户能在web端进行疾病信息检索的UI交互。??5.2系统总体架构设计??由以上的需求分析,本章将整合上文的问答服务和前端界面,构建一个以知识??图谱作为数据基础的医疗自动问答服务系统,该系统名称为“医易达”辅助诊疗系??统,整体架构图如图5.1所示。??(?r?\??应用服务层?医疗辅助问答服务?疾病信息检索??、?匕?^?」?J??(?( ̄生成器_ ̄ ̄〕「」」、口]旬傭〕( ̄ ̄査询逻辑映射 ̄^??知识库?「?数据冷启动?!?医疗实体识别!?,?,??—二二二二二二二二二二二:二?一?!?Cycher?语句映射?|??I?口J?口辰?「一?一—丨?丨医疗实体关系/属i映射丨?'?"??V?vv?J?V ̄ ̄?^?J?V?/??(?(^?獅—驗____、1?f?医疗知识表示与存储?^1??:网络爬虫爬取半结构化数据丨?产?-、??知识库,二二::-厂二-二-^二二1、一格式化一匕?_3体、—属JLJ??构建层!?tm?!?!?Sli?i?!?SS?|?「创建节点:关系_,—写又数据??^?丨、???I?VJP^T?J?I???????I?、?^?^?J??图5.1系统整体架构图??具体上,“医易达”系统的搭建自底向上主要有知识图谱构建层、知识图谱问答??层、应用服务层。??(1)知识图谱构
【参考文献】:
期刊论文
[1]基于LSTM-SPA的医学领域问答技术研究[J]. 毕铭文,左敏,张青川. 山东工业技术. 2019(01)
[2]基于专家生成内容的领域知识图谱构建[J]. 李保珍,苏菁. 情报科学. 2018(10)
[3]基于图计算和知识图谱的疾病辅助诊别研究[J]. 李苗苗,邢凯,张利萍,钟春琳,龚海华. 电子技术. 2018(09)
[4]基于甲状腺知识图谱的自动问答系统的设计与实现[J]. 马晨浩. 智能计算机与应用. 2018(03)
[5]人工智能在医学诊断知识图谱构建中的应用研究[J]. 聂莉莉,李传富,许晓倩,朱川川,徐志鹏,武红利. 医学信息学杂志. 2018(06)
[6]医学百科知识图谱构建[J]. 刘燕,傅智杰,李姣,侯丽. 中华医学图书情报杂志. 2018(06)
[7]面向知识自动化的自动问答研究进展[J]. 曾帅,王帅,袁勇,倪晓春,欧阳永基. 自动化学报. 2017(09)
[8]医学知识图谱构建技术与研究进展[J]. 袁凯琦,邓扬,陈道源,张冰,雷凯. 计算机应用研究. 2018(07)
[9]国外医学领域自动问答系统研究现状及启示[J]. 张芳芳,马敬东,王小贤,卢乃吉,夏晨曦. 医学信息学杂志. 2017(03)
[10]信息抽取研究综述[J]. 郭喜跃,何婷婷. 计算机科学. 2015(02)
硕士论文
[1]基于Flask技术的分布式Android产品验证系统[D]. 陈一欣.电子科技大学 2019
本文编号:3405292
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3405292.html
最近更新
教材专著