基于医学知识图谱的疾病智能诊断研究
发布时间:2021-01-18 21:29
随着人工智能技术的发展,知识图谱、分类、聚类等方法已经成为了人工智能应用的基础技术。同时,智慧医疗作为人工智能应用的主要组成部分,得到了越来越多的关注。由于人们更加注重自身健康管理,互联网中医学相关服务和网站也随之增多,海量的医学数据不断产生。如何整合互联网中专业医学知识形成医学知识图谱,并基于知识图谱提供疾病诊断服务成为了关键问题。本文针对常见疾病的智能诊断,提出了基于知识图谱的疾病诊断方法。主要研究了医学领域的知识图谱构建方法,和基于知识图谱的疾病智能诊断模型。本文的工作包括两部分,一是医学知识图谱构建。医学知识图谱的构建首先从互联网专业医学网站爬取医学数据,采用基于词典和规则的方法实现知识的提取,并采用属性图的表示方法将医学知识图谱存储于Neo4J图数据库中,最后基于知识图谱的集成实体对齐方法实现知识融合,形成完整的医学知识图谱;二是疾病智能诊断模型设计。本文根据医学知识图谱,提出了疾病症状关系量化方法,并将其应用在疾病智能诊断模型中。本文设计的疾病智能诊断模型的工作流程为:通过查询用户选择的特征信息与医学知识图谱间的匹配关系,并结合基于知识图谱和疾病-症状关系量化结果,推理用户...
【文章来源】:湖南大学湖南省 211工程院校 985工程院校 教育部直属院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
图2.1小型社交网络图??超图:足一种广义上的图模型,在超图中,一条联系(超边)可以关联任意??
工程硕士学位论文??超图模型允许联系在任何一端都关联任意多个节点。超图适用于多对多联系占主??体的领域。例如,在如下图2.2所示,张三和李四都关注了王五、赵六、孙八,??在超图中只要一条边就可以表达这种联系,而在属性图模型中需要6条边来表示。??z--一用户丨?,一?1用户??(Name:张三)Hame:李四)??Name:王五)?、Name:赵六?J?(?Name:孙八)??图2.2有向超图??三元组是一个包含主谓宾的数据结构。用三元组可以捕捉到这样的事实,例??如“张三喜欢李四”、“李四喜欢看电影”。单独来说,单个三元组的语义是很??溃泛的,但它们提供勒丰富的数据集,可以从中获得知识和推断关联。三元组存??储一般会提供SPARQL的能力用来推断,还提供存储的资源描述框架(RDF)数??据。RDF是三元组存储和语义网世界的通用语,它可以用几种不同的方式序列化。??下面这段代码展示了三元组如何使用RDF/XML格式聚合成关联数据。??<rdf:RDF?xmlnsirdf?=?“http://www.w3.0rg/l990/02/22-rdf-syntax-ns#”??xmlns?=?“?http://www.example.org/terms/”?>??<rdf:Description?rdf:about=”?http://www.example.org/ginger
切割出包含每个数字的图像片段。第二步每个图像片段生成字符矩阵,使用SVM??算法进行分类,识别验证码;对于需要登陆才能访问的网站,提前将用户名、密??码信息保存,采用模拟浏览器插件提交用户名和密码。总体流程如图3.?2所示:??开始???4/???初始URL??静态或^?js动态加载判斬网json或类似json格式??、,??|?js动态力卩载??、■,??■雖包方法?? ̄ ̄T ̄ ̄? ̄ ̄r?1—??????判断是否需N?判断杲否??登陆?—一一'?验证码^^一>—??提父f名峦??识别验证码??jr ̄i[ ̄ ̄zi???????j?:??獅特定内容—_?—-抓取网页??(‘束??图3.2网络爬虫流程图??3.4医学领域知识提取??知识杣収包括实体、属性、关系提取。通过上一小结的爬虫技术,我们获収??了丁香园、飞华健康网、药监局、健客网等专业网站的疾病、症状、药品描述、??问答数据等。通过这些文本数据,我们需要提取症状、疾病、药品、人群、科室、??部位等实体,以及各实体的属性和各实体间的关系。由于我们爬収数据的网站在??医学知识描述上采用了较为规范的语言表达,爬取的数据也都为标签加文本描述??的格式,例如在疾病描述信息中,爬取的数据结构包括概述、病因、症状、检查、??治疗、并发症、预防、饮食、相关疾病、发病部位、科室、高发人群等
【参考文献】:
期刊论文
[1]医学知识图谱构建技术与研究进展[J]. 袁凯琦,邓扬,陈道源,张冰,雷凯. 计算机应用研究. 2018(07)
[2]基于Python语言和支持向量机的字符验证码识别[J]. 杨雄. 数字技术与应用. 2017(04)
[3]“Al+医疗”人工智能的下一个风口?[J]. 丁毓. 上海信息化. 2017(03)
[4]知识图谱学习和推理研究进展[J]. 吴运兵,杨帆,赖国华,林开标. 小型微型计算机系统. 2016(09)
[5]知识图谱技术综述[J]. 徐增林,盛泳潘,贺丽荣,王雅芳. 电子科技大学学报. 2016(04)
[6]人工智能革命“助燃剂”:机器学习[J]. 祝叶华. 科技导报. 2016(07)
[7]知识图谱构建技术综述[J]. 刘峤,李杨,段宏,刘瑶,秦志光. 计算机研究与发展. 2016(03)
[8]知识库实体对齐技术综述[J]. 庄严,李国良,冯建华. 计算机研究与发展. 2016(01)
[9]一种新的组合分类器学习方法[J]. 郭华平,袁俊红,张帆,邬长安,范明. 计算机科学. 2014(07)
[10]基于智能算法的胸腔疾病辅助鉴别[J]. 荆斌,张鹏,陈文霞,李巍,査玉华,尚学义. 中国医学装备. 2012(07)
硕士论文
[1]面向中文知识图谱的数据重组与应用[D]. 陈柏良.上海交通大学 2015
[2]基于规则的汉语兼类词标注方法研究[D]. 李华栋.西南交通大学 2014
本文编号:2985701
【文章来源】:湖南大学湖南省 211工程院校 985工程院校 教育部直属院校
【文章页数】:63 页
【学位级别】:硕士
【部分图文】:
图2.1小型社交网络图??超图:足一种广义上的图模型,在超图中,一条联系(超边)可以关联任意??
工程硕士学位论文??超图模型允许联系在任何一端都关联任意多个节点。超图适用于多对多联系占主??体的领域。例如,在如下图2.2所示,张三和李四都关注了王五、赵六、孙八,??在超图中只要一条边就可以表达这种联系,而在属性图模型中需要6条边来表示。??z--一用户丨?,一?1用户??(Name:张三)Hame:李四)??Name:王五)?、Name:赵六?J?(?Name:孙八)??图2.2有向超图??三元组是一个包含主谓宾的数据结构。用三元组可以捕捉到这样的事实,例??如“张三喜欢李四”、“李四喜欢看电影”。单独来说,单个三元组的语义是很??溃泛的,但它们提供勒丰富的数据集,可以从中获得知识和推断关联。三元组存??储一般会提供SPARQL的能力用来推断,还提供存储的资源描述框架(RDF)数??据。RDF是三元组存储和语义网世界的通用语,它可以用几种不同的方式序列化。??下面这段代码展示了三元组如何使用RDF/XML格式聚合成关联数据。??<rdf:RDF?xmlnsirdf?=?“http://www.w3.0rg/l990/02/22-rdf-syntax-ns#”??xmlns?=?“?http://www.example.org/terms/”?>??<rdf:Description?rdf:about=”?http://www.example.org/ginger
切割出包含每个数字的图像片段。第二步每个图像片段生成字符矩阵,使用SVM??算法进行分类,识别验证码;对于需要登陆才能访问的网站,提前将用户名、密??码信息保存,采用模拟浏览器插件提交用户名和密码。总体流程如图3.?2所示:??开始???4/???初始URL??静态或^?js动态加载判斬网json或类似json格式??、,??|?js动态力卩载??、■,??■雖包方法?? ̄ ̄T ̄ ̄? ̄ ̄r?1—??????判断是否需N?判断杲否??登陆?—一一'?验证码^^一>—??提父f名峦??识别验证码??jr ̄i[ ̄ ̄zi???????j?:??獅特定内容—_?—-抓取网页??(‘束??图3.2网络爬虫流程图??3.4医学领域知识提取??知识杣収包括实体、属性、关系提取。通过上一小结的爬虫技术,我们获収??了丁香园、飞华健康网、药监局、健客网等专业网站的疾病、症状、药品描述、??问答数据等。通过这些文本数据,我们需要提取症状、疾病、药品、人群、科室、??部位等实体,以及各实体的属性和各实体间的关系。由于我们爬収数据的网站在??医学知识描述上采用了较为规范的语言表达,爬取的数据也都为标签加文本描述??的格式,例如在疾病描述信息中,爬取的数据结构包括概述、病因、症状、检查、??治疗、并发症、预防、饮食、相关疾病、发病部位、科室、高发人群等
【参考文献】:
期刊论文
[1]医学知识图谱构建技术与研究进展[J]. 袁凯琦,邓扬,陈道源,张冰,雷凯. 计算机应用研究. 2018(07)
[2]基于Python语言和支持向量机的字符验证码识别[J]. 杨雄. 数字技术与应用. 2017(04)
[3]“Al+医疗”人工智能的下一个风口?[J]. 丁毓. 上海信息化. 2017(03)
[4]知识图谱学习和推理研究进展[J]. 吴运兵,杨帆,赖国华,林开标. 小型微型计算机系统. 2016(09)
[5]知识图谱技术综述[J]. 徐增林,盛泳潘,贺丽荣,王雅芳. 电子科技大学学报. 2016(04)
[6]人工智能革命“助燃剂”:机器学习[J]. 祝叶华. 科技导报. 2016(07)
[7]知识图谱构建技术综述[J]. 刘峤,李杨,段宏,刘瑶,秦志光. 计算机研究与发展. 2016(03)
[8]知识库实体对齐技术综述[J]. 庄严,李国良,冯建华. 计算机研究与发展. 2016(01)
[9]一种新的组合分类器学习方法[J]. 郭华平,袁俊红,张帆,邬长安,范明. 计算机科学. 2014(07)
[10]基于智能算法的胸腔疾病辅助鉴别[J]. 荆斌,张鹏,陈文霞,李巍,査玉华,尚学义. 中国医学装备. 2012(07)
硕士论文
[1]面向中文知识图谱的数据重组与应用[D]. 陈柏良.上海交通大学 2015
[2]基于规则的汉语兼类词标注方法研究[D]. 李华栋.西南交通大学 2014
本文编号:2985701
本文链接:https://www.wllwen.com/yixuelunwen/swyx/2985701.html