当前位置:主页 > 医学论文 > 医卫管理论文 >

面向电子健康档案不完备混合数据的决策模型研究

发布时间:2021-01-25 02:34
  电子健康档案是人们在从事与医疗健康相关的活动时形成的,具有保存备查价值的电子化历史记录。经过十几年的发展,我国已在电子健康档案领域积累了大量的数据信息。利用机器学习方法从丰富的电子健康档案数据信息中自动发现潜藏的医学规律,对于疾病的预防、控制和治疗具有重要作用。然而电子健康档案的特殊性,即高度不完备性和取值模糊性,限制了传统机器学习方法的应用。因此,拓展针对电子健康档案特点的机器学习方法,并将其应用于电子健康档案的决策模型已经是十分必要的。本论文首先提出了一种新的基于面积的模糊变量间距离的度量方法。该方法与最大-最小贴近度距离度量保持一致,但其计算更加简单。随后在这种度量方法的基础上,将k-NN填补算法的应用范围由清晰型数据拓展至模糊型数据,以至清晰模糊混合数据。具体来说就是,采用新提出的模糊变量间距离度量方法来寻找含有缺失值信息的模糊型样例、以及清晰模糊混合样例的“近邻”,之后再利用k个“近邻”的信息对其进行填补。然后将模糊变量简约的概念引入模糊型数据决策模型研究,建立了针对模糊型数据的极速学习机决策模型。该模型首先利用几个不同的模糊变量简约值,将模糊型数据集转化为多个清晰型数据集,... 

【文章来源】:河北大学河北省

【文章页数】:139 页

【学位级别】:博士

【部分图文】:

面向电子健康档案不完备混合数据的决策模型研究


论文研究的技术路线图

模糊变量,可能性分布,三角型,贴近度


图 2-1 三角型模糊变量的可能性分布 图 2-2 梯形模糊变量的可能性分布模糊变量相似性度量方法文以 k-NN 填补算法为基础,扩展其适用范围到模糊的情形,因需寻息样例的 k 个最“相似”样例,故要用到模糊变量间的相似性度量。糊变量之间相似度的工具有贴近度和距离,其中贴近度表示的是两个度,而距离表示两个模糊变量之间的区别程度。它们表示同一事物的两,但一般而言,两者之和为 1。下面介绍几种常见的模糊变量贴近度和最大-最小贴近度[136] , 为两个取离散值 1 2, , ,nx x x的模糊变量,其可能性分布分别为则 , 之间的最大-最小贴近度为: 1( ) ( ), .ni iix xN

模糊变量,可能性分布,梯形,贴近度


图 2-1 三角型模糊变量的可能性分布 图 2-2 梯形模糊变量的可能性分布模糊变量相似性度量方法文以 k-NN 填补算法为基础,扩展其适用范围到模糊的情形,因需寻息样例的 k 个最“相似”样例,故要用到模糊变量间的相似性度量。糊变量之间相似度的工具有贴近度和距离,其中贴近度表示的是两个度,而距离表示两个模糊变量之间的区别程度。它们表示同一事物的两,但一般而言,两者之和为 1。下面介绍几种常见的模糊变量贴近度和最大-最小贴近度[136] , 为两个取离散值 1 2, , ,nx x x的模糊变量,其可能性分布分别为则 , 之间的最大-最小贴近度为: 1( ) ( ), .ni iix xN

【参考文献】:
期刊论文
[1]数据缺失及其处理方法综述[J]. 晔沙.  电子测试. 2017(18)
[2]电子健康档案数据挖掘与整合技术新进展[J]. 张宇,李姣.  中国数字医学. 2017(09)
[3]一种基于极限学习机的缺失数据填充方法[J]. 杨毅,卢诚波.  计算机应用与软件. 2016(10)
[4]基于大数据的精准医疗服务体系研究[J]. 范美玉,陈敏.  中国医院管理. 2016(01)
[5]绿色数据中心不完备能耗大数据填补及分类算法研究[J]. 袁景凌,钟珞,杨光,陈旻骋,顾骏程,李涛.  计算机学报. 2015(12)
[6]不完整大数据的分布式聚类填充算法[J]. 冷泳林,陈志奎,张清辰,鲁富宇.  计算机工程. 2015(05)
[7]海产品安全预警系统缺失数据填补方法[J]. 鄂旭,林爽,金璐璐.  计算机工程与应用. 2015(11)
[8]医疗健康大数据研究综述[J]. 颜延,秦兴彬,樊建平,王磊.  科研信息化技术与应用. 2014(06)
[9]基于Map-Reduce的大数据缺失值填充算法[J]. 金连,王宏志,黄沈滨,高宏.  计算机研究与发展. 2013(S1)
[10]葆宫止血颗粒促进产后子宫复旧的临床疗效观察[J]. 李霞,张利宏,黄俊霞,李真.  重庆医学. 2013(03)

博士论文
[1]几类模糊多属性决策方法及其应用研究[D]. 张惠民.上海大学 2013
[2]混合数据知识发现的粗糙计算模型和算法[D]. 胡清华.哈尔滨工业大学 2008
[3]论现代成本管理模式[D]. 石新武.中国社会科学院研究生院 2001

硕士论文
[1]面向转化医学的EHR数据接口与糖尿病数据挖掘研究[D]. 朱寒阳.浙江大学 2015
[2]海量医疗数据挖掘平台的研究与设计[D]. 闫茜.武汉理工大学 2014
[3]电子健康档案中糖尿病相关因素的数据挖掘研究[D]. 覃艳.电子科技大学 2013
[4]基于电子档案的决策支持系统设计与实现[D]. 靖伟峰.华中科技大学 2008
[5]多元线性回归模型中缺失数据填补方法的效果比较[D]. 袁中萸.中南大学 2008



本文编号:2998388

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yiyuanguanlilunwen/2998388.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c0659***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com