当前位置:主页 > 医学论文 > 呼吸病论文 >

数据挖掘技术在肺结核疾病诊断中的应用研究

发布时间:2018-05-07 22:39

  本文选题:肺结核疾病 + 粗糙集 ; 参考:《吉林农业大学》2017年硕士论文


【摘要】:结核病多年来一直严重威胁着各国人民的身体健康。我国是全球22个结核病高负担国家之一。信息技术的不断进步,不断发展,各大医院中中也都使用医疗管理系统进行日常工作,使得其在医疗设备和仪器的数字化后,信息量也在不断的增长扩大。如何通过高效、智能的计算机算法对海量肺结核疾病诊疗数据进行数据挖掘,并进行智能诊断,是本文研究内容。通过收集整理北京市昌平区结核病防治所、北京市结核病控制研究所的8210例肺结核病人档案,应用数据库技术,构建基于SQL Server 2010的疾病电子档案,运用数据挖掘方法中的粗糙集和决策树方法,建立肺结核疾病智能诊断模型。考虑到医学大数据及数据共享,本文搭建了基于hadoop的大数据平台,构建肺结核疾病诊断智能诊断云系统,以满足医学大数据的需求。本文的研究内容及主要工作包含以下4点:1、本文对数据集进行预处理后,优化了数据集,以应对医学数据中的存在噪声、不完全的问题。本文选择数据挖掘中的聚类方法对肺结核疾病数据进行预处理;保证数据的一致性和不确定性,并将其转化为适合挖掘的形式。该项操作,能够很好地进行后期高质量的数据挖掘。2、肺结核疾病因个体不同所表现出的症状也有差异,数据属性众多,导致挖掘效率不高。针对这一问题,本文运用粗糙集理论进行属性约简,并提出适用于SQL语言条件信息熵计算方法,完成属性约简。利用基于数据库的粗糙集属性约简方法,去除了肺结核疾病数据中的冗余属性。3、在模型构建中,针对单一挖掘方法挖掘效率不高的问下,本研究应用粗糙集和决策树相结合的方法完成模型构建。对比使用单一的决策树方法和粗糙集方法,本文提出的粗糙集约简与决策树规则提取相融合的优化算法,具有良好的适用性及优势,在保证诊断的客观性的前提下,有效的提高了肺结核疾病诊断的准确性。4、为满足不断增长的医学大数据的需求,本文在构建肺结核疾病诊断模型的基础上,应用hadoop技术搭建大数据云平台,并建立肺结核疾病智能诊断系统,将云计算应用到医疗系统当中,有效地处理医疗数据,为肺结核疾病诊断提供决策支持。
[Abstract]:Tuberculosis has been a serious threat to the health of people all over the world for many years. China is one of the 22 countries with high TB burden. With the continuous progress and development of information technology, medical management system is also used in every hospital for daily work, which makes the amount of information increase and expand after the digitization of medical equipment and instruments. How to mine the data of massive tuberculosis diagnosis and treatment data and make intelligent diagnosis by efficient and intelligent computer algorithm is the research content of this paper. Through collecting and sorting out the records of 8210 cases of tuberculosis patients from the Institute of Tuberculosis Control and Prevention in Changping District, Beijing, and applying the database technology, the electronic archives of diseases based on SQL Server 2010 were constructed. The intelligent diagnosis model of pulmonary tuberculosis is established by using rough set and decision tree method in data mining. Considering the medical big data and the data sharing, this paper builds an intelligent diagnostic cloud system based on hadoop for diagnosis of pulmonary tuberculosis, in order to meet the needs of medical big data. The research contents and main work of this paper include the following 4 points: 1. After preprocessing the data set, we optimize the data set to deal with the problem of noise and incomplete in medical data. In this paper, we choose the clustering method in data mining to preprocess the data of tuberculosis disease, ensure the consistency and uncertainty of the data, and transform it into a form suitable for mining. This operation can well carry out high quality data mining in the later period. The symptoms of pulmonary tuberculosis disease are different because of the different individuals, and the data attributes are numerous, which leads to the low efficiency of mining. In order to solve this problem, this paper applies rough set theory to attribute reduction, and proposes a method for computing conditional information entropy in SQL language to complete attribute reduction. Using the attribute reduction method of rough set based on database, the redundant attribute. 3 in the tuberculosis disease data is removed. In the model construction, the mining efficiency of the single mining method is not high. In this study, rough set and decision tree are used to build the model. Compared with the single decision tree method and rough set method, this paper proposes an optimization algorithm which combines rough set reduction and decision tree rule extraction, which has good applicability and advantages, and ensures the objectivity of diagnosis. The accuracy of pulmonary tuberculosis diagnosis is improved effectively. In order to meet the increasing demand of medical big data, this paper builds a diagnosis model of pulmonary tuberculosis, and applies hadoop technology to build the big data cloud platform. The intelligent diagnosis system of tuberculosis disease is established and cloud computing is applied to the medical system to deal with the medical data effectively and to provide decision support for the diagnosis of tuberculosis disease.
【学位授予单位】:吉林农业大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:R521;TP311.13

【相似文献】

相关期刊论文 前10条

1 谢和宇,许龙善,黄柏芳,王均乐,刘兴柱;决策树方法在福建疟区现场应用研究[J];卫生经济研究;1997年07期

2 张燕;汪卫霞;;决策树方法在药物选择模型中的应用[J];大众科技;2013年12期

3 李丽清;刘卫东;;基于粗糙集的患者满意度评价模型及其实证分析[J];数学的实践与认识;2009年14期

4 杨慧,瞿畅,李乃成;粗糙集与软集合在临床诊断中约简及决策分析[J];纺织高校基础科学学报;2004年03期

5 李琼,谢国明,牟永阁;基于粗糙集的数据挖掘技术在医学诊断中的应用[J];医疗卫生装备;2005年03期

6 晏峻峰;朱文锋;;粗糙集理论在中医证素辨证研究中的应用[J];中国中医基础医学杂志;2006年02期

7 孟庆全;徐文龙;;粗糙集合在中医诊断中的应用研究[J];安徽大学学报(自然科学版);2006年04期

8 李清霞;;基于粗糙集与分类回归树的“病例组合”分类研究[J];产业与科技论坛;2009年02期

9 姜华;刘健;张安妮;杨兴春;;基于粗糙集规则和灰色聚类算法的档案信息资源评价体系研究[J];江汉大学学报(自然科学版);2009年04期

10 刘亚丽;黄汛;;基于粗糙集理论的低压电器故障诊断方法研究[J];江汉大学学报(自然科学版);2012年05期

相关会议论文 前10条

1 冯俊文;;方案选择与排序的决策树方法[A];中国运筹学会第六届学术交流会论文集(下卷)[C];2000年

2 何建东;仇永萍;;人因可靠性分析中的决策树方法[A];核工业集团公司第八届可靠性成果发表会论文集[C];2006年

3 黎文航;陈善本;王兵;;粗糙集理论在焊接中的应用综述[A];第十一次全国焊接会议论文集(第2册)[C];2005年

4 尹宗成;;粗糙集理论在我国粮食产量预测中的应用[A];现代农业理论与实践——安徽现代农业博士科技论坛论文集[C];2007年

5 邹刚;滕书华;孙即祥;陈森林;敖永红;;一种粗糙集优化协同原型模式约简分类方法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年

6 葛丽;傅彦;;粗糙集在科学数据属性约简中的应用[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

7 陈雪飞;;粗糙集分类中耦合数据的处理方法研究[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年

8 孙佳音;李海峰;;A Bio-Inspired Keyword Spotting Approach Based on DNA Sequence Alignment Strategy[A];第九届全国人机语音通讯学术会议论文集[C];2007年

9 肖健梅;芦晓明;王锡淮;;集装箱起重机防摇系统粗糙集控制[A];第二十六届中国控制会议论文集[C];2007年

10 王印松;冯康;;主汽温调节系统性能评价的粗糙集实现方法[A];第二十七届中国控制会议论文集[C];2008年

相关博士学位论文 前10条

1 马希骜;概率粗糙集属性约简理论及方法研究[D];西南交通大学;2014年

2 唐孝;基于粗糙集的知识发现方法及其在ECG信号识别中的应用[D];电子科技大学;2015年

3 曾凯;邻域粒化粗糙计算的关键技术研究与应用[D];电子科技大学;2015年

4 王永生;基于粗糙集理论的动态数据挖掘关键技术研究[D];北京科技大学;2016年

5 马周明;基于边界域的多粒度粗糙集及其相关度量[D];河北师范大学;2017年

6 王丽娜;基于阴影集和粗糙集的模糊聚类算法研究与应用[D];南京航空航天大学;2016年

7 薛佩军;正负域覆盖广义粗糙集与知识粗传播研究[D];山东大学;2007年

8 孔芝;粗糙集理论若干问题的研究与应用[D];东北大学;2009年

9 秦中广;基于粗糙集的交叉研究及其在中医诊断的应用[D];华南理工大学;2002年

10 刘少辉;知识发现中粗糙集理论的研究[D];中国科学院研究生院(计算技术研究所);2003年

相关硕士学位论文 前10条

1 王科;数据挖掘技术在肺结核疾病诊断中的应用研究[D];吉林农业大学;2017年

2 李明辉;基于决策树方法的属性推断技术研究及应用[D];中南民族大学;2014年

3 苗森玉;决策树方法在大学生就业指导中的应用研究[D];华北电力大学;2015年

4 姜腾;基于决策树方法的职教信息系统设计与实现[D];北京工业大学;2013年

5 江飞;粗糙集神经网络故障诊断方法研究[D];西安石油大学;2015年

6 何理荣;粗糙集理论在银行信贷风险评估中的应用研究[D];华南理工大学;2015年

7 张德齐;基于粗糙集理论的电机故障诊断方法研究[D];渤海大学;2015年

8 杨礼;基于粗糙集的公路交通安全预警研究[D];西南交通大学;2015年

9 聂萌瑶;基于泛系串并模型的粗糙集概念扩展与拓扑空间[D];兰州大学;2015年

10 徐鹏;基于粗糙集的建筑起重机械安全精细化评价研究[D];西安建筑科技大学;2015年



本文编号:1858799

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/huxijib/1858799.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f2a4c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com