当前位置:主页 > 医学论文 > 预防医学论文 >

基于数据挖掘的疾病监测及关键技术研究

发布时间:2020-11-05 22:01
   数据挖掘是从大量的、模糊的、有噪声的数据中提取隐藏在其中有价值的信息的过程。改革开放至今,中国迅速崛起,在国家和地方统计部门的协调合作下,已积累大量有价值的专业数据。如何从这些大量的历史数据中发现有价值的信息,为区域疾病监测和个体疾病监测服务,辅助疾病诊断和疾病预防,成为当下研究的热点话题。论文以恶性肿瘤为例,结合中国统计局发布的统计年鉴,将区域自然环境、生物环境、社会环境、人文环境等数据与中国居民恶性肿瘤病发数据做深入分析,建立多元线性回归模型,探究区域环境特征对居民患癌的作用规律。论文亦提出建立恶性肿瘤数据共享平台的方案,通过规范数据的结构,整合医疗机构、科研机构、政府机关的先进资源,为国家和地方决策部门及时做好疾病防疫和诊疗工作提供理论依据。通过媒体及走访调查,论文选取2004-2016年中国恶性肿瘤发病率与死亡率、相关区域特征数据、2015年中国癌症村空间分布及相关区域特征数据作为研究对象,利用数据挖掘技术对癌症发病状况与区域环境特征间的潜在关联进行深入研究。最后通过Django框架,设计并实现了基于浏览器/客户端结构的癌症数据共享平台系统。论文的主要工作包括以下三点:(1)从国家统计年鉴抽取2004-2016年中国居民癌症发病率、死亡率数据及同时期经济、自然等13项区域特征数据进行研究。利用决策树、随机森林、自适应增强树、相关矩阵等方法完成特征提取和分析,初步探索各区域特征对癌症病发的影响粒度。(2)根据网络、报刊、学术论文等媒体,作者整理、统计了2015年中国省级区域的癌症村分布数据,并从国家统计年鉴抽取2015年分地区区域经济、自然等12项区域特征数据进行研究。利用决策树、随机森林、自适应增强树等方法完成特征提取和分析,利用K均值聚类探索我国癌症村的空间分布和变迁规律。对比时间维度的研究结果,选择适当输入因子构建多元线性回归模型。实验表明,优化后的归一化多元线性回归模型拟合优度为0.8489、均方误差为0.0226,拟合效果良好,能较好预测和评估区域癌症村数量及居民癌症病发状况。(3)设计基于Django框架的癌症数据共享平台并完成局域网内功能模拟,旨在整合国家及地方医疗机构、科研机构和政府部门的专业职能资源,辅助相关部门做好疾病的预防和诊疗工作。平台系统测试流畅,设计功能基本实现。
【学位单位】:河北大学
【学位级别】:硕士
【学位年份】:2018
【中图分类】:TP311.13;R181.8
【部分图文】:

行业应用,分布比,领域,数据


大数据分析平台概述据医疗”改革的不断深入,无论是电子病历数据还是统计、数据形式多元、数据变化快和数据价值高的“大数据”特中获得潜在的、有价值的信息成为当下疾病监测与数据分技术的出现,在很大程度上解决了上述问题。由于数据挖掘器学习算法、数据可视化、模式识别等分析步骤,在处理大势。因此,数据挖掘能够帮助人们获得潜藏在数据中的巨在在疾病监测领域中发挥重要作用。国数据挖掘技术的开放应用主要表现为嵌入互联网的大数行业的发展呈稳步上升趋势,市场规模已达到 234 亿元,速已经超过 39%,预计未来将持续增长[6]。中国 2017 年大 1-1 所示。

优势对比,医疗数据,互联网企业,数据平台


国政府很重视医疗大数据的挖掘工作。2016 年国务院国务院办公厅专门促进和规范健康医疗大数据应用发展的指导意见》,通过“互联网+健康尝试构建新的服务结构,建设居民信任的、满意的卫生事业[7]。在国家政的推动下,国内多家互联网企业相继搭建医疗健康数据平台,健康数据平其优势对比如表 1-1 所示。前,大数据医疗数据主要通过以下三种方式获得:医院临床数据、公共卫疗健康数据,组成结构如图 1-2 所示。

技术路线图,论文,技术路线,论文研究


9图 1-3 论文技术路线本章小结章首先介绍论文研究背景及意义;其次简要阐述了国内外数据挖掘技术在的应用与发展;最后给出了论文的研究内容、组织框架、创新点及技术路
【参考文献】

相关期刊论文 前10条

1 杨坤;李石柱;;大数据挖掘技术应用于血吸虫病监测预警研究的探讨[J];中国寄生虫学与寄生虫病杂志;2015年06期

2 董诚;林立;金海;廖小飞;;医疗健康大数据:应用实例与系统分析[J];大数据;2015年02期

3 吴前兵;刘静;;医院信息系统现状问题分析与解决方案[J];电脑知识与技术;2014年35期

4 董丞妍;谭亚玲;罗明良;翟有龙;;中国“癌症村”的聚集格局[J];地理研究;2014年11期

5 滕琪;樊小毛;何晨光;李烨;卢东昕;;医疗大数据特征挖掘及重大突发疾病早期预警[J];网络新媒体技术;2014年01期

6 蒋勋;刘喜文;;大数据环境下面向知识服务的数据清洗研究[J];图书与情报;2013年05期

7 李小玲;;管理信息系统开发中C/S模式和B/S模式的比较[J];林区教学;2013年10期

8 龚胜生;张涛;;中国“癌症村”时空分布变迁研究[J];中国人口.资源与环境;2013年09期

9 赵杰;祁永梅;;一种新的甲状腺肿瘤超声图像特征提取算法[J];光电工程;2013年09期

10 周婷;张君瑛;罗成;;基于Hadoop的K-means聚类算法的实现[J];计算机技术与发展;2013年07期


相关博士学位论文 前2条

1 王洁;中国媒体癌症新闻报道的内容分析[D];武汉大学;2013年

2 戴家佳;多元拟合优度检验与复发事件数据统计分析[D];北京工业大学;2009年


相关硕士学位论文 前10条

1 胡在林;关联规则和决策树组合算法在学生成绩分析中的应用与研究[D];青岛理工大学;2017年

2 王元坤;基于随机森林—人工神经网络企业财务预警研究[D];山东大学;2017年

3 胡金涛;基于C4.5决策树的学生成绩预测教学系统的研究与实现[D];西南交通大学;2017年

4 杨浩宇;基于随机森林算法的高维不平衡数据分类研究及应用[D];郑州大学;2017年

5 康雅文;基于随机森林的医疗行业供应商的等级评估模型[D];安徽大学;2017年

6 孙威;基于Django和数据库优化策略的比特币信息查询系统[D];东华大学;2016年

7 姚芳;基于python的中文文本分类研究[D];华中科技大学;2016年

8 郑可富;基于Python的虚拟仪器设计与开发[D];中央民族大学;2016年

9 付伟;基于Hadoop的Web日志的分析平台的设计与实现[D];北京邮电大学;2015年

10 王龙强;K均值聚类算法初始聚类中心的选取与改进[D];东北大学;2013年



本文编号:2872244

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/yufangyixuelunwen/2872244.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ec232***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com