【摘要】:随着现在科技的不断发展和进步,我国工业化得到迅猛发展,人们的生活水平有着明显的提高,并且越来越重视自己的生活质量。而我们赖以生存的空气,在社会大踏步前进时遭到了剧烈的破坏。如今空气污染越来越严重,给人们的身心健康带来了强烈的伤害。并且工业化的快速发展使得每天的空气质量都在不断的变化着,其不但会降低人们的身心惬意度和对生活的满意度,还会降低人体对各种疾病的抵抗能力,使人们易患上各种疾病,严重的甚至会导致病情的加重或恶化。特别是发生在天气骤变时,空气中各因子的浓度发生剧烈的变化、气压突变和环境各因素的变化等都能让人们极易爆发疾病甚至导致病情加重等。因此空气质量给人们的身心健康带来的强烈影响引起了政府的重视和社会的广泛关注。根据相关部门的统计,在我国总死亡人数中,因患慢性病而死亡的人口数量占比达到了86.6%。此数据显示如今在死亡病因中,慢性病已占据了非常高的比例,已然发展成为了危害人们身心健康的第一刽子手,因而引起了国家的高度重视。不仅如此,在全国总疾病造成的经济、劳动、人员等负担中,慢性病导致的各种负担占到了70%以上,被列入为严重干扰国家经济稳步上升以及影响社会和谐稳定发展的重要因素。因此本文展开了对空气质量与慢性疾病关联模型的研究,虽然已有部分研究人员对空气污染与疾病进行了统计学方面的研究分析,但是其采用小规模数据进行统计学分析,具有一定的局限性和不准确性。而本文基于Hadoop对海量空气质量数据与慢病数据进行关联研究,通过关联规则算法对其进行关联研究得出空气质量与慢病之间的关联性,能提高研究结果的准确性且具有一定的科学性。因此针对本文得出的空气质量与慢性病的关联结果,人们可以对自己以及家人的身体情况进行预防、减缓、抑制或控制病情,科学的规划我们的生活。为了能够充分有效的使用慢性病患者的病情信息数据,也为了能够提供一些预防与管理和控制慢性病恶性发展的科学依据,本文使用的空气质量数据来源于某环境空气质量监测站,从这个数据集中选取了6个空气质量因子:PM2.5、SO2、NO2、PM10、CO和O3。使用的慢病数据是采集的某市疾病预防控制中心里慢性非传染性疾病防制所的慢性病患者的信息。然后对这两种数据集进行关联规则挖掘。本文关联模型研究首先对国内外相关文献进行了查阅,初步了解了数据挖掘技术在空气污染方面和慢性病方向的研究现状,接着学习了数据挖掘技术及关联规则的相关理论知识并进行了详细的阐述,其中针对关联规则挖掘算法进行了进一步的了解和学习,深入研究了关联规则挖掘算法中的Apriori算法和FP-growth算法。在对Apriori算法的学习研究过程中理解了该算法的运行过程,领会了该算法的核心思想,发现了该算法在时间消耗上的弊端,并分析了一些现有的该算法的优化方法,为本文改进该算法提供了参考。本文的关联模型研究针对Apriori算法在运行效率上的缺陷,对其进行了以下改进:首先运用数据库中的SQL语句直接对我们使用的数据进行相应的分类等操作,再把数据进行分块,映射到每个处理器上,这样在对数据进行扫描时只要每个处理器扫描其对应块便可,无需再像以前那样全篇扫描,从而大大缩小了对数据扫描所花费的时间。随后采用新的数据结构运行,以往在对数据库进行处理时,通常是将数据库视为水平结构的,而该改进方法是将其视为垂直结构,是一个项目事务垂直对应关系的数据结构。该优化算法在寻找频繁项集的过程中只需要扫描一次数据库,从而在后续的流程中不用处理一些不必要的事务和项目,进而需要处理的事务项目集也会逐渐减小。该优化算法还避免了做大量的模式匹配来计算事务项和无需循环扫描项目集,进而大大提高了算法的时间效率。对Apriori算法进行优化后还设计了空气质量与慢性病关联规则挖掘的整体方案:先对采集的空气质量数据和慢病患者信息数据进行相应的处理,再根据实际情况设定规则的最小支持度和置信度,然后在该空气质量与慢性病的关联规则挖掘中运用改进的Apriori算法,最后对生成的关联规则根据实际情况进行分析与说明,探究空气质量与慢性病之间的联系。通过该研究结果,了解空气因子对慢性病的影响,让市民对空气质量与人体健康有更科学的认识,从而达到未病先防,有病减缓的效果,对慢病防治有一定的意义,也对我们需要保护好我们赖以生存的环境有更深刻的认识。
【学位授予单位】:长江大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:X51;R12
【图文】:
加入第一条Figure2AddingtheI5:1

加入第三条Figure4FPtreeadI5:1

加入第二条Figure3AddingaseI5:1
【参考文献】
相关期刊论文 前10条
1 陈婕;赵茜;刘贝贝;王娟;徐洪兵;张怡;宋晓明;贺蓓;黄薇;;交通来源大气污染对慢性阻塞性肺部疾病患者呼吸道氧化应激和炎性反应的影响[J];中华预防医学杂志;2016年05期
2 张改臣;;空气污染物对高血压的影响研究[J];中西医结合心血管病电子杂志;2015年27期
3 贾雪宏;张焕萍;;PM2.5与支气管哮喘[J];疾病监测;2015年05期
4 董研;;基于时态约束的Apriori改进算法的实现[J];自动化技术与应用;2015年01期
5 陈小聪;吴红娟;李锦燕;;温州儿童哮喘发作与空气污染及气象因子的相关性分析[J];中国儿童保健杂志;2015年01期
6 廖琴;曾静静;曲建升;;国外环境与健康发展战略计划及其启示[J];环境与健康杂志;2014年07期
7 王学松;郭强;;医疗数据分析及数据挖掘方法的应用[J];电子技术与软件工程;2014年02期
8 韦丽红;陈松;;数据挖掘技术与关联规则挖掘算法研究[J];佳木斯教育学院学报;2014年01期
9 胡灵芝;;数据挖掘方法及其在医学领域中的应用[J];辽宁中医药大学学报;2010年07期
10 金瑶;;一种基于自适应步长及动态修剪的Apriori改进算法[J];宜春学院学报;2009年06期
相关博士学位论文 前1条
1 何骁生;空气污染物及其组分与心肺疾病死亡、冠心病发生的流行病学研究[D];华中科技大学;2014年
相关硕士学位论文 前2条
1 梁锐明;长期暴露于PM_(2.5)与心脑血管疾病死亡关联研究[D];中国疾病预防控制中心;2017年
2 陈跃涛;空气细颗粒污染物在支气管哮喘发生中的作用及其机制的研究[D];华中科技大学;2016年
本文编号:
2772494
本文链接:https://www.wllwen.com/yixuelunwen/yufangyixuelunwen/2772494.html