基于数据挖掘的我国城市空气质量与城市发展的研究
发布时间:2021-02-20 17:06
本文主要介绍了数据挖掘的聚类方法和分类方法基本理论,并比较了两者的区别。随后基于聚类和分类方法,使用系统聚类法中的最短距离法、最长距离法、Ward法和类平均法对实例进行聚类分析,并比较不同方法得到的聚类结果,最终选取合适的聚类结果;然后使用决策树分类方法中的递归分割树和C5.0算法对实例进行分类分析,并结合实际情况得到合理的分类决策树。首先以2015年我国30个主要城市(除拉萨市)的空气质量数据为研究对象,利用7个污染物相关指标,即二氧化硫、二氧化氮、可吸入颗粒物和细颗粒物的年平均浓度;烟尘排放量;一氧化碳日均值第95百分位浓度和臭氧日最大8小时第90百分位浓度这三类指标,通过数据挖掘方法和统计软件R语言,建立聚类模型,将30个城市聚为两类,空气质量较好的城市包括海口、昆明、南昌、南宁、贵阳、福州和兰州,其他城市为空气质量较差的城市。然后根据聚类结果,选取与空气质量相关的8个城市发展指标(机动车量、单位面积机动车量、万人机动车保有量、第二产业增加值、规模以上工业增加值、居民人均消费支出、人均GDP、绿化率)利用数据挖掘方法和统计软件R语言做决策树分类分析,提取了城市发展中对于城市空气质...
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:54 页
【学位级别】:硕士
【部分图文】:
图4.1空气污染指标均值条形图??
.?图4.2?Ward聚类图??由图4.2可知,若将30个城市分为两类,一类为海口、昆明、南昌、南宁、??贵阳、福州和兰州,另一类为其他城市。若将城市分为三类,一类为海口、昆明、??南昌、南宁、贵阳、福州和兰州,一类为北京、石家庄、济南、郑州,其他为第三??类城市。??(2)
t??图5.1调和曲线图??如图5.1所示,空气质量好和空气质量差的城市都各自聚集在一起,说明本文??选取的城市发展指标对于城市关于空气质量的分类是有效的。在某些变量上,数值??相对小说明城市空气质量相对更好,在某些变量上,数值相对大说明城市空气质量??*??相对好。??5.?3决策树分类??5.?3.?1递归分割树分类??递归分割树的过程是基于变量和划分条件进行的,从根节点开始,在每个节点??判断变量是否需要继续划分,若往左划分则产生左子树,往右划分产生右子树,直??至遇到叶子节点则整个递归过程完成。??根据本文3.3节所述的决策树分类过程和原理,本节使用递归分割树依据城市??发展指标对30个城市进行分类。建模步骤如下:??(1)生成平衡数据??基于本文第四章的聚类结果,30个城市中有23个城市为空气质量较差的城市,??28??
【参考文献】:
期刊论文
[1]中国当前城市空气综合质量的主要影响因素分析[J]. 杨阳,沈泽昊,郑天立,丁雨賝,李本纲. 北京大学学报(自然科学版). 2016(06)
[2]2004-2013年中国经济与空气质量的耦合关系及其发展趋势[J]. 喻海东,卢亮. 中国人口·资源与环境. 2015(S2)
[3]湖北省经济发展与环境质量变化关系实证分析[J]. 周志斌,余奕杉. 湖北社会科学. 2012(10)
[4]中国城市低碳发展评价综合指标构建与应用[J]. 朱守先,梁本凡. 城市发展研究. 2012(09)
[5]城市空气质量与经济发展的曲线估计研究[J]. 张喆,王金南,杨金田,蒋洪强,童凯. 环境与可持续发展. 2007(04)
[6]环境污染影响因素的经济计量分析——以江苏省为例[J]. 赵海霞,曲福田,郭忠兴. 环境保护. 2006(04)
硕士论文
[1]中国主要城市空气质量与经济发展的关系研究[D]. 张丽.华北水利水电大学 2013
[2]基于灰色聚类与模糊综合评判的空气质量评价[D]. 陈玮.华东师范大学 2012
[3]内蒙古环境空气质量评价及其与经济增长的关系[D]. 李明娜.内蒙古大学 2010
本文编号:3043072
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:54 页
【学位级别】:硕士
【部分图文】:
图4.1空气污染指标均值条形图??
.?图4.2?Ward聚类图??由图4.2可知,若将30个城市分为两类,一类为海口、昆明、南昌、南宁、??贵阳、福州和兰州,另一类为其他城市。若将城市分为三类,一类为海口、昆明、??南昌、南宁、贵阳、福州和兰州,一类为北京、石家庄、济南、郑州,其他为第三??类城市。??(2)
t??图5.1调和曲线图??如图5.1所示,空气质量好和空气质量差的城市都各自聚集在一起,说明本文??选取的城市发展指标对于城市关于空气质量的分类是有效的。在某些变量上,数值??相对小说明城市空气质量相对更好,在某些变量上,数值相对大说明城市空气质量??*??相对好。??5.?3决策树分类??5.?3.?1递归分割树分类??递归分割树的过程是基于变量和划分条件进行的,从根节点开始,在每个节点??判断变量是否需要继续划分,若往左划分则产生左子树,往右划分产生右子树,直??至遇到叶子节点则整个递归过程完成。??根据本文3.3节所述的决策树分类过程和原理,本节使用递归分割树依据城市??发展指标对30个城市进行分类。建模步骤如下:??(1)生成平衡数据??基于本文第四章的聚类结果,30个城市中有23个城市为空气质量较差的城市,??28??
【参考文献】:
期刊论文
[1]中国当前城市空气综合质量的主要影响因素分析[J]. 杨阳,沈泽昊,郑天立,丁雨賝,李本纲. 北京大学学报(自然科学版). 2016(06)
[2]2004-2013年中国经济与空气质量的耦合关系及其发展趋势[J]. 喻海东,卢亮. 中国人口·资源与环境. 2015(S2)
[3]湖北省经济发展与环境质量变化关系实证分析[J]. 周志斌,余奕杉. 湖北社会科学. 2012(10)
[4]中国城市低碳发展评价综合指标构建与应用[J]. 朱守先,梁本凡. 城市发展研究. 2012(09)
[5]城市空气质量与经济发展的曲线估计研究[J]. 张喆,王金南,杨金田,蒋洪强,童凯. 环境与可持续发展. 2007(04)
[6]环境污染影响因素的经济计量分析——以江苏省为例[J]. 赵海霞,曲福田,郭忠兴. 环境保护. 2006(04)
硕士论文
[1]中国主要城市空气质量与经济发展的关系研究[D]. 张丽.华北水利水电大学 2013
[2]基于灰色聚类与模糊综合评判的空气质量评价[D]. 陈玮.华东师范大学 2012
[3]内蒙古环境空气质量评价及其与经济增长的关系[D]. 李明娜.内蒙古大学 2010
本文编号:3043072
本文链接:https://www.wllwen.com/shengtaihuanjingbaohulunwen/3043072.html