数据挖掘技术在区域经济分析中的应用研究
发布时间:2020-12-14 08:36
中国区域经济发展不平衡一直颇受关注,而区域经济的研究也是众多专家、学者热衷的研究课题之一,传统的研究方法只能考虑影响经济的较少因素,如:GDP,GNP,人口等,不能全面、动态的研究经济的发展。本文采用数据挖掘方法对区域经济从自然属性、社会属性、经济属性、技术属性四个方面进行分析,既考虑到自然资源对经济的影响,又考虑到技术对经济的影响,较全面的反应了我国区域经济的发展状况。数据挖掘技术是一门基于实际需要而产生的边缘技术,主要用于研究数据对象的分布特征和预测数据对象的变化规律。本文选用我们引进的数据挖掘软件平台PolyAnalyst与地理信息系统MapGIS,将我国的省、区和直辖市作为数据对象,将各省、区和直辖市的自然、社会、经济和技术指标作为数据对象的属性,利用聚类分析来研究我国各省、区和直辖市基于不同指标的相似性和相异性,分析产生相似性和相异性的原因,为实现我国区域经济协调发展提供更多科学依据。例如,基于资源储量聚类,北京、天津、上海、海南、宁夏具有相似性;基于经济增长指标聚类,北京、上海具有相似性。分析结果表明,尽管北京、天津、上海、海南、宁夏资源储量基本相同,但是,北京、上海的经济...
【文章来源】:内蒙古科技大学内蒙古自治区
【文章页数】:86 页
【学位级别】:硕士
【部分图文】:
神经元结构
由于指标中数据值变化较大,绝对值大的变量其影响可能会湮没绝对值小,使后者应有的作用得不到体现。从而影响聚类效果。为了确保各个数据对在分析中的地位相同,对数据进行无量纲处理。本文采用最小-最大规范化方据进行预处理:AAAnvvmaxminmin ′=(式 其中 minA和 maxA分别为属性的最小和最大值。3 建模本文从自然属性、社会属性、技术属性、经济属性四个方面进行分析,就应这四个属性的众多指标进行建模,以便于分析影响这四个方面的主要因素数据流程图见图 3.1。
(1)首先将自然属性指标的所有数据入库并建立应用模型见图 3.2,自然属性主要包括能耗、矿产、林地、污染等 20 类指标。(2)由于自然属性聚类对象为中国行政区,有 20 个维,所以首先使用主成分分析法降维来提高聚类的准确性。(3)使用 Cumulative%(累积贡献率)大于 85%的所有成分作为聚类的属性。(4)确定 K 的数值。判断 K-means 质量的指标为 Intercluster part of dispersion(类间偏差),它的值通常在 0 与 1 之间。其值越接近 1 代表聚类质量越好。使用 magnitude(权重)与 distinction(距离)作为衡量每类的重要指标。Magnitude 代表某一属性在聚类过程中所起的作用,即某变量对每类有多重要,总和为 1;Distinction 计算的是每个类的部分属性,用来定义类中心点到所有观测值的重心的距离。如果某个 Distinction 值非常大,则说明该类可以由这个Distinction 值所对应的属性决定。
【参考文献】:
期刊论文
[1]区域系统动态协调发展及其有效程度评价研究[J]. 孙会,吴价宝,孙建萍. 科技管理研究. 2011(16)
[2]动态的粗糙增量聚类方法[J]. 洪亮亮,罗可. 计算机工程与应用. 2011(24)
[3]新疆南北疆区域经济差异的影响因素——基于Panel数据的实证研究[J]. 付金存,李豫新,李芳芳. 江西农业大学学报(社会科学版). 2011(02)
[4]产业集聚与中国区域经济发展差异——基于新经济地理学视角[J]. 谢永琴,钟少颖. 工业技术经济. 2010(05)
[5]2009年中国综合交通体系发展趋势研究[J]. 毛保华,彭宏勤,贾顺平. 交通运输系统工程与信息. 2010(02)
[6]区域经济空间分异研究述评[J]. 李敏纳,蔡舒. 河南大学学报(社会科学版). 2010(01)
[7]中国经济与环境系统协调发展的实证分析[J]. 姚奕,郭军华,倪勤. 统计与决策. 2010(01)
[8]河北省沿海与内陆经济差异与协调发展对策研究[J]. 田敏,韩国玥. 河北师范大学学报(哲学社会科学版). 2009(06)
[9]安徽省区域经济差异的多元统计分析[J]. 汪潘义,王骑. 华东经济管理. 2009(09)
[10]一种基于元启发式策略的迭代自学习K-Means算法[J]. 雷小锋,杨阳,张克,谢昆青,夏征义. 计算机科学. 2009(07)
博士论文
[1]基于空间外溢效应的区域经济增长空间俱乐部趋同研究[D]. 刘迎霞.河南大学 2010
硕士论文
[1]基于空间数据挖掘的点轴开发与生态环境关联关系研究[D]. 王绍巍.哈尔滨师范大学 2011
[2]基于数据挖掘的城市圈比较研究[D]. 程晓歌.华中科技大学 2011
[3]移动对象轨道异常检测算法的研究[D]. 姜金凤.南京航空航天大学 2010
[4]基于数据挖掘图书馆管理决策研究[D]. 房宜锋.内蒙古科技大学 2010
[5]增量聚类算法的设计与实现[D]. 王淑玲.内蒙古科技大学 2009
[6]聚类融合算法及其在移动通信企业的应用[D]. 罗浩.中南大学 2009
[7]基于相似度的文本聚类算法研究及应用[D]. 曾路平.江苏大学 2009
[8]基于聚类和矩阵的关联规则挖掘研究[D]. 赵凤荣.内蒙古大学 2008
[9]基于密度聚类算法及其模式评估方法的研究与实现[D]. 宋飞燕.内蒙古科技大学 2007
[10]基于系统论的固定交易成本分类法及其相关研究[D]. 徐德斌.北京工业大学 2007
本文编号:2916146
【文章来源】:内蒙古科技大学内蒙古自治区
【文章页数】:86 页
【学位级别】:硕士
【部分图文】:
神经元结构
由于指标中数据值变化较大,绝对值大的变量其影响可能会湮没绝对值小,使后者应有的作用得不到体现。从而影响聚类效果。为了确保各个数据对在分析中的地位相同,对数据进行无量纲处理。本文采用最小-最大规范化方据进行预处理:AAAnvvmaxminmin ′=(式 其中 minA和 maxA分别为属性的最小和最大值。3 建模本文从自然属性、社会属性、技术属性、经济属性四个方面进行分析,就应这四个属性的众多指标进行建模,以便于分析影响这四个方面的主要因素数据流程图见图 3.1。
(1)首先将自然属性指标的所有数据入库并建立应用模型见图 3.2,自然属性主要包括能耗、矿产、林地、污染等 20 类指标。(2)由于自然属性聚类对象为中国行政区,有 20 个维,所以首先使用主成分分析法降维来提高聚类的准确性。(3)使用 Cumulative%(累积贡献率)大于 85%的所有成分作为聚类的属性。(4)确定 K 的数值。判断 K-means 质量的指标为 Intercluster part of dispersion(类间偏差),它的值通常在 0 与 1 之间。其值越接近 1 代表聚类质量越好。使用 magnitude(权重)与 distinction(距离)作为衡量每类的重要指标。Magnitude 代表某一属性在聚类过程中所起的作用,即某变量对每类有多重要,总和为 1;Distinction 计算的是每个类的部分属性,用来定义类中心点到所有观测值的重心的距离。如果某个 Distinction 值非常大,则说明该类可以由这个Distinction 值所对应的属性决定。
【参考文献】:
期刊论文
[1]区域系统动态协调发展及其有效程度评价研究[J]. 孙会,吴价宝,孙建萍. 科技管理研究. 2011(16)
[2]动态的粗糙增量聚类方法[J]. 洪亮亮,罗可. 计算机工程与应用. 2011(24)
[3]新疆南北疆区域经济差异的影响因素——基于Panel数据的实证研究[J]. 付金存,李豫新,李芳芳. 江西农业大学学报(社会科学版). 2011(02)
[4]产业集聚与中国区域经济发展差异——基于新经济地理学视角[J]. 谢永琴,钟少颖. 工业技术经济. 2010(05)
[5]2009年中国综合交通体系发展趋势研究[J]. 毛保华,彭宏勤,贾顺平. 交通运输系统工程与信息. 2010(02)
[6]区域经济空间分异研究述评[J]. 李敏纳,蔡舒. 河南大学学报(社会科学版). 2010(01)
[7]中国经济与环境系统协调发展的实证分析[J]. 姚奕,郭军华,倪勤. 统计与决策. 2010(01)
[8]河北省沿海与内陆经济差异与协调发展对策研究[J]. 田敏,韩国玥. 河北师范大学学报(哲学社会科学版). 2009(06)
[9]安徽省区域经济差异的多元统计分析[J]. 汪潘义,王骑. 华东经济管理. 2009(09)
[10]一种基于元启发式策略的迭代自学习K-Means算法[J]. 雷小锋,杨阳,张克,谢昆青,夏征义. 计算机科学. 2009(07)
博士论文
[1]基于空间外溢效应的区域经济增长空间俱乐部趋同研究[D]. 刘迎霞.河南大学 2010
硕士论文
[1]基于空间数据挖掘的点轴开发与生态环境关联关系研究[D]. 王绍巍.哈尔滨师范大学 2011
[2]基于数据挖掘的城市圈比较研究[D]. 程晓歌.华中科技大学 2011
[3]移动对象轨道异常检测算法的研究[D]. 姜金凤.南京航空航天大学 2010
[4]基于数据挖掘图书馆管理决策研究[D]. 房宜锋.内蒙古科技大学 2010
[5]增量聚类算法的设计与实现[D]. 王淑玲.内蒙古科技大学 2009
[6]聚类融合算法及其在移动通信企业的应用[D]. 罗浩.中南大学 2009
[7]基于相似度的文本聚类算法研究及应用[D]. 曾路平.江苏大学 2009
[8]基于聚类和矩阵的关联规则挖掘研究[D]. 赵凤荣.内蒙古大学 2008
[9]基于密度聚类算法及其模式评估方法的研究与实现[D]. 宋飞燕.内蒙古科技大学 2007
[10]基于系统论的固定交易成本分类法及其相关研究[D]. 徐德斌.北京工业大学 2007
本文编号:2916146
本文链接:https://www.wllwen.com/jingjilunwen/zhongguojingjilunwen/2916146.html