当前位置:主页 > 经济论文 > 工业经济论文 >

聚类分析和主成分回归在工业统计数据中的应用

发布时间:2018-02-09 18:26

  本文关键词: 聚类分析 主成分分析 多元线性回归 主成分回归 出处:《吉林大学》2014年硕士论文 论文类型:学位论文


【摘要】:在当前的大环境下,世界经济正在深度调整,国内外的发展环境十分复杂。世界经济正在持续的走缓,而国家正在实行宏观调控来实现经济的发展,工业在一个国家中起着关键的作用。工业是一个国家发展和腾飞的动力,是一个国家重要的一部分经济基础。 在今年,我国的工业发展有着重要的机遇,从当前的经济形势的指标来看,我国的就业形势基本平稳,价格的总水平也基本持平,经济在保持着稳速的增长。 本文的选题数据来源于《2013年中国统计年鉴》,该年鉴统计了中国自改革开放以来三十多年的汇总多方面的经济数据,并且按照时间、按照地区等多方面划分来研究中国的经济数据。 数据挖掘是一门综合性的研究学科,它综合了数学知识、概率知识、数据库知识、生物知识等各种学科的交叉学科,并且在当前社会的经济、数学、生物、科学等多方面的领域里均有着广泛的应用。 通过研究《中国统计年鉴》中的工业统计数据和居民消费数据,本文主要建立了两个模型。 第一个模型是聚类分析模型。 聚类分析是数据挖掘中常用的一种算法,K均值聚类分析是聚类分析中的经典算法。本文使用K均值聚类研究2013年《中国统计年鉴》中的工业统计数据,,并对全国31个省市自治区直辖市进行聚类,得到聚类结果,并联系实际情况分析我国不同地域的工业发展。 第二个模型是主成分回归模型。 主成分分析是一种降维的办法,是利用线性变换将多个变量转化为少数主成分的过程,多元线性回归是利用线性关系将因变量和多个自变量建立起回归的模型的过程。本文将多元线性回归和主成分分析两者相结合起来,建立主成分回归模型,并将这种模型应用到中国统计年鉴中的数据中。工业发展对社会中的人均消费水平有着一定的影响,主成分分析模型就是研究工业统计数据和人均消费水平之间的关系。建立人均消费水平和多个工业统计数据之间的主成分回归模型,首先,将工业统计数据进行主成分分析,然后将人均消费水平和主成分分析的结果建立多元线性回归,得到主成分回归的结果,并与其他回归方法做比较,发现主成分回归的效果比较好。
[Abstract]:Under the current large environment , the world economy is deeply adjusted , and the development environment at home and abroad is very complex . The world economy is continuously moving , and the state is implementing macro - control to realize the development of the economy . The industry plays a key role in a country . Industry is the power of national development and Tengfei , which is an important part of a country ' s economic foundation . This year , our country ' s industrial development has an important opportunity , from the current economic situation index , our country employment situation is basically stable , the overall level of the price is basically flat , the economy is maintaining steady growth . The data of this paper is derived from the Chinese Statistical Yearbook 2013 , which has counted more than 30 years of economic data in China since the reform and opening up , and studied China ' s economic data in terms of time and region . Data mining is a comprehensive research subject , which combines mathematics knowledge , probabilistic knowledge , database knowledge , biological knowledge and other disciplines , and has wide application in the fields of economy , mathematics , biology , science and so on . Based on the study of industrial statistics and consumer data in the Statistical Yearbook of China , two models have been established in this paper . The first model is a cluster analysis model . Cluster analysis is a commonly used algorithm in data mining , and K - means clustering analysis is a classical algorithm in cluster analysis . Using K - means clustering to study the industrial statistics in China Statistical Yearbook 2013 , clustering results are obtained for 31 provinces and municipalities directly under the Central Government , and the industrial development in different regions of our country is analyzed . The second model is the principal component regression model . The main component analysis is the process of converting a plurality of variables into a small number of principal components by linear transformation . The multivariate linear regression is the process of establishing a regression model by using linear relationship . The main component regression model is established by combining the multivariate linear regression and principal component analysis . The main component analysis model is to study the main component regression model between industrial statistics and industrial statistics .

【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP311.13;F402.4

【共引文献】

相关期刊论文 前10条

1 顾华详;我国民族地区教育发展的现状与对策[J];阿坝师范高等专科学校学报;2004年01期

2 付飞;李异;张健;;高龄老人户外交往空间设计分析[J];四川建筑科学研究;2011年01期

3 张洪波;徐苏宁;;全球气候变化下低碳城市实现的规划途径[J];四川建筑科学研究;2011年06期

4 崔木花;;基于情景分析法的循环经济规划研究——以安徽能源循环经济规划为例[J];安徽大学学报(哲学社会科学版);2009年04期

5 汪少波;略论非合理性政府行为与政府成本刚性[J];安徽教育学院学报;2004年02期

6 黄晓霓;;当前我国分配领域的突出问题及其对策分析[J];合肥师范学院学报;2010年05期

7 王守敬;;对我国居民消费率过低的几点思考[J];安徽职业技术学院学报;2009年03期

8 孟祥健;;新农村建设视域中的当代中国马克思主义大众化[J];安徽职业技术学院学报;2011年03期

9 郑家欢;吴志祥;;安徽农村留守儿童教育问题浅析[J];安徽农学通报(上半月刊);2010年17期

10 余明江;;我国农村反贫困机制的构建——基于“政府—市场”双导向视角的研究[J];安徽农业大学学报(社会科学版);2010年05期

相关会议论文 前10条

1 胡建一;;长三角循环经济发展所面临的主要挑战[A];循环经济理论与实践——长三角循环经济论坛暨2006年安徽博士科技论坛论文集[C];2006年

2 常慧娟;;京津冀区域旅游文化产业合作研究[A];2011京津冀区域协作论坛论文集[C];2011年

3 滕吉文;阮小敏;张永谦;闫雅芬;;节能高效、减排低碳与责任和快速工业化及经济腾飞[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(上)[C];2012年

4 李毅;;民营房地产业发展报告[A];中国民营经济发展报告 No.1(2003)[C];2004年

5 王娜;邱琦;;我国生活垃圾分类回收的推广与普及[A];2011中国环境科学学会学术年会论文集(第二卷)[C];2011年

6 唐海龙;徐玉新;蒋高明;刘沙沙;张Pr;钟世霞;;化肥减施及秸秆过腹还田对土壤理化性质的影响——以弘毅生态农场为例[A];2011中国环境科学学会学术年会论文集(第二卷)[C];2011年

7 郭雪松;邹娟;梁瀚文;刘俊新;;苕溪流域典型村落水污染特征调查研究[A];2011中国环境科学学会学术年会论文集(第四卷)[C];2011年

8 黄璜;;“积极老龄化”理论视角下的我国老龄旅游产业发展战略[A];2012中国旅游科学年会论文集[C];2012年

9 汪清蓉;;城市旅游业能耗消耗、二氧化碳排放估算方法及深圳市实证分析[A];2012中国旅游科学年会论文集[C];2012年

10 李怀;韩瑞;;我国现行个人所得税扣除额标准的法与经济学分析[A];2006年度(第四届)中国法经济学论坛会议论文集[C];2006年

相关博士学位论文 前10条

1 杜熙茹;珠江三角洲城市职业女性体育生活方式研究[D];上海体育学院;2010年

2 胡雪梅;科学人才观的理论内涵与实践应用研究[D];江西师范大学;2010年

3 汪慧玲;科技进步对劳动就业影响的实证研究[D];兰州大学;2010年

4 陈春常;转型中的中国国家治理研究[D];华东师范大学;2011年

5 董国强;我国高校教师人力资本定价研究[D];西北大学;2010年

6 李玉凤;黑龙江省产业结构优化及仿真[D];哈尔滨理工大学;2009年

7 刘林;高新技术产业可持续发展模式研究[D];哈尔滨理工大学;2009年

8 罗力;信任和关系承诺对第三方物流整合与绩效的影响[D];华南理工大学;2010年

9 王耀鹏;中国粮食流通支持政策研究[D];北京林业大学;2011年

10 闫俊;中国新型农村社会养老保险制度研究[D];北京林业大学;2010年

相关硕士学位论文 前10条

1 高晓辉;基于DEA方法的农地利用效率差异研究[D];华中农业大学;2010年

2 闫恒超;棉花纤维发育伸长期和次生壁加厚期数字表达谱分析[D];华中农业大学;2010年

3 王旭;资源型城市生态经济系统可持续发展研究[D];河南理工大学;2010年

4 刘鹏;煤粉永磁强磁滤器的研究[D];河南理工大学;2010年

5 谭啸;湘中南地区农村初中学校体育发展的影响因素及对策研究[D];广西师范学院;2010年

6 史玉岩;开发节地型居住小区的技术措施研究[D];郑州大学;2010年

7 毕圣洁;中国政治发展过程中的合法性构成与获取研究[D];华东政法大学;2010年

8 陈伟;比较优势理论与我国出口制造业发展及产业结构升级策略新析[D];华东政法大学;2010年

9 商鹏鹏;我国个人破产制度之配套制度探究[D];华东政法大学;2010年

10 瞿逸;我国经济转轨期民工荒问题探析[D];华东政法大学;2010年



本文编号:1498573

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/gongyejingjilunwen/1498573.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户83cb2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com