主成分分析和聚类在科学技术数据分析中的应用
本文关键词:主成分分析和聚类在科学技术数据分析中的应用,,由笔耕文化传播整理发布。
【摘要】:改革开放以后,我国的科学技术方面的发展逐步增强,科技体制改革不断的深化,国家的创新体制也在不断的稳步向前走,遵循了我国经济发展的规律,也遵循了科技自身发展的规律。目前的科技发展的格局满足了市场的需求,并且以市场的需求为导向,正在慢慢地发展。我国的科技资源的配置正在进一步优化的过程之中,市场资源的配置也是在市场规律的导向作用下自发完成的,很多国家级的资源项目,均是通过竞争来实现的,市场是竞争的结果,优胜劣汰,这就是市场本身。通过研究中国统计年鉴中的科学技术相关的数据,得到全国31个行政单位的统计数据,包括专利申请数、新开发项目数、有产品或工艺创新活动的企业数、测绘基准成果等51个统计变量。本文针对31个行政单位的统计数据进行分地区科学技术数据分析,主要完成以下两个工作。(1)对分地区科学技术数据进行主成分分析。经过对《中国统计年鉴》中分地区科学技术相关的统计数据进行分析,得到31个行政单位51个属性变量的统计数据,维数较高,对数据进行主成分分析。主成分分析就是将多个属性变量转化为少数几个主成分的过程。在主成分分析的过程中,达到两个目的,第一个目的是降维,简化数据结构,第二个目的是少数几个主成分组成的数据矩阵还能够反映大部分的数据信息。主成分分析,可以说是将原始数据属性变量进行浓缩的一个过程。经过主成分分析,将51个属性变量降维,用8个主成分来表示。通过计算主成分得分,得到31个行政单位的科学技术相关的综合得分,对31个行政单位进行排名,并且给出参考意见。(2)对分地区科学技术数据聚类分析。聚类分析是数据挖掘中的一项重要的知识手段。它主要是利用“物以类聚”的思想将数据信息进行分类,将特征相似或者相近的对象放在同一个类中,将特征不同的对象放在不同的类中。将31个行政单位的统计数据得到的主成分结果进行K均值聚类分析,得到3个聚类结果,依次定义为“科学技术发达地区”、“科学技术一般地区”和“科学技术不发达地区”,为我国的经济做出相关的参考性数据分析。
【关键词】:主成分分析 聚类分析 主成分得分 中国统计年鉴
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13
【目录】:
- 摘要4-6
- Abstract6-10
- 第1章 绪论10-18
- 1.1 我国科学技术研究现状10-11
- 1.2 本文的数据来源11-13
- 1.3 数据挖掘13
- 1.4 本文的主要工作13-14
- 1.5 本文的主要目的14-15
- 1.6 本文选择主成分分析和聚类分析算法的原因15-16
- 1.7 本文的主体框架16-17
- 1.8 本章小结17-18
- 第2章 理论部分介绍18-27
- 2.1 主成分分析18-20
- 2.2 SPSS统计学软件20-22
- 2.3 聚类分析22-25
- 2.3.1 聚类分析简介22-24
- 2.3.2 K均值聚类分析24-25
- 2.4 MATLAB软件25-26
- 2.5 本章小结26-27
- 第3章 主成分分析在分地区科学技术数据研究中的应用27-45
- 3.1 数据预处理27-29
- 3.2 主成分分析过程29-42
- 3.3 主成分综合得分结果42-44
- 3.4 我国科学技术研究的参考意见44
- 3.5 本章小结44-45
- 第4章 聚类分析在分地区科学技术数据研究中的应用45-49
- 4.1 数据综合处理45
- 4.2 K均值聚类过程45-46
- 4.3 聚类分析结果及分析46-48
- 4.4 本章小结48-49
- 第5章 总结及展望49-51
- 5.1 全文总结49-50
- 5.2 展望50-51
- 参考文献51-56
- 作者简介及在学期间所取得的科研成果56-57
- 致谢57
【相似文献】
中国期刊全文数据库 前10条
1 林和平;杨晨;;模糊主成分分析方法的研究与分析[J];航空计算技术;2006年06期
2 林培龙;;基于主成分分析评价模型的研究与应用[J];信息系统工程;2010年05期
3 张磊;;天津市电子信息产品制造业竞争力分析与评价[J];科技和产业;2011年07期
4 李瑜祥;;主成分分析程序及其应用[J];自动化仪表;1987年04期
5 朱宁;主成分分析在选拔竞赛队员中的应用[J];桂林电子工业学院学报;1999年02期
6 姜春燕;林和平;刘丁慧;付希金;纪永凤;;灰主成分分析研究及其应用[J];吉林大学学报(信息科学版);2007年05期
7 周春生;;主成分分析在大学生成绩影响因素研究中的应用[J];现代计算机;2013年17期
8 顾绍红;王永生;王光霞;;主成分分析模型在数据处理中的应用[J];测绘科学技术学报;2007年05期
9 李雪梅;张素琴;;主成分分析在区域经济分析中的应用[J];计算机工程与应用;2009年19期
10 黎夏,叶嘉安;主成分分析与Cellular Automata在空间决策与城市模拟中的应用[J];中国科学(D辑:地球科学);2001年08期
中国重要会议论文全文数据库 前10条
1 么彩莲;魏宁;;关于主成分分析的改进方法探讨[A];中国现场统计研究会第12届学术年会论文集[C];2005年
2 陈明星;缪柏其;靳韬;;利率影响因素的主成分分析与因子分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年
3 孙晓东;胡劲松;焦s
本文编号:275440
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/275440.html