基于人口普查数据质量的异常数据分析
本文关键词:基于人口普查数据质量的异常数据分析
【摘要】:人口普查工作是一项重要的国情调查,国家政策的制定与实施会受人口普查数据的影响。如果人口普查数据质量不好,运用此数据进行各项分析的结果就不准确,将这种不准确结果作为制定政策的依据将影响中国社会的发展甚至是给整个社会的发展造成灾难性后果。因此,政府在制定各项政策措施之前,必须事先做好人口普查数据质量的分析工作。鉴于此,本文以我国第六次人口普查数据中的教育数据作为分析背景,从异常数据分析的角度剖析数据质量问题,旨在找出我国第六次人口普查数据教育数据中存在的异常现象,为教育部门制定教育规划、教育投入、教育政策等等提供一个切入点。本文从三个角度对我国第六次人口普查数据教育数据做异常分析:(1)从描述性角度,运用数据分析方法对我国31个省、直辖市以及自治区(除港澳台外)农村与城镇6岁以上各阶段受教育人口总体情况进行直观的全面的分析,找出此次人口普查数据中存在的异常现象,结合我国整体国情以及各地区情况进行说明;(2)从逻辑性角度,运用差额异常分析方法、同项异常分析方法和相关异常分析方法对我国31个地区农村与城市义务教育人口数据进行对比,找出我国第六次人口普查数据义务教育阶段数据中存在的异常现象,并结合该地区的实际情况进行说明;(3)从关联性的角度,根据描述性分析得出我国高等教育中存在异常现象,运用关联数据分析方法找出第六次人口普查数据高等教育数据中存在的异常并结合各地区实际情况进行说明。首先,对我国高等教育人口比率及其影响因素进行相关分析,找出高等教育人口比率的显著影响因素。其次,对已经选取出的显著因素做主成分分析,再利用得到的主成分做主成分线性回归,得到主成分回归方程。再次,一方面利用传统聚类分析方法和k-均值聚类分析方法对高等教育人口比率数据进行聚类分析,找出异常并结合各地区实际情况分析出现异常的原因;另一方面利用已经建立的线性回归方程,找出回归分析过程中的高杠杆点、拟合异常点以及强影响点,并结合各地区实际情况进行说明。最后,结合三种分析方法进行综合分析,找出我国高等教育数据中存在的异常现象并分析原因。
【学位授予单位】:成都理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:O212.1;C924.25
【相似文献】
中国期刊全文数据库 前6条
1 ;三八[J];中国科技信息;2004年06期
2 吴骏莲,顾朝林,黄瑛,龙国英;南昌城市社会区研究——基于第五次人口普查数据的分析[J];地理研究;2005年04期
3 李峰;未雨绸缪 做到“五重” 确保第五次人口普查数据质量──延庆县五普办有效控制普查数据质量的做法[J];北京统计;2001年08期
4 庞瑞秋;庞颖;刘艳军;;长春市社会空间结构研究——基于第五次人口普查数据[J];经济地理;2008年03期
5 李莉;;社科文摘[J];百科知识;2013年08期
6 ;[J];;年期
中国重要会议论文全文数据库 前1条
1 ;江苏省2010年第六次人口普查数据公报[A];老龄研究的理论与实践——江苏省老龄研究论文选集(2010-2011)[C];2011年
中国重要报纸全文数据库 前10条
1 刘正强;人口普查数据质量评估的思考[N];中国信息报;2011年
2 州统计局;我州人口普查数据已编审完[N];甘孜日报(汉文);2011年
3 记者 冯洁;确保人口普查数据真实准确[N];铜川日报;2010年
4 记者 肖建生 通讯员 徐林;确保人口普查数据真实准确完整[N];湖南日报;2010年
5 记者 李冬明;确保人口普查数据真实准确完整[N];江西日报;2010年
6 张裕辉 周洪斌;搞准人口普查数据的五项措施[N];中国信息报;2010年
7 记者 陆非凡;全力以赴 确保人口普查数据质量[N];嘉兴日报;2010年
8 记者 王婷婷;地区确保人口普查数据准确[N];阿勒泰日报(汉);2010年
9 记者 高家宽;结合人口普查数据推进统计成果应用[N];嘉兴日报;2011年
10 本报评论员 陈斌;人口普查数据真实性攸关公民权利[N];南方周末;2010年
中国硕士学位论文全文数据库 前2条
1 朱红霞;基于人口普查数据质量的异常数据分析[D];成都理工大学;2016年
2 吴重轩;社会经济因素对我国预期寿命的影响研究[D];上海社会科学院;2013年
,本文编号:1147337
本文链接:https://www.wllwen.com/shekelunwen/renkou/1147337.html