当前位置:主页 > 管理论文 > 统计学论文 >

基于非线性关系变量间的偏相关分析研究

发布时间:2020-03-29 15:02
【摘要】:大数据时代,研究事物之间的关联是必不可少的的课题.事物之间的关联性十分复杂,要从这些数据中获取有用的信息,相关性分析是其中重要的方法之一.它从简单的身高遗传问题逐渐衍生到多个领域,其中,偏相关的分析问题备受研究者关注.所谓偏相关分析指的是对于多个定距变量,把其他变量的影响排除后,再对某两个变量的相关性进行分析,与简单相关分析相比,它能够更准确的反映变量间真实的、本质的关联性.在统计学中,用偏相关系数这一统计量来度量变量间的相关程度和相关方向,它的研究是建立在变量的总体服从正态分布的基础上.在线性情形下,偏相关系数等价于控制某一变量不变的条件下其他变量的条件相关.但大多数情况下,变量之间的关系非常复杂,并非都是线性关系,非线性可能占据一大部分,在这种情况下,用偏相关系数度量的相关性的准确度就会降低,甚至与实际有较大的差异.由于目前对于这一问题的研究较少,因此本文就非线性关系的变量间的相关分析进行研究.偏相关使用中,对基本假设的忽略,使得偏相关分析的准确性受到影响.在非线性关系存在时,条件相关不能用来解释偏相关.基于这一问题,本文以具有非线性关系的变量作为研究对象,着重对这些变量的偏相关与条件相关问题进行研究.本文从偏相关的本质出发,将所有与控制变量有关的成分的影响排除,并证明了修正后得到的偏相关与条件相关不仅是相互等价的,而且更具稳健性.本文提出了一种新的非线性关系模型一模型3,也取得了和上述一致的成果.并根据非线性回归方法中评价模型拟合好坏的两个指标,与已有模型作了进一步的比较.研究结果表明新模型拟合较好,体现了新模型的优越性.本文由五部分构成:第一章:绪论.对偏相关分析的研究背景及其研究的目的和意义进行简单陈述,分析了国内外研究现状,并阐述了本文主要研究问题和创新之处.第二章:相关分析方法介绍.对常用的一些相关性方法作了简介,描述了各个方法及其适用范围,同时详细介绍了偏相关系数的定义.并从已有的模型出发,引出本文要研究的主要问题.第三章:偏相关系数的稳健性分析.针对非线性时偏相关与条件相关不等价这一结果,本文对其做了进一步的修正工作.结合偏相关系数定义的本质,通过理论推导的方式证明了该修正方法的合理性,使得偏相关系数具有更好的稳健性.第四章:基于三次曲线关系变量间的偏相关问题.考虑到现有非线性模型2存在一定的不足,本文提出了新的三次曲线非线性模型一模型3.就此模型与已有的模型2的偏相关与条件相关进行对比分析,结果表明它们不相等.基于此做了进一步的工作,并验证了这一模型的合理性.最后据非线性回归中的两个指标对模型进行比较分析,结果表明模型3有更好的拟合效果.第五章:总结与展望.概括本文的主要内容,并指出了今后的研究方向.
【图文】:

散点图,散点图,变量


、之与7之间存在不按比例变化的非线性关系,此时应该先确定适用的非线性类型.因逡逑而在做一系列研宄工作之前,要先对数据进行检验,检验其是线性的还是非线性的.故逡逑下面根据散点图来进行简单判断.如图4.1的散点图展示了在参数取值为《邋=邋5J邋=逡逑3,邋c邋=邋1,邋d邋=邋3时模型3中变量的关系:逡逑图4.1中左右两个子图分别是Z和X与Z和Y的散点图,根据图中散点的走向,可以逡逑初步判断它们之间接近三次非线性关系.为了能够同时观察到三个变量中两两之间的逡逑相关情况,绘制出矩阵散点图,观察变量的分布规律,如图4.2.逡逑从图4.2中可以直观的看到两两变量之间是非线性关系,用非线性模型来拟合比较逡逑合适.从X和Y的相关图也能够观察到,变量X与Y是线性关系,这与模型中展现的情逡逑况相吻合.总之,从散点图中点的分布情况,初步可以断定这些数据是呈非线性关系的.逡逑24逡逑

散点图,散点图,矩阵


Z逦Z逡逑图4.1变量z和x、z和y的散点图逡逑其中,离差平方和zy3/邋=逦—拓)2.逡逑那么,根据拟合指标代表的意义可知,从多个方程中选择拟合情况较好的一个时,逡逑应该选那个剩余平方和相对较小、相关指数相对较大的方程作为最后的回归模型.逡逑§4.3.2模型评价逡逑非线性关系的存在对变量的相关性研究产生了很大的影响,结合第三章的结果,逡逑为准确分析相关性,在实际问题中,应该先对变量之间是否为线性关系进行判别.如果逡逑是线性关系,那么就可以完全按照己给的偏相关分析方法来度量相关性.而如果Z与X逡逑、之与7之间存在不按比例变化的非线性关系,此时应该先确定适用的非线性类型.因逡逑而在做一系列研宄工作之前,,要先对数据进行检验,检验其是线性的还是非线性的.故逡逑下面根据散点图来进行简单判断.如图4.1的散点图展示了在参数取值为《邋=邋5J邋=逡逑3
【学位授予单位】:山西大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:C815

【相似文献】

相关期刊论文 前10条

1 王祖力;张艳;;脑功能网络核心节点及网络稳定性研究[J];中国计量学院学报;2014年04期

2 王占礼,张红梅;航海英语听力口语阅读相关分析[J];青岛远洋船员学院学报;2004年02期

3 苏从成;刘咏梅;张淑红;;论文的被引频次与外部特征参数的相关与偏相关分析——以动物营养与饲料学科的4种核心期刊为例[J];情报探索;2018年10期

4 李雪松,沈其君;线性模型中自变量相对重要性估计[J];南京铁道医学院学报;2000年02期

5 王凯;谢岳通;;无线网络满意度的数理统计建模分析[J];通信技术;2014年10期

6 王芳娟;;基于三种相关分析的脑功能网络研究[J];绍兴文理学院学报(自然科学);2012年04期

7 孟祥忠;;基于偏相关-灰色综合关联度的温度测点优化[J];组合机床与自动化加工技术;2018年08期

8 姜秀英;于永梅;王铮;韩勇;刘军;张悦;;辽宁省主要稻区水稻新品种品质性状的主成分及聚类分析[J];安徽农学通报(上半月刊);2009年07期

9 刘颖,张智慧;中国人均GDP(1952-2002)时间序列分析[J];统计与决策;2005年04期

10 谢润成;周文;高雅琴;郭新江;葛善良;张凌子;;应用偏相关+灰关联方法进行致密砂岩气藏压裂地质选层[J];石油与天然气地质;2008年06期

相关会议论文 前1条

1 肖深根;刘志敏;宋勇;杨广;;苋菜品种资源光合特性研究[A];中国园艺学会第四届青年学术讨论会论文集[C];2000年

相关博士学位论文 前1条

1 周宝良;野生棉种渐渗创新的优质棉种质及其遗传研究[D];南京农业大学;2008年

相关硕士学位论文 前5条

1 高艳;基于非线性关系变量间的偏相关分析研究[D];山西大学;2018年

2 刘仁建;红花种子醇溶蛋白及其含油率和脂肪酸分析[D];四川农业大学;2006年

3 张秀娟;西北四省区气候干湿变化及其成因初探[D];兰州大学;2012年

4 吕宏伟;LiNGAM模型的剪枝算法研究[D];广东工业大学;2015年

5 程楠;圆形数据的几种相关性度量[D];北京工业大学;2017年



本文编号:2606133

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2606133.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cc049***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com