当前位置:主页 > 管理论文 > 统计学论文 >

有序数据的多元分析模型及实证研究

发布时间:2020-05-28 15:15
【摘要】: 统计方法的应用实践经常会受到来自数据结构、数据缺失或者数据生成过程的某些限制,在面对有序数据时,这种限制更多,也更复杂。基于这个现实,本文首先界定了有序数据的统计范畴,详细研究了有序数据的分类、抽样分布以及与其他类型数据的区别和联系。通过对近年来国内外文献回顾,本文发现国外对有序数据的研究较多集中在有序数据的建模分析、非参数检验和弱分布条件下的多元统计分析三个方面。 在此基础上,本文引入了分析有序数据的非线性主成分方法。第一种方法是基于Gifi方法的非线性主成分分析,该方法通过交替最小二乘法使有序数据的分类赋值达到最优之后再进行主成分分析。第二种方法是基于核函数的非线性主成分分析,其基本思路是通过核函数的映射,将具有非线性关系的有序数据转换为具有线性关系数据之后再进行主成分分析。 为了比较这两种方法的优劣,本文通过拟合数据,发现基于核函数的非线性主成分分析方法在提取一个主成分时具有很明显的优势,但是当有序数据分类增多、一个主成分不能说明问题时,Gifi方法的非线性主成分分析的效果反而比较好。 根据这一结论,本文使用了基于Gifi方法的非线性主成分分析对实际案例进行了实证数据的研究,并取得了较好的效果。
【图文】:

赋值,有序数据,主成分,相关程度


图4-1 变量分类赋值的转换通过对有序数据赋值的最优转换后,就可以提取主成分。在二维情形下,提取的主成分特征根分别为 2.308、1.509,主成分载荷(components loadings)如图 4-2 所示。由于载荷在欧几里德空间里几乎都等于单位长度,因此这些载荷之间任意两个的夹角都反映了对应变量的相关系数(George Michailidis,1998)。可以看出,变量 X1、X2、X3之间的相关程度较高,而变量 X4、X5、X6之间的相关程度较高。在第一维度上,虽然反映了所有变量正方向上的喜好程度

赋值,二维空间,目标,平均数


图4-2 主成分载荷根据变量分类的最优赋值和二维空间上的主成分载荷,可以计算出目标得分(如图 4-3)。为了体现在这两个维度上的消费者特征,这里把目标得分分成五类。首先计算得到六个变量最优赋值的简单平均数为:-3.022、-1.540、-0.240、0.252、1.712,然后以相邻平均数的中点为分类临界值,即分成-2.281 以下、-2.281~-0.890、-0.890~0.006、0.006~0.982、0.982 以上五类,分别用 1、2、3、4、5 表示,代表了消费者的喜好程度逐渐加强。图4-3 目标得分
【学位授予单位】:山西财经大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:C81

【参考文献】

相关期刊论文 前10条

1 刘洪,于书敏;多维表对偶标度在抽样调查数据中的应用[J];鞍山师范学院学报;2000年01期

2 张功员;医学论文中定性资料假设检验方法的常见错误分析[J];编辑学报;2002年03期

3 杨毅恒,范继璋,王学孔,夏立显;一种以有序变量为因变量的四归分析方法及其地质应用[J];长春地质学院学报;1992年02期

4 李树军,纪宏金;对应聚类分析与变量选择[J];地球物理学进展;2005年03期

5 缪柏其;牛惠芳;戴小莉;;非线性主成分在课堂教学评估体系中的应用[J];中国高等教育评估;2002年03期

6 李长虹,耿忠贤,安希忠;关于有序定性变量的模型[J];吉林农业大学学报;1990年03期

7 范霄文;朱建平;;基于粗糙集流向图的多维定性数据分析方法[J];科技导报;2007年16期

8 李建立;含有序变量的三维列联表分析[J];上海第二医科大学学报;1989年03期

9 周劲;潘玉奇;张平;;扩展的最优分割法在有序样本分类中的应用[J];计算机工程与设计;2006年04期

10 刘洪,王莉,夏立显;基于模糊分类的多维定性数据的统计分析[J];数理统计与管理;2005年03期

相关博士学位论文 前1条

1 刘洪;定性资料处理技术的应用研究[D];吉林大学;2005年



本文编号:2685429

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/2685429.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户26600***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com