当前位置:主页 > 管理论文 > 领导决策论文 >

考虑特征变量异质性的分类方法及其在风险决策中的应用研究

发布时间:2017-05-18 19:06

  本文关键词:考虑特征变量异质性的分类方法及其在风险决策中的应用研究,由笔耕文化传播整理发布。


【摘要】: 风险决策中广泛存在着具有如下特征的一类问题,即风险决策者首先需要建立历史数据样本与自然状态之间的依赖关系,然后根据该依赖关系估计一个新的数据样本所对应自然状态的出现概率,最后建立风险决策模型,以最大化收益函数(或最小化风险损失函数)为目标选择最优行动方案。从建立历史数据样本与自然状态的依赖关系这一意义上,可以将这类风险决策问题归纳为数据挖掘中的分类问题,因而数据挖掘中的各种分类方法可以应用于该类风险决策问题。由于分类的高效性和准确性对于风险决策具有关键性影响,因此分类方法及其在风险决策中的应用研究具有重要的理论和现实意义。 已有的相关研究主要从分类方法及其应用的角度考虑风险决策问题。事实上,在应用各种数据挖掘技术前,探索了解数据的特性将对挖掘结果有重要甚至关键性的影响。在分类问题中,特征变量异质性是一种重要的数据特性,对于分类方法的应用结果具有显著影响。因此,本文主要研究考虑特征变量异质性的分类方法及其在风险决策问题中的应用。研究目的在于探索数据中存在的特征异质性这一数据特性,并提出相应的解决方法以提高分类的准确性,使分类方法能够更好地为风险决策提供支持。 本文从第一章到第六章的内容安排如下: 第一章概述了本文的研究背景,回顾了分类方法及其在风险决策问题中的相关研究和分类问题中特征变量异质性的研究现状,说明了本文的研究内容和研究意义。 第二章首先对分类问题进行简要介绍,然后概述分类问题中的特征变量相关性和特征变量选择问题。在此基础上,根据一系列理论和实际应用研究对特征变量异质性的概念进行描述。由于特征变量异质性无法从数据样本集合中直接观察和测度,本章基于荟萃分析的基本思想,提出了一种利用全局特征变量选择和数据样本集合随机划分的方法来测度特征变量异质性的方法。在一系列基准数据集和人工构造的混合数据集上的实验计算结果说明了该测度方法的有效性。 第三章主要考察特征变量异质性对分类方法效果的影响。本章首先对特征变量异质性的影响进行简要分析,然后通过实证研究说明分类问题中存在的特征变量异质性对分类方法的准确率具有较为显著的影响。本章采用的分类方法为一种将logistic回归与支持向量机集成的分类方法,该方法的主要思想是应用logistic回归的输出概率为支持向量机提供支持信息,以提高分类判别准确性。实证研究以企业财务困境预测这一风险管理和决策问题为背景,通过比较考虑特征变量异质性前后的分类预测准确率,说明了在存在特征变量异质性的分类问题中,考虑特征变量异质性有利于提高分类方法的准确率。 第四章提出了一种基于因子分析和聚类分析的分类策略,该策略的基本思想是首先将原始的特征变量转化为新的特征变量,使得新的特征变量能够体现出原始特征变量在数据样本空间中的异质性,然后通过聚类分析得到各个具有特征变量同质性的样本子集,并在每个样本子集中分别建立相应的分类模型,从而减小特征变量异质性对分类方法准确率的影响。对于一个未知类标记样本,该分类策略首先将其转化为因子得分向量,然后将该因子得分向量按照最近邻规则划分到与之最近的样本子集合中,最后利用该样本子集合中的分类模型进行分类。在一系列基准数据集上的实验计算结果说明了该分类策略的有效性。 第五章提出了一种考虑特征变量异质性且具有增量式学习特性的分类方法,可有效应用于一类具有特征变量异质性且需要决策者利用分类方法进行在线实时风险决策的问题。该方法首先利用基于网格的有指导聚类对数据样本集合进行划分,从而得到若干数据簇,且每个数据簇中数据样本点的类标记相同。在去除异常数据点后,该方法计算各个数据簇的特征变量相关性,并将该相关性作为距离测度中各特征变量的权重,应用最近邻方法进行分类。本章最后将该分类方法应用于一系列基准数据集和市场营销中的顾客确定问题,实证结果说明了该方法的有效性。 第六章总结本文的工作,归纳本文的主要创新点,指出目前本文研究的局限,并根据已取得的研究结果对未来进一步研究的问题进行思考。 本文工作的主要创新点如下: (1)提出了一种有效的特征变量异质性的测度方法,该方法可用于探索分类问题中存在的特征变量异质性,为解决分类问题提供策略性的信息。 (2)提出了一种基于logistic回归与支持向量机集成的分类方法,该方法利用logistic回归得到的后验概率信息对支持向量机的输出结果进行修正,能够有效提高传统支持向量机的分类准确性。 (3)提出了一种有效的考虑特征变量异质性的分类策略,该策略将具有特征变量异质性的数据样本集合划分为若干同质性的子集合,然后通过在各个子集合中分别建立分类模型来提高分类的准确性。 (4)提出了一种具有增量式学习特性的分类方法,该方法能够以增量学习的方式处理由于数据样本频繁更新而导致的特征变量异质性模式变化,可以在存在特征变量异质性且需要实时在线决策的风险决策问题中得到有效的应用。
【关键词】:风险决策 分类 特征变量异质性 因子分析 聚类 增量学习
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:F224;C934
【目录】:
  • 摘要5-8
  • ABSTRACT8-12
  • 目录12-14
  • 图序14-15
  • 表序15-16
  • 第1章 绪论16-28
  • 1.1 本文的研究背景和意义17-20
  • 1.1.1 本文的研究背景17-19
  • 1.1.2 本文的研究意义19-20
  • 1.2 研究现状20-24
  • 1.2.1 分类方法在风险决策问题中的应用研究现状20-21
  • 1.2.2 分类问题中特征变量异质性的研究现状21-24
  • 1.3 本文的主要工作和创新24-25
  • 1.3.1 本文的主要工作24-25
  • 1.3.2 本文的主要创新25
  • 1.4 本文的内容组织结构25-28
  • 第2章 特征变量异质性的概念和测度方法28-46
  • 2.1 分类问题中的特征变量相关性和特征变量选择28-32
  • 2.1.1 分类问题简介28-30
  • 2.1.2 特征变量相关性和特征变量选择30-32
  • 2.2 特征变量异质性的概念32
  • 2.3 特征变量异质性测度32-38
  • 2.3.1 荟萃分析简介33-35
  • 2.3.2 特征变量异质性测度方法35-38
  • 2.4 实验计算结果38-45
  • 2.5 本章总结45-46
  • 第3章 特征变量异质性对分类的影响46-70
  • 3.1 特征变量异质性的影响46-47
  • 3.2 支持向量机与logistic回归集成预测方法47-63
  • 3.2.1 支持向量机简介47-53
  • 3.2.2 Logistic回归简介53-58
  • 3.2.3 IBDR58-61
  • 3.2.4 基准数据集实验结果61-63
  • 3.3 企业财务困境预测实证研究63-67
  • 3.3.1 财务困境预测指标体系63-64
  • 3.3.2 企业财务困境预测结果及分析64-67
  • 3.4 本章小结67-70
  • 第4章 基于因子分析与聚类分析集成的分类策略70-90
  • 4.1 因子分析简介71-73
  • 4.2 聚类分析简介73-77
  • 4.2.1 划分型聚类73-75
  • 4.2.2 层次型聚类75
  • 4.2.3 密度聚类75-76
  • 4.2.4 其它聚类方法76-77
  • 4.3 CAFAC77-82
  • 4.3.1 CAFAC的基本原理77-79
  • 4.3.2 CAFAC的步骤79-82
  • 4.4 实验计算结果82-88
  • 4.4.1 CAFAC在36个混合数据集上的结果82-86
  • 4.4.2 CAFAC与其它分类方法的比较结果86-88
  • 4.5 本章小结88-90
  • 第5章 具有增量学习特性的分类方法90-104
  • 5.1 问题背景90-91
  • 5.2 本文提出的方法91-97
  • 5.2.1 SCCFSH的基本思想92
  • 5.2.2 基于网格的有指导聚类92-94
  • 5.2.3 数据簇的有指导合并和去除异常点94-95
  • 5.2.4 基于加权距离的分类95-97
  • 5.3 实验计算结果97-101
  • 5.3.1 基准数据集计算结果97-100
  • 5.3.2 消费者确定问题中的应用100-101
  • 5.4 本章小结101-104
  • 第6章 总结与展望104-106
  • 6.1 全文总结104-105
  • 6.2 未来可能的研究展望105-106
  • 参考文献106-112
  • 致谢112-113
  • 在读期间发表的学术论文与取得的研究成果113

【引证文献】

中国期刊全文数据库 前1条

1 刘又滋;;论财务会计报表对烟草公司的影响[J];财经界;2010年12期

中国博士学位论文全文数据库 前1条

1 张雪梅;供应链环境中满足顾客差异化需求的产品设计策略[D];中国科学技术大学;2011年


  本文关键词:考虑特征变量异质性的分类方法及其在风险决策中的应用研究,由笔耕文化传播整理发布。



本文编号:376887

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/376887.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b27ef***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com