当前位置:主页 > 科技论文 > 自动化论文 >

属性约简的优化方法及其应用研究

发布时间:2022-07-13 16:49
  维度灾难是机器学习和数据挖掘技术常见的挑战之一,属性约简作为特征选择的一种技术,尽可能选择一个最小的属性子集来精确的描述学习数据。现存的属性约简算法存在的问题可以总结如下:(1)属性约简算法往往选择出的局部最优解是不稳定的,这种不稳定往往会带来歧义;(2)属性准则的评价机制目前还不够完善;(3)数据的内在结构以及属性与标签之间的联系研究还不够充分。鉴于此,本文分别从集成属性重要度方法、多准则策略、基于局部视角的属性评价机制来优化属性约简算法。本文的研究内容和创新性成果主要在于:(1)首先提出了一种基于集成属性重要度的启发式算法框架。利用邻域粗糙集方法,实验结果表明,该集成算法不仅能够获取更加稳定的约简,而且比传统算法时间消耗要低;(2)借助集成学习中的联合分布矩阵,设计出新的属性评价准则分类一致性。进一步地,提出了将分类一致性与分类精度的调和平均作为新的属性准则评价机制。实验结果表明,基于多准则的属性约简方法在求解属性子集时,保证追求提升分类不一致性的同时,也不会降低分类性能,更重要的是,考虑多准则的属性约简可以提升约简结果的稳定性能;(3)提出了一种局部视角的代价敏感属性约简方法。它... 

【文章页数】:76 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 .研究背景与意义
    1.2 .国内外研究现状
    1.3 .研究内容与组织结构
第2章 粗糙集理论概述
    2.1 .Pawlak经典粗糙集
        2.1.1 .知识表示与粗糙近似集
        2.1.2 .粗糙近似集与近似集的度量
    2.2 .模糊粗糙集
        2.2.1 .模糊集
        2.2.2 .模糊粗糙集模型
        2.2.3 .近似质量与条件熵
    2.3 .模糊决策理论粗糙集
        2.3.1 .模糊决策理论粗糙集模型
        2.3.2 .决策代价
    2.4 .本章小结
第3章 属性约简
    3.1 .属性约简基本概念
    3.2 .属性约简求解方法
        3.2.1 .评价准则
        3.2.2 .求解约简的方法
    3.3 .属性约简的稳定性
        3.3.1 .稳定性的基本概念
        3.3.2 .稳定性的度量方法
    3.4 .本章小结
第4章 集成属性重要度的属性约简方法
    4.1 .研究背景
    4.2 .基于多重聚类的集成策略
    4.3 .性能分析
        4.3.1 .参数设置与数据集
        4.3.2 .时间消耗对比
        4.3.3 .约简子集的稳定性对比
        4.3.4 .属性排序的稳定性对比
    4.4 .本章小结
第5章 基于多准则策略的属性约简方法
    5.1 .研究背景
    5.2 .邻域决策错误率属性约简
        5.2.1 .邻域分类器
        5.2.2 .邻域决策错误率
    5.3 .基于多准则的属性约简
        5.3.1 .邻域决策一致性
        5.3.2 .多准则属性约简
    5.4 .实验分析
        5.4.0. 数据集与参数设置
        5.4.1 .分类精度对比
        5.4.2 .分类结果一致性对比
        5.4.3 .约简结果稳定性对比
    5.5 .本章小结
第6章 基于局部视角的代价敏感属性约简
    6.1 .研究背景
    6.2 .基于局部视角的属性约简
        6.2.1 .代价敏感属性约简
        6.2.2 .问题描述
        6.2.3 .基于局部视角的属性评价机制
    6.3 .性能分析
        6.3.1 .数据集与参数设置
        6.3.2 .全局决策代价变化的对比
        6.3.3 .局部决策代价变化的对比
    6.4 .本章小结
结论与展望
参考文献
攻读硕士学位期间的研究成果
致谢


【参考文献】:
期刊论文
[1]特征选择稳定性研究综述[J]. 刘艺,曹建军,刁兴春,周星.  软件学报. 2018(09)
[2]An Incremental Algorithm to Feature Selection in Decision Systems with the Variation of Feature Set[J]. QIAN Wenbin,SHU Wenhao,YANG Bingru,ZHANG Changsheng.  Chinese Journal of Electronics. 2015(01)
[3]基于邻域粗糙集的多标记分类特征选择算法[J]. 段洁,胡清华,张灵均,钱宇华,李德玉.  计算机研究与发展. 2015(01)
[4]决策粗糙集的一种新分类区域及相关比较分析[J]. 张贤勇,苗夺谦.  系统工程理论与实践. 2014(12)
[5]基于差异性的分类器集成:有效性分析及优化集成[J]. 杨春,殷绪成,郝红卫,闫琰,王志彬.  自动化学报. 2014(04)
[6]基于样例选取的属性约简算法[J]. 王熙照,王婷婷,翟俊海.  计算机研究与发展. 2012(11)
[7]基于粗糙集的属性约简方法研究综述[J]. 杨传健,葛浩,汪志圣.  计算机应用研究. 2012(01)
[8]决策风险最小化属性约简[J]. 贾修一,商琳,陈家骏.  计算机科学与探索. 2011(02)
[9]粗糙集理论与应用研究综述[J]. 王国胤,姚一豫,于洪.  计算机学报. 2009(07)
[10]基于邻域粒化和粗糙逼近的数值属性约简[J]. 胡清华,于达仁,谢宗霞.  软件学报. 2008(03)

硕士论文
[1]稳定的特征选择算法研究[D]. 黄莎莎.南京邮电大学 2014



本文编号:3660406

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3660406.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3a159***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com