当前位置:主页 > 科技论文 > 自动化论文 >

面向多标记分类的粗糙特征选择方法研究

发布时间:2021-10-22 15:56
  众所周知,除非结构化、多模态、多关联等特性外,高维、多标记也是数据复杂性的主要表现形式。比如,一张图片可能同时包含“夕阳”、“云彩”、和“树木”等标记。一篇文档可能同时包含“非洲”、“内战”、和“石油”等标记。通常这些多标记数据还是高维的,比如基因的序列,图像的像素点,文本的特征词等。数据的高维性通常会增加数据分析算法的空间和时间复杂度,而数据的多标记性会增加模型的复杂度。发展高维多标记数据的特征选择方法不仅对数据建模、机器学习等领域具有重要理论意义,而且具有重要的潜在应用价值。粗糙集理论是一种处理不确定性信息的有效方法,它无需对数据进行先验假设,利用信息粒构造概念近似算子,并在设计的准则下对数据进行约简,然后建立基于规则或其他形式的分类器,已在许多数据分析与挖掘领域中取得广泛应用。本文面向多标记数据分类问题,发展模糊粗糙集和邻域粗糙集模型,应用于多标记数据的特征选择。论文的主要研究内容和结论如下:(1)基于标记相关性的多标记模糊粗糙特征选择方法多标记数据的标记并非是独立的,而现有的多标记分类的粗糙特征选择方法大多都没有考虑标记间的相关性,这影响了所建模型的性能。为解决这一问题,本文提... 

【文章来源】:山西大学山西省

【文章页数】:61 页

【学位级别】:硕士

【文章目录】:
中文摘要
ABSTRACT
第一章 绪论
    1.1 研究背景、目的及意义
    1.2 国内外研究现状
        1.2.1 粗糙特征选择
        1.2.2 基于机器学习的特征选择
    1.3 主要研究内容
    1.4 论文组织结构
第二章 相关理论基础
    2.1 基本概念
    2.2 粗糙集
        2.2.1 上下近似
        2.2.2 属性约简
    2.3 模糊粗糙集模型
    2.4 邻域粗糙集模型
    2.5 本章小结
第三章 基于标记关系的模糊粗糙特征选择
    3.1 基本概念
    3.2 特征选择方法
        3.2.1 标记模糊粗糙集模型
        3.2.2 特征选择算法
    3.3 实验
        3.3.1 数据集与评价指标
        3.3.2 结果及分析
    3.4 本章小结
第四章 基于双重粒化的邻域粗糙特征选择
    4.1 对象关系邻域粗糙集模型
    4.2 标记关系邻域粗糙集模型
    4.3 特征选择算法
    4.4 实验
        4.4.1 数据集与评价指标
        4.4.2 结果及分析
    4.5 本章小结
第五章 结论与展望
    5.1 结论
    5.2 展望
参考文献
攻读学位期间取得的研究成果
致谢
个人简况及联系方式


【参考文献】:
期刊论文
[1]基于邻域粗糙集的多标记分类特征选择算法[J]. 段洁,胡清华,张灵均,钱宇华,李德玉.  计算机研究与发展. 2015(01)
[2]一类基于信息熵的多标签特征选择算法[J]. 张振海,李士宁,李志刚,陈昊.  计算机研究与发展. 2013(06)
[3]粗糙集理论与应用研究综述[J]. 王国胤,姚一豫,于洪.  计算机学报. 2009(07)
[4]基于邻域粗糙集的符号与数值属性快速约简算法[J]. 胡清华,赵辉,于达仁.  模式识别与人工智能. 2008(06)
[5]基于遗传算法的粗糙集知识约简方法[J]. 陶志,许宝栋,汪定伟,李冉.  系统工程. 2003(04)
[6]Rough集理论在不完备信息系统中的扩充[J]. 王国胤.  计算机研究与发展. 2002(10)



本文编号:3451418

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3451418.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户da65e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com