当前位置:主页 > 科技论文 > 搜索引擎论文 >

Spark下的分布式粗糙集属性约简算法

发布时间:2021-01-19 13:17
  属性约简(特征选择)作为数据预处理的重要环节,大多以属性依赖作为筛选属性子集的标准。设计了一种快速依赖计算方法 FDC,通过直接寻找基于相对正域的对象来计算依赖度,而不需要预先求出相对正域,相比传统方法在速度上有明显的性能提升。另外,改进鲸鱼优化算法(WOA)使其能够有效应用于粗糙集属性约简。结合上述两个方法,提出一种基于Spark的分布式粗糙集属性约简算法SP-WOFRST,并在两组人工合成的大数据集上与另一种基于Spark的粗糙集属性约简算法SP-RST进行对比实验。实验结果表明所提出的SP-WOFRST算法在精度和速度上均优于SP-RST。 

【文章来源】:计算机应用. 2020,40(02)北大核心

【文章页数】:6 页

【文章目录】:
0 引言
1 粗糙集与依赖度计算
    1.1 粗糙集
    1.2 依赖度计算
    1.3 快速依赖计算
2 鲸鱼优化算法及其改进
    2.1 鲸鱼优化算法
        2.1.1 包围猎物
        2.1.2 泡泡网攻击
        2.1.3 搜索猎物
    2.2 应用与改进
3 SP-WOFRST算法
4 实验结果与分析
    4.1 数据集
    4.2 实验配置
    4.3 度量标准
    4.4 结果分析
5 结语


【参考文献】:
期刊论文
[1]基于条件信息熵的决策表约简[J]. 王国胤,于洪,杨大春.  计算机学报. 2002(07)



本文编号:2987060

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2987060.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户817d7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com