Spark下的分布式粗糙集属性约简算法
发布时间:2021-01-19 13:17
属性约简(特征选择)作为数据预处理的重要环节,大多以属性依赖作为筛选属性子集的标准。设计了一种快速依赖计算方法 FDC,通过直接寻找基于相对正域的对象来计算依赖度,而不需要预先求出相对正域,相比传统方法在速度上有明显的性能提升。另外,改进鲸鱼优化算法(WOA)使其能够有效应用于粗糙集属性约简。结合上述两个方法,提出一种基于Spark的分布式粗糙集属性约简算法SP-WOFRST,并在两组人工合成的大数据集上与另一种基于Spark的粗糙集属性约简算法SP-RST进行对比实验。实验结果表明所提出的SP-WOFRST算法在精度和速度上均优于SP-RST。
【文章来源】:计算机应用. 2020,40(02)北大核心
【文章页数】:6 页
【文章目录】:
0 引言
1 粗糙集与依赖度计算
1.1 粗糙集
1.2 依赖度计算
1.3 快速依赖计算
2 鲸鱼优化算法及其改进
2.1 鲸鱼优化算法
2.1.1 包围猎物
2.1.2 泡泡网攻击
2.1.3 搜索猎物
2.2 应用与改进
3 SP-WOFRST算法
4 实验结果与分析
4.1 数据集
4.2 实验配置
4.3 度量标准
4.4 结果分析
5 结语
【参考文献】:
期刊论文
[1]基于条件信息熵的决策表约简[J]. 王国胤,于洪,杨大春. 计算机学报. 2002(07)
本文编号:2987060
【文章来源】:计算机应用. 2020,40(02)北大核心
【文章页数】:6 页
【文章目录】:
0 引言
1 粗糙集与依赖度计算
1.1 粗糙集
1.2 依赖度计算
1.3 快速依赖计算
2 鲸鱼优化算法及其改进
2.1 鲸鱼优化算法
2.1.1 包围猎物
2.1.2 泡泡网攻击
2.1.3 搜索猎物
2.2 应用与改进
3 SP-WOFRST算法
4 实验结果与分析
4.1 数据集
4.2 实验配置
4.3 度量标准
4.4 结果分析
5 结语
【参考文献】:
期刊论文
[1]基于条件信息熵的决策表约简[J]. 王国胤,于洪,杨大春. 计算机学报. 2002(07)
本文编号:2987060
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2987060.html