基于遗传算法和概率粗糙集的属性约简研究
发布时间:2020-12-13 17:23
粗糙集作为一种新型的数学工具用来处理一些不确定和不完整信息,利用集合中各属性之间的不可分辨关系,将系统中的信息更加简洁有效地表示出来,目前已经被应用到各个领域。经典粗糙集模型的假设分类必须是确定的,在实际应用中缺乏一定的灵活性,因而存在着很大的局限性,不能很好地处理含有干扰信息的数据。为此,众多学者在传统粗糙集的基础上引入概率阈值提出了概率粗糙集模型。属性约简是粗糙集理论研究中最主要的问题之一,从客观上来讲,冗余信息存在于各类知识决策系统当中,属性约简就是删除其中不相关的属性,对系统中的属性进行简化。所谓最小约简就是更加简明有效的属性决策规则,然而能否求出最小属性约简问题被证明是一个NP问题。要探寻一种合适的属性约简算法在日常生活中就显得尤为重要。本文针对概率粗糙集处理属性约简过程出现的不确定性,与遗传算法结合提高约简效率,对概率粗糙集属性约简进行更深入的研究,提出了两种属性约简算法,取得主要研究成果如下:1.针对基于概率粗糙集的启发式属性约简算法,必须在属性核的基础上计算所有属性添加和删除之后的概率近似精度的更新值,计算量大且所需存储空间多,导致效率低。基于此,提出改进近似精度和概率...
【文章来源】:西北师范大学甘肃省
【文章页数】:52 页
【学位级别】:硕士
【部分图文】:
基于依赖度的约简算法流程图
西北师范大学硕士学位论文32文算法的有效性。(1)对于小型决策表的属性约简用随机算法在MATLAB中随机产生的小型决策表如表4-5所示,其中12100U=e,e,e为全体对象集合,1210C=a,a,,a为条件属性集合,D=d为决策属性集合,V=0,1,2为属性值集合,算法迭代的最大次数设置为100次。表4-5小型决策表U1a2a3a4a5a6a7a8a9a10ad1e011001010012e101100101123e001001010104e100000001115e0110111101296e0100101011297e1011010010198e0010001001199e01111010111100e11110100001两种算法关于小型决策表的迭代次数和适应度函数值对比如图4-4所示:图4-4两种算法对小型决策表进行属性约简的适应度函数值上升曲线对于小型决策表,本节算法花费的时间为1824ms,文献[40]花费的计算时间为2215ms,两者都能求得最小属性约简为1247910a,a,a,a,a,a。图4-4表明两种约简算法的适应度函数值都呈递增趋势,由于迭代次数的减少所以相比较而言本节
第4章基于遗传算法和概率粗糙集的属性约简算法33算法花费的时间要更少。但本节所提属性约简算法在第23次迭代时得出最佳个体且适应度不再改变,其适应度函数值为0.58;文献[40]中的属性约简算法在第27次迭代时收敛,其适应度值为0.51。由此可见,本节提出的算法在迭代次数减少的情况下还能够获得更高的适应度函数值,从而提高了属性约简效率。(2)对于中型决策表的属性约简在随机算法在MATLAB中随机产生的中型决策表如表4-6所示,其中12150U=e,e,,e为全体对象集合,1215C=a,a,,a为条件属性集合,D=d为决策属性集合,V=0,1,2为属性值集合,算法迭代的最大次数设置为100次。表4-6中型决策表U1a2a3a4a5a11a12a13a14a15ad1e101010010122e010101101023e000111000114e111101101125e10001101100148e11100010001149e01001000112150e11010010001两种算法关于小型决策表的迭代次数和适应度函数值对比如图4-5:图4-5两种算法对中型决策表进行属性约简的适应度函数值上升曲线对于中型决策表,本节算法花费的计算时间为23794ms,文献[40]花费的计算
本文编号:2914898
【文章来源】:西北师范大学甘肃省
【文章页数】:52 页
【学位级别】:硕士
【部分图文】:
基于依赖度的约简算法流程图
西北师范大学硕士学位论文32文算法的有效性。(1)对于小型决策表的属性约简用随机算法在MATLAB中随机产生的小型决策表如表4-5所示,其中12100U=e,e,e为全体对象集合,1210C=a,a,,a为条件属性集合,D=d为决策属性集合,V=0,1,2为属性值集合,算法迭代的最大次数设置为100次。表4-5小型决策表U1a2a3a4a5a6a7a8a9a10ad1e011001010012e101100101123e001001010104e100000001115e0110111101296e0100101011297e1011010010198e0010001001199e01111010111100e11110100001两种算法关于小型决策表的迭代次数和适应度函数值对比如图4-4所示:图4-4两种算法对小型决策表进行属性约简的适应度函数值上升曲线对于小型决策表,本节算法花费的时间为1824ms,文献[40]花费的计算时间为2215ms,两者都能求得最小属性约简为1247910a,a,a,a,a,a。图4-4表明两种约简算法的适应度函数值都呈递增趋势,由于迭代次数的减少所以相比较而言本节
第4章基于遗传算法和概率粗糙集的属性约简算法33算法花费的时间要更少。但本节所提属性约简算法在第23次迭代时得出最佳个体且适应度不再改变,其适应度函数值为0.58;文献[40]中的属性约简算法在第27次迭代时收敛,其适应度值为0.51。由此可见,本节提出的算法在迭代次数减少的情况下还能够获得更高的适应度函数值,从而提高了属性约简效率。(2)对于中型决策表的属性约简在随机算法在MATLAB中随机产生的中型决策表如表4-6所示,其中12150U=e,e,,e为全体对象集合,1215C=a,a,,a为条件属性集合,D=d为决策属性集合,V=0,1,2为属性值集合,算法迭代的最大次数设置为100次。表4-6中型决策表U1a2a3a4a5a11a12a13a14a15ad1e101010010122e010101101023e000111000114e111101101125e10001101100148e11100010001149e01001000112150e11010010001两种算法关于小型决策表的迭代次数和适应度函数值对比如图4-5:图4-5两种算法对中型决策表进行属性约简的适应度函数值上升曲线对于中型决策表,本节算法花费的计算时间为23794ms,文献[40]花费的计算
本文编号:2914898
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2914898.html