当前位置:主页 > 科技论文 > 自动化论文 >

代价敏感属性约简的混合蚁群优化算法

发布时间:2018-01-12 02:31

  本文关键词:代价敏感属性约简的混合蚁群优化算法 出处:《西南石油大学》2017年硕士论文 论文类型:学位论文


  更多相关文章: 粗糙集 属性约简 代价敏感学习 混合蚁群


【摘要】:随着计算机应用领域的不断扩张,所采集数据的维度呈现爆炸性增长。属性约简的本质是在保持决策系统分类能力不变的前提下,降低数据维度,帮助人们高效地做出决策。代价敏感学习是数据挖掘中十大最具挑战性问题之一,其相关属性约简问题的目的是获得最小测试代价、时间代价或误分类代价等。针对代价敏感属性约简问题,很多仿生算法已被提出。蜂群算法速度快,但过早收敛导致局部最优解,即解的代价不是最低。蚁群算法寻优能力强,但运行效率较低。本文提出了一种混合蚁群优化算法的一般性框架(hybrid ant colony optimization general framework,HA),它由两种搜索策略混合而成,即部分搜索和完全搜索策略。在部分搜索策略中,每只先驱者蚂蚁选择出k个属性。其中,k是一个经验值,由一个初始约简的大小决定。部分搜索策略摈弃了频繁计算正区域、删除冗余属性等操作,使得HA具有高效性。在完全搜索策略中,每只收割者蚂蚁选择出一个可行解。在两种搜索策略中,人工蚂蚁均通过更新路径上的信息素来优化路径。对于最小测试代价和最小时间代价的属性约简问题,本文基于HA分别实现了相应具体的算法。实验采用了 UCI数据库中的四个真实数据集,每个数据集采取三种不同的代价分布。通过大量的参数调整以及与已有算法的对比,结果表明:1)参数配置对速度与解产生重要影响;2)当解的质量(比如找到最优因子)相当时,本文算法运行效率高于已有算法;3)当运行效率相近时,本文算法解的质量高于已有算法。
[Abstract]:With the continuous expansion of computer application field, the dimension of the collected data presents explosive growth. The essence of attribute reduction is to reduce the data dimension on the premise of keeping the ability of decision system classification unchanged. Cost-sensitive learning is one of the ten most challenging problems in data mining. For the cost sensitive attribute reduction problem, many bionic algorithms have been proposed. Bee colony algorithm is fast, but premature convergence leads to local optimal solution. The cost of the solution is not the lowest. However, the running efficiency is low. In this paper, a general framework of hybrid ant colony optimization algorithm is proposed. Hybrid ant colony optimization general framework. Hahe, which consists of two search strategies, partial search and complete search. In the partial search strategy, each pioneer ant selects k attributes, where k is an empirical value. Part of the search strategy abandons the frequent computation of positive areas and deletes redundant attributes, which makes HA efficient in the complete search strategy. Each reaper ant chooses a feasible solution. In both search strategies, the artificial ant optimizes the path by updating the information on the path. The attribute reduction problem of minimum test cost and minimum time cost is discussed. In this paper, the corresponding algorithm is implemented based on HA, and four real data sets in UCI database are used in the experiment. Each data set takes three different cost distributions. Through a large number of parameter adjustments and comparison with existing algorithms, the results show that the configuration of the parameters has an important effect on the speed and solution. 2) when the quality of the solution (such as finding the optimal factor) is equal, the efficiency of the algorithm is higher than that of the existing algorithm. 3) when the running efficiency is similar, the quality of the proposed algorithm is higher than that of the existing algorithm.
【学位授予单位】:西南石油大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP18

【参考文献】

相关期刊论文 前10条

1 梁吉业;钱宇华;李德玉;胡清华;;大数据挖掘的粒计算理论与方法[J];中国科学:信息科学;2015年11期

2 孙磊;胡学龙;张晓斌;李云;;生物医学大数据处理的云计算解决方案[J];电子测量与仪器学报;2014年11期

3 王胜;谭家政;刘勇;邱芹军;;求解TSP问题的改进蚁群算法[J];武汉理工大学学报(信息与管理工程版);2013年03期

4 张华;;基于数据挖掘技术的电子商务旅游线路推荐系统[J];软件;2013年03期

5 葛浩;李龙澍;杨传健;;基于差别集的启发式属性约简算法[J];小型微型计算机系统;2013年02期

6 王沛栋;唐功友;杨熙鑫;李扬;;一种求解旅行商问题的改进蚁群算法[J];中国海洋大学学报(自然科学版);2013年01期

7 杨明;吕静;;一种基于C-Tree的属性约简增量式更新算法[J];控制与决策;2012年12期

8 刘大有;陈慧灵;齐红;杨博;;时空数据挖掘研究进展[J];计算机研究与发展;2013年02期

9 周华;张新;刘腾云;余发新;;高通量转录组测序的数据分析与基因发掘[J];江西科学;2012年05期

10 陈玉明;苗夺谦;;基于幂图的属性约简搜索式算法[J];计算机学报;2009年08期

相关硕士学位论文 前1条

1 徐子龙;代价敏感学习中属性约简与决策树分类若干关键问题研究[D];闽南师范大学;2014年



本文编号:1412327

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1412327.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户aa80d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com