当前位置:主页 > 管理论文 > 领导决策论文 >

具有数量单调约束的多变量决策树分类算法

发布时间:2021-01-11 14:58
  决策树是一种以智能化方式进行实例分类的数据挖掘方法,已被广泛应用于人工智能等领域。其中单调分类算法可以解决属性和标签值具有单调序关系的分类问题。单调序关系是指在分类的过程中对属性和标签存在的一种单调约束,即当属性值增加时,类标签值应该不变或是相应地增加。这种分类问题在客户信用等级评估等领域广泛存在。然而以往的实验表明使用传统单调分类算法通常对噪声数据比较敏感并且对数据集的种类有一定的限制。为了解决上述问题,本文提出了一种以数据集的分布情况为依据的决策树分类算法。首先根据非同类数量比指标对原始数据集进行降噪,减少噪声样本对分类结果的影响,以此提高分类准确率。其次由于传统的单调分类方法仅适用于属性和标签都为有序值的数据集,且形成的单变量决策树无法综合考虑所有属性对分类任务的影响率,所以本文将数据集映射到多维空间中,并结合局部密度峰值聚类的方法形成具有数量单调约束的单调分类,从而演化成一棵多变量决策树,该方法不仅可消除对数据集种类的限制因素,还能够将所有属性的影响纳入分类过程。最后通过相对边界点与局部错分率之和两个方法确定最佳分裂超平面对数据进行分类。在实验方面,本文将提出的具有数量单调约束... 

【文章来源】:大连海事大学辽宁省 211工程院校

【文章页数】:59 页

【学位级别】:硕士

【部分图文】:

具有数量单调约束的多变量决策树分类算法


图2.1上近似和下近似??Fig.?2.1?Upper?approximation?and?lower?approximation??

支配关系,数量比,属性,样本


?大连海事大学专业学位硕士学位论文???例3.1如图3.1所示,给定一个样本集t/,假设这里A为3,随机选取一个样本。??样本x的三个最近邻样本用乃,知乃表示,且尺(;^)?=?0.7,/?(;c,y2)?=?0.55,??i?(x,_y3)?=?0.5。那么以?x?为圆心,半径/,?=?1?—=?0.3,/2?=?l-7?(;c,_y2)二?0.45,??/3=1-_/?(jc,j3)?=?0.5,可以确定三个圆小6,3。假设圆^2,?*3中包含的样本总数量分别??为7、10和12,其中与;c不同类的样本的总数量分别为6、9和10,那么样本x的非同??类数量比可计算如下:??,N?1?(A?Q?V??DC?ratio(x)=-?—H?+?—?=0.863??一?k?v?3^7?10?12J??由上述计算结果可知,样本X的非同类数量比为0.863。假设阈值2?=?0.8,样本X的??非同类数量比大于阈值,x确定为噪声样本,需要从数据集中将该样本移除。若阈值??义=?0.9,样本;c的非同类数量比小于阈值,则x不是噪声样本。??/?Class?1:??^?Class2:?A?^??參????參參▲?????i..:::::'?▲?▲?▲????U々"/?▲?A??V???*?J??图3.1非同类数量比降噪结果??Fig.?3.1?noise?reduction?results?of?different?class’s?ratio??3.2基于属性的模糊支配关系??在本文中,将数据集中的所有样本根据属性值映射到多维空间,那么如何在多维空??间中形成基于属性集的数量单调支配关系是本节讨论的重点。在文献

密度图,支配关系,聚类,峰值


?具有数量单调约束的多变量决策树分类算法???数的数量比求得。因为在数据集中,每一类样本的数量及分布是不平衡的,数量越大的??类,聚类之后的样本数量也会偏大。在这种情况下,再完全根据聚类样本数量对比是没??有意义的,所以本文通过数量比的形式来解决对比不平衡的问题。下面给出一个例子解??释如何计算数量比。??例3.2如图3.2所示,假设红色样本点是岣类的样本,蓝色样本点是4类的样本。??如果采用上述局部密度峰值聚类的方法对<?和?<?这两个类的样本分别进行聚类,聚类??结果如图所示。不难看出,c/,类的样本通过聚类之后的样本总数为13个,而<?的样本??总数为8个。那么名和之各自在属性峑集上数量比分别为13/23???0.57和8/17???0.47。??通过比较4和<的数量比的结果,可以形成这样的支配关系,在属性全集J下,弋类??中的样本可以支配(类中的样本。??.?.???▲??Class?one:?#??Class?Two:??图3.?2局部密度峰值聚类结果??Fig.?3.2?results?of?local?density?peak?clustering??3.3具有数量单调约束的支配关系??传统单调分类的支配关系是根据样本的M性值和标签值确定的,属性值大的样本支??配属性值小的样本,同理,标签值大的样本支配标签值小的样本。但是,要形成这样的??支配关系,就要进行数值对比,就要求数据集的属性和标签为有序值。这就极大程度限??制了单调分类可用数据集的范围,使得该分类算法有了局限性。因此,本文从数量的角??度形成支配关系,确定具有数量单调约束的支配关系集。??在本文中形成的具有数量单调约束的支配


本文编号:2970985

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/2970985.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4c380***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com