基于K最近邻的代价敏感三支决策边界域处理模型
本文关键词:基于K最近邻的代价敏感三支决策边界域处理模型 出处:《数码设计》2016年02期 论文类型:期刊论文
更多相关文章: 三支决策 覆盖算法 K最近邻 代价敏感 边界域处理
【摘要】:三支决策理论是Yao在研究粗糙集和决策粗糙集时提出的,其主要目的是为粗糙集三个域提供合理的语义解释,即正域POS(X)、负域NEG(X)和边界域BND(X)。目前,如何有效地处理边界域已成为三支决策理论研究的热点问题。例如,基于CCA的三支决策模型提出了三种方法对边界域样本进行处理,分别是距中心最近原则、距边界最近原则和万有引力原则,但是这三种方法都没有考虑到分类问题的代价敏感性。本文在基于CCA的三支决策模型的基础上,针对边界域的处理问题,提出了一种基于K最近邻的代价敏感三支决策边界域处理模型。该模型首先根据样本分布特征寻找最优K值,然后根据与样本边界距离最小的K个覆盖的类别和代价敏感损失函数对边界域样本进行划分。实验结果表明,与基于CCA的三支决策模型中的处理方法相比,本文模型在最优K值下的分类结果的高代价样本的误分类数显著减少,分类损失更小,而且总分类错误率较低。
[Abstract]:The three-branch decision theory is put forward by Yao when studying rough set and decision rough set. Its main purpose is to provide reasonable semantic explanation for three domains of rough set, that is, positive domain POSX). At present, how to deal with the boundary domain effectively has become a hot issue in the theory of three branches of decision making. For example, how to deal with the boundary domain effectively has become a hot issue in the theory of decision making. Based on the three-branch decision model of CCA, three methods are proposed to deal with the samples in the boundary domain, namely, the nearest distance principle, the nearest distance boundary principle and the universal gravitation principle. However, these three methods do not take into account the cost sensitivity of classification problems. Based on the three-branch decision model based on CCA, this paper deals with the problem of boundary domain. A cost sensitive three-branch decision making boundary domain processing model based on K-nearest neighbor is proposed. Firstly, the optimal value of K is found according to the characteristics of sample distribution. Then, the samples of boundary domain are divided according to the classes and cost sensitive loss functions of K covers with the smallest boundary distance. The experimental results show that the proposed method is compared with that in the three-branch decision model based on CCA. Under the optimal K value, the classification error number of high-cost samples is significantly reduced, the classification loss is smaller, and the total classification error rate is lower.
【作者单位】: 安徽大学计算机科学与技术学院;安徽大学计算智能与信号处理教育部重点实验室;
【基金】:国家自然科学基金项目(61673020、61602003)资助
【分类号】:TP18
【正文快照】: 引言 Yao在粗糙集和决策粗糙集研究中提出了三支决 策理论,该理论将传统的正域、负域的二支决策语义拓展为正域、边界域和负域的三支决策语义[1-2]。目前的三支决策理论的研究主要是基于粗糙集的三支决策理论,而其中最具有代表性的是决策粗糙集理论模型 (Decision Theoreti
【相似文献】
相关期刊论文 前10条
1 张桂榕;;反向最近邻查询研究综述[J];电脑知识与技术;2011年28期
2 周屹;;不确定对象的反向最近邻查询研究[J];黑龙江工程学院学报(自然科学版);2012年04期
3 刘永山,薄树奎,张强,郝忠孝;多对象的最近邻查询[J];计算机工程;2004年11期
4 郝忠孝;刘永山;;空间对象的反最近邻查询[J];计算机科学;2005年11期
5 王淼;郝忠孝;;不确定性对象的反向最近邻查询[J];计算机工程;2010年10期
6 张旭;何向南;金澈清;周傲英;;面向不确定图的k最近邻查询[J];计算机研究与发展;2011年10期
7 杨泽雪;郝忠孝;;空间数据库中的障碍反向最近邻查询[J];计算机工程与应用;2011年34期
8 王丹丹;郝忠孝;;道路网络中的多类型K最近邻查询[J];计算机工程与应用;2012年03期
9 邓瑾;周梅;;基于R树及其变种的最近邻查询研究[J];现代计算机;2013年09期
10 朱婧;;平面中点对一般多边形的最近邻查询研究[J];科技通报;2014年01期
相关会议论文 前10条
1 张晓峰;王丽珍;肖清;赵丽红;;基于概念划分的连续最近邻查询研究[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
2 管猛;张剡;柏文阳;;基于地表的连续可见最近邻查询方法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
3 陈璐;高云君;柳晴;陈刚;;受限相互最近邻查询处理[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
4 盛梅红;沙朝锋;宫学庆;嵇晓;周傲英;;道路网络环境中的多对象最近邻查询[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
5 刘月清;章勇;;一种改进的动态最近邻聚类算法[A];全国自动化新技术学术交流会会议论文集(一)[C];2005年
6 李传文;谷峪;李芳芳;于戈;;一种障碍空间中不确定对象的连续最近邻查询方法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
7 刘星毅;;基于欧式距离的最近邻改进算法[A];广西计算机学会2010年学术年会论文集[C];2010年
8 刘先康;梁菁;任杰;蒋光庆;;修正最近邻模糊分类算法在舰船目标识别中的应用[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
9 刘俊岭;孙焕良;;多维度量空间中发现相互kNN(英文)[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
10 余小高;;P2P环境中k最近邻搜索算法研究[A];2009年全国开放式分布与并行计算机学术会议论文集(下册)[C];2009年
相关博士学位论文 前8条
1 魏本昌;基于内容的大规模图像检索技术研究[D];华中科技大学;2015年
2 杨泽雪;空间连接及最近邻变体查询研究[D];哈尔滨理工大学;2014年
3 孙冬璞;时空数据库多类型最近邻查询的研究[D];哈尔滨理工大学;2010年
4 王建峰;基于哈希的最近邻查找[D];中国科学技术大学;2015年
5 张得天;时间依赖路网高效k最近邻查询混搭机制的研究[D];中国科学技术大学;2014年
6 杜钦生;高维空间的K最近邻查询及连接问题研究[D];吉林大学;2015年
7 张军旗;支持最近邻查找的高维空间索引[D];复旦大学;2007年
8 李艳红;路网中移动对象最近邻及反向最近邻查询处理研究[D];华中科技大学;2011年
相关硕士学位论文 前10条
1 杨根茂;基于哈希加速的近似最近邻检索算法研究[D];浙江大学;2015年
2 原s,
本文编号:1418352
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1418352.html