面向主动学习的模糊核聚类采样算法
本文选题:高斯核函数 切入点:聚类分析 出处:《计算机应用研究》2017年12期
【摘要】:针对主动学习中构造初始分类器难以选取代表性样本的问题,提出一种模糊核聚类采样算法。该算法首先通过聚类分析技术将样本集划分,然后分别在类簇中心和类簇边界区域选取样本进行标注,最后依此构造初始分类器。在该算法中,通过高斯核函数将原始样本空间中的点非线性变换到高维特征空间,以达到线性可聚的目的,并引入了一种基于局部密度的初始聚类中心选择方法,从而改善聚类效果。为了提高采样质量,结合划分后各类簇的样本个数设计了一种采样比例分配策略;同时,在采样结束阶段设计了一种后补采样策略,以确保采样个数达标。实验结果分析表明,所提算法可以有效地减少构造初始分类器所需的人工标注负担,并取得了较高的分类正确率。
[Abstract]:In order to solve the problem that it is difficult to select representative samples by constructing initial classifiers in active learning, a fuzzy kernel clustering sampling algorithm is proposed. Then the samples are selected from the cluster center and the cluster boundary area to annotate, and then the initial classifier is constructed. In this algorithm, the point nonlinearity in the original sample space is transformed into the high dimensional feature space by Gao Si kernel function. In order to achieve linear convergence, an initial clustering center selection method based on local density is introduced to improve the clustering effect. A sampling proportional allocation strategy is designed in combination with the sample number of each cluster, and a supplementary sampling strategy is designed at the end of the sampling stage to ensure that the sampling number is up to the standard. The experimental results show that, The proposed algorithm can effectively reduce the manual labeling burden needed to construct the initial classifier and obtain a higher classification accuracy.
【作者单位】: 大连海事大学交通运输管理学院;
【基金】:国家自然科学基金资助项目(71271034) 辽宁省自然科学基金资助项目(2014025015) 青年骨干教师基金资助项目(3132016045)
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 章立亮,周琼;光栅图形反走样的加权区域采样算法[J];宁德师专学报(自然科学版);2002年01期
2 曹鹏;李博;栗伟;赵大哲;;基于概率分布估计的混合采样算法[J];控制与决策;2014年05期
3 余纯;张太荣;;基于硬件实现的粒子滤波重采样算法研究[J];自动化技术与应用;2013年02期
4 张秀丽,李萍,陆光华;高精度软件同步采样算法[J];电力系统及其自动化学报;2005年04期
5 赵丰;汤磊;张武;赵宗贵;;一种高实时性粒子滤波重采样算法[J];系统仿真学报;2009年18期
6 冯驰;赵娜;王萌;;一种改进残差重采样算法的研究[J];哈尔滨工程大学学报;2010年01期
7 李蕴奇;李小明;何杰;钟鸣;;关于吉布斯采样算法识别MOTIF的研究[J];才智;2010年31期
8 郭建林;李爱玲;;一种大尺度Gauss模糊的快速采样算法[J];中国科学:信息科学;2011年10期
9 黄保虎;刘冉;张华;张昭;;基于不同重采样算法的RFID指纹定位[J];计算机应用;2013年02期
10 冯驰;王萌;汲清波;;粒子滤波器重采样算法的分析与比较[J];系统仿真学报;2009年04期
相关硕士学位论文 前6条
1 王柯翔;基于LWE问题的采样算法及应用研究[D];北京交通大学;2017年
2 赵莹;支持向量机中高斯核函数的研究[D];华东师范大学;2007年
3 邓俊;滤波重要性采样算法的研究与实现[D];天津大学;2007年
4 王朝;基于ARMS的并行采样算法的设计与实现[D];天津大学;2008年
5 崔承勋;基于GH-distance的自适应性采样算法[D];天津大学;2009年
6 周宇飞;基于偶对约束的半监督模糊聚类算法研究[D];河北大学;2014年
,本文编号:1663580
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1663580.html