基于非平稳割点的大数据分类样例选择
发布时间:2017-06-28 19:00
本文关键词:基于非平稳割点的大数据分类样例选择,由笔耕文化传播整理发布。
【摘要】:针对传统样例选择方法压缩大数据集时,存在计算复杂度较高、时间消耗较大的问题,文中提出基于非平稳割点的样例选择方法.依据在区间端点得到凸函数的极值这一基本性质,通过标记非平衡割点度量一个样例为端点的程度,然后选取端点程度较高的样例,从而避免样例之间距离的计算.该方法旨在不影响分类精度的前提下,达到压缩数据集、提高计算效率的目的.实验表明,文中方法对于类别不平衡度较高的数据集压缩效果明显,同时表现出较强的抗噪性.
【作者单位】: 河北大学数学与信息科学学院;河北大学管理学院;沧州师范学院计算机科学与工程学院;石家庄铁道大学数理系;
【关键词】: 大数据分类 样例选择 非平稳割点 决策树
【基金】:国家自然科学基金项目(No.713710630) 深圳市科技计划项目(No.JCYJ20150324140036825)资助~~
【分类号】:TP311.13
【正文快照】: compression for the large data set with high imbalance ratio and strong ability of anti-noise.随着互联网的飞速发展及云计算、物联网的快速兴起,每天产生的数据量正以前所未有的速度增长,人类已经进入大数据时代.海量数据的存储和分析面临诸多挑战,也正成为学术界研究
本文关键词:基于非平稳割点的大数据分类样例选择,由笔耕文化传播整理发布。
,本文编号:494892
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/494892.html