基于改进多核学习的多传感数据分类方法研究
发布时间:2021-03-10 08:21
物联网(internet of things,IoT)技术中结合多个数据源互补信息提高数据分类准确率的研究受到了越来越多的关注。针对物联网无线传感器采集到数据的多源异构特性,给出了一种基于改进多核学习支持向量机(improved multi-kernel learning-support vector machine,IMKL-SVM)的IoT数据分类方法。传统的多核学习方法中核函数主要是采用经验法选取核函数类型及参数,本文改进方法在确定核函数类型及参数时分为两步:首先采用交叉验证方法初步确定核函数类型及参数;其次在第一步结果中利用支持向量机(SVM)同时训练样本和优化多核函数的类型及参数。实验中针对温度、湿度、光照、大气压力等4种数据设计了两组数据——第一组数据被标记为上午、中下午、傍晚、夜间4类,第二组数据被标记为白天、傍晚、夜间3类,比较了本文的IMKL-SVM方法、单核SVM方法及传统MKL-SVM方法在两组数据集上的分类准确率。此外,针对UCI公开数据集AReM进行了分类实验,实验结果表明IMKL-SVM方法针对具有多源异构特性的物联网数据实现了较高的分类准确率。
【文章来源】:北京化工大学学报(自然科学版). 2020,47(03)北大核心
【文章页数】:7 页
【部分图文】:
传统多核学习框图
图5 第二组数据的可视化混淆矩阵观察图5混淆矩阵可发现,有近一多半(超过50%)的夜间被误分类为傍晚,且有一定数量的傍晚被误分类为夜间与白天。这与其每个类别之间均存在少量过渡样本密不可分,即过渡样本的特征与其两端类别的特征都有相似的部分;其次,这些误分类与其对应类别的样本数量较小也有直接关系。反观类别白天均被准确分类,这是由于其样本数量庞大且特征明显区别于其他两类。
表4 AReM数据集上的性能度量比较Table 4 Comparison of performance metrics using the AReM dataset 方法 分类准确率/% AUC micro macro 单核SVM(平均) 73.47 0.95 0.95 多核学习SVM 70.71 0.94 0.93 本文改进方法 77.20 0.97 0.97图8 AReM数据集的ROC曲线
【参考文献】:
期刊论文
[1]实现影响因素多源异构融合的短期负荷预测支持向量机算法[J]. 吴倩红,高军,侯广松,韩蓓,汪可友,李国杰. 电力系统自动化. 2016(15)
[2]物联网概念和演进路径[J]. 孔晓波. 电信工程技术与标准化. 2009(12)
本文编号:3074371
【文章来源】:北京化工大学学报(自然科学版). 2020,47(03)北大核心
【文章页数】:7 页
【部分图文】:
传统多核学习框图
图5 第二组数据的可视化混淆矩阵观察图5混淆矩阵可发现,有近一多半(超过50%)的夜间被误分类为傍晚,且有一定数量的傍晚被误分类为夜间与白天。这与其每个类别之间均存在少量过渡样本密不可分,即过渡样本的特征与其两端类别的特征都有相似的部分;其次,这些误分类与其对应类别的样本数量较小也有直接关系。反观类别白天均被准确分类,这是由于其样本数量庞大且特征明显区别于其他两类。
表4 AReM数据集上的性能度量比较Table 4 Comparison of performance metrics using the AReM dataset 方法 分类准确率/% AUC micro macro 单核SVM(平均) 73.47 0.95 0.95 多核学习SVM 70.71 0.94 0.93 本文改进方法 77.20 0.97 0.97图8 AReM数据集的ROC曲线
【参考文献】:
期刊论文
[1]实现影响因素多源异构融合的短期负荷预测支持向量机算法[J]. 吴倩红,高军,侯广松,韩蓓,汪可友,李国杰. 电力系统自动化. 2016(15)
[2]物联网概念和演进路径[J]. 孔晓波. 电信工程技术与标准化. 2009(12)
本文编号:3074371
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3074371.html