面向物联网隐私数据分析的分布式弹性网络回归学习算法
发布时间:2021-10-11 03:01
为了解决基于集中式算法的传统物联网数据分析处理方式易引发网络带宽压力过大、延迟过高以及数据隐私安全等问题,该文针对弹性网络回归这一典型的线性回归模型,提出一种面向物联网(IoT)的分布式学习算法。该算法基于交替方向乘子法(ADMM),将弹性网络回归目标优化问题分解为多个能够由物联网节点利用本地数据进行独立求解的子问题。不同于传统的集中式算法,该算法并不要求物联网节点将隐私数据上传至服务器进行训练,而仅仅传递本地训练的中间参数,再由服务器进行简单整合,以这样的协作方式经过多轮迭代获得最终结果。基于两个典型数据集的实验结果表明:该算法能够在几十轮迭代内快速收敛到最优解。相比于由单个节点独立训练模型的本地化算法,该算法提高了模型结果的有效性和准确性;相比于集中式算法,该算法在确保计算准确性和可扩展性的同时,可有效地保护个体隐私数据的安全性。
【文章来源】:电子与信息学报. 2020,42(10)北大核心EICSCD
【文章页数】:9 页
【部分图文】:
图1分布式弹性网络回归学习算法计算流程
N,ρ,u1,u2ρρu1u2u1RMSE值作为算法性能的评价指标,在保证其他参数固定不变的条件下,分别评估参数对算法性能的影响。其中参数N对算法性能的影响如图6所示,可以发现当N取不同值时,算法均能收敛,而且N值越小时,算法的收敛速度越快,但最终均能得到相同的目标函数值和RMSE值,表明算法具备较好的可扩展性。参数对算法性能的影响如图7所示,可以发现值较小时,算法可以更快地收敛,目标函数值和RMSE值较大。参数和对算法性能的影响分别如图8和图9所示,说明对算法的收敛速度影响较小,但对目标函数值和RMSEu1u1u2u2u2值影响较大,值越小,目标函数值和RMSE值就越小;与相似,值越小,目标函数值和RMSE值也越小,不同的是,对算法的收敛速度影响较大,值越大,算法的收敛速度越快。4.2.3与其它方法性能比较R2aN=1相比于分布式算法,本地化算法的性能很大程度上与单个物联网节点处理的本地数据集规模大小相关,因此将数据集随机均匀地划分为N个训练子集,即由N个节点独立训练,并以和RMSE值作为评价指标,比较在N的不同取值下两种算法的性能。值得注意的是,当时本地化算法等同于集中式算法。R2a图10(a)、图10(b)分别表示不同N值下两种算法的RMSE值和值比较。由图10(a)可以发现,图2目标函数值随迭代次数变化图3原始残差和对偶残差随迭代次数变化图4RMSE值随迭代次数变化R2a图5调整复相关系数值随迭代次数变化图6参数N对算法性能的影响2408电子与信息学报第42卷
图10分布式算法与本地化算法之间的性能比较图7参数ρ对算法性能的影响图8参数u1对算法性能的影响图9参数u2对算法性能的影响第10期方维维等:面向物联网隐私数据分析的分布式弹性网络回归学习算法2409
【参考文献】:
期刊论文
[1]车联网中基于移动边缘计算的内容感知分类卸载算法研究[J]. 赵海涛,朱银阳,丁仪,朱洪波. 电子与信息学报. 2020(01)
[2]边缘计算:现状与展望[J]. 施巍松,张星洲,王一帆,张庆阳. 计算机研究与发展. 2019(01)
[3]面向智能监控摄像头的监控视频大数据分析处理[J]. 邵振峰,蔡家骏,王中元,马照亭. 电子与信息学报. 2017(05)
本文编号:3429657
【文章来源】:电子与信息学报. 2020,42(10)北大核心EICSCD
【文章页数】:9 页
【部分图文】:
图1分布式弹性网络回归学习算法计算流程
N,ρ,u1,u2ρρu1u2u1RMSE值作为算法性能的评价指标,在保证其他参数固定不变的条件下,分别评估参数对算法性能的影响。其中参数N对算法性能的影响如图6所示,可以发现当N取不同值时,算法均能收敛,而且N值越小时,算法的收敛速度越快,但最终均能得到相同的目标函数值和RMSE值,表明算法具备较好的可扩展性。参数对算法性能的影响如图7所示,可以发现值较小时,算法可以更快地收敛,目标函数值和RMSE值较大。参数和对算法性能的影响分别如图8和图9所示,说明对算法的收敛速度影响较小,但对目标函数值和RMSEu1u1u2u2u2值影响较大,值越小,目标函数值和RMSE值就越小;与相似,值越小,目标函数值和RMSE值也越小,不同的是,对算法的收敛速度影响较大,值越大,算法的收敛速度越快。4.2.3与其它方法性能比较R2aN=1相比于分布式算法,本地化算法的性能很大程度上与单个物联网节点处理的本地数据集规模大小相关,因此将数据集随机均匀地划分为N个训练子集,即由N个节点独立训练,并以和RMSE值作为评价指标,比较在N的不同取值下两种算法的性能。值得注意的是,当时本地化算法等同于集中式算法。R2a图10(a)、图10(b)分别表示不同N值下两种算法的RMSE值和值比较。由图10(a)可以发现,图2目标函数值随迭代次数变化图3原始残差和对偶残差随迭代次数变化图4RMSE值随迭代次数变化R2a图5调整复相关系数值随迭代次数变化图6参数N对算法性能的影响2408电子与信息学报第42卷
图10分布式算法与本地化算法之间的性能比较图7参数ρ对算法性能的影响图8参数u1对算法性能的影响图9参数u2对算法性能的影响第10期方维维等:面向物联网隐私数据分析的分布式弹性网络回归学习算法2409
【参考文献】:
期刊论文
[1]车联网中基于移动边缘计算的内容感知分类卸载算法研究[J]. 赵海涛,朱银阳,丁仪,朱洪波. 电子与信息学报. 2020(01)
[2]边缘计算:现状与展望[J]. 施巍松,张星洲,王一帆,张庆阳. 计算机研究与发展. 2019(01)
[3]面向智能监控摄像头的监控视频大数据分析处理[J]. 邵振峰,蔡家骏,王中元,马照亭. 电子与信息学报. 2017(05)
本文编号:3429657
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3429657.html