基于XGBoost的无线传播预测模型
发布时间:2021-01-29 07:19
传统的无线传播模型通常需要根据经验模型对传播场景进行划分。为了解决其在实际应用中不够精确的问题,通过在大量工程参数中设计并选用合适的特征参数作为模型输入,构建基于机器学习方法 XGBoost的无线传播预测模型,实现新环境下无线信号覆盖强度的准确预测。实验结果表明,该模型相较于基于长短记忆网络(LSTM)、线性回归方法,预测均方根误差最小,为9.101。该方法在预测精度和模型鲁棒性上都较好,对在不同场景下的信道传播路径损耗进行准确预测具有重要意义。
【文章来源】:软件导刊. 2020,19(08)
【文章页数】:5 页
【部分图文】:
五折交叉验证表1特征子集
软件导刊2020年在确定一棵树的过程中,可以选择不同参数,进行xgboost的正则化参数调优(lambda,alpha)。这些参数可以降低模型复杂度,从而提高模型表现,最后降低学习速率,确定理想参数。最终参数为树的深度、学习速率、迭代次数和损失函数(max_depth=6,learning_rate=0.01,n_estimators=160,objective=“reg:logistic”)。在新的小区环境下可以调用保存的模型直接预测RSRP值。图2本文算法流程2.4实验结果与分析本文数据集需要先自行处理和划分,然后将其应用于算法模型训练及预测。最终清洗得到38万条数据,对其进行可视化,结果如表4所示。可以看出,距离的标准差最大,距离值震荡最大。每个小区内的参数大多数都相同,不同小区数据集之间才会有很大差异,因此通过观察这些参数特征,直观上距离是主要影响因素。本文将在两个新的小区112501和115001预测RSRP,编号112501小区测试集有4548个样本,编号115001小区测试集4463个样本。表4各特征参数可视化与指标特征编号f0f1f2f3f4f5f6f7f8f9字段名称HeightDistanceRS_PowerCell_Building_HeightCell_AltitudeBuilding_HeightAltitudeAzimuthCell_Clutter_IndexClutter_Index均值(mean)23.43851.4511.26.3502.1116.86502.27174.126.687.31标准差(std)9.781270.262.4511.5210.3726.510.67103.213.133.48最大值(max)655000.7418.2985504805613601818最小值(min)003.2047400022本文基于XGBoost算法模型的特征提取如图3所
f8f9字段名称HeightDistanceRS_PowerCell_Building_HeightCell_AltitudeBuilding_HeightAltitudeAzimuthCell_Clutter_IndexClutter_Index均值(mean)23.43851.4511.26.3502.1116.86502.27174.126.687.31标准差(std)9.781270.262.4511.5210.3726.510.67103.213.133.48最大值(max)655000.7418.2985504805613601818最小值(min)003.2047400022本文基于XGBoost算法模型的特征提取如图3所示。图中f0~f9代表依次输入到表中的特征参数(如表4所示),条形图上的数据代表重要特征个数。由图3可以看出,距离(Distance)是影响RSRP预测的主要因素,这与当初预想的相同。此外,两个小区预测后表现的特征重要性先后顺序没变,可以看出本文模型较稳定,不会剧烈变化,由此可以推断该模型泛化能力和准确率均较好。为验证基于XGBoost的无线信号预测模型有更好的泛化性能和在预测结果上的优势,本文采用线性回归[19]和基于LSTM方法[20]进行对比。线性回归就是拟合一个线性函数,传统的线性回归会受因子多样性和不确定性影响,大量数据下表现不佳。而LSTM可以模拟数据之间的依赖关系,本文特征之间没有特别的时序关系,故效果会存在局限。本文在清洗出的相同数据集上进行训练测试,在表4中对比了LSTM、线性回归、本文使用的XGBoost模型3种方法的RMSE。结果表明,本文使用的XGBoost在不同交叉验证迭代上的训练集的RMSE均最优。本文XGBoost在所有网络结构中表现最好,因为本文网络结构能够更好地决策出比较重要的特征
本文编号:3006504
【文章来源】:软件导刊. 2020,19(08)
【文章页数】:5 页
【部分图文】:
五折交叉验证表1特征子集
软件导刊2020年在确定一棵树的过程中,可以选择不同参数,进行xgboost的正则化参数调优(lambda,alpha)。这些参数可以降低模型复杂度,从而提高模型表现,最后降低学习速率,确定理想参数。最终参数为树的深度、学习速率、迭代次数和损失函数(max_depth=6,learning_rate=0.01,n_estimators=160,objective=“reg:logistic”)。在新的小区环境下可以调用保存的模型直接预测RSRP值。图2本文算法流程2.4实验结果与分析本文数据集需要先自行处理和划分,然后将其应用于算法模型训练及预测。最终清洗得到38万条数据,对其进行可视化,结果如表4所示。可以看出,距离的标准差最大,距离值震荡最大。每个小区内的参数大多数都相同,不同小区数据集之间才会有很大差异,因此通过观察这些参数特征,直观上距离是主要影响因素。本文将在两个新的小区112501和115001预测RSRP,编号112501小区测试集有4548个样本,编号115001小区测试集4463个样本。表4各特征参数可视化与指标特征编号f0f1f2f3f4f5f6f7f8f9字段名称HeightDistanceRS_PowerCell_Building_HeightCell_AltitudeBuilding_HeightAltitudeAzimuthCell_Clutter_IndexClutter_Index均值(mean)23.43851.4511.26.3502.1116.86502.27174.126.687.31标准差(std)9.781270.262.4511.5210.3726.510.67103.213.133.48最大值(max)655000.7418.2985504805613601818最小值(min)003.2047400022本文基于XGBoost算法模型的特征提取如图3所
f8f9字段名称HeightDistanceRS_PowerCell_Building_HeightCell_AltitudeBuilding_HeightAltitudeAzimuthCell_Clutter_IndexClutter_Index均值(mean)23.43851.4511.26.3502.1116.86502.27174.126.687.31标准差(std)9.781270.262.4511.5210.3726.510.67103.213.133.48最大值(max)655000.7418.2985504805613601818最小值(min)003.2047400022本文基于XGBoost算法模型的特征提取如图3所示。图中f0~f9代表依次输入到表中的特征参数(如表4所示),条形图上的数据代表重要特征个数。由图3可以看出,距离(Distance)是影响RSRP预测的主要因素,这与当初预想的相同。此外,两个小区预测后表现的特征重要性先后顺序没变,可以看出本文模型较稳定,不会剧烈变化,由此可以推断该模型泛化能力和准确率均较好。为验证基于XGBoost的无线信号预测模型有更好的泛化性能和在预测结果上的优势,本文采用线性回归[19]和基于LSTM方法[20]进行对比。线性回归就是拟合一个线性函数,传统的线性回归会受因子多样性和不确定性影响,大量数据下表现不佳。而LSTM可以模拟数据之间的依赖关系,本文特征之间没有特别的时序关系,故效果会存在局限。本文在清洗出的相同数据集上进行训练测试,在表4中对比了LSTM、线性回归、本文使用的XGBoost模型3种方法的RMSE。结果表明,本文使用的XGBoost在不同交叉验证迭代上的训练集的RMSE均最优。本文XGBoost在所有网络结构中表现最好,因为本文网络结构能够更好地决策出比较重要的特征
本文编号:3006504
本文链接:https://www.wllwen.com/kejilunwen/wltx/3006504.html