基于XGBoost算法的地下综合管廊安全状况评估方法
发布时间:2021-09-19 15:45
针对地下综合管廊安全状况复杂、风险评估困难的问题,提出了一种基于XGBoost算法的安全状况评估方法,利用地下综合管廊数据构建模型。首先,对采集到的地下综合管廊数据进行异常值检测、缺失值处理,用描述性统计与特征组合的方法构造统计特征以及交叉特征;其次,使用逻辑回归(LR)、随机森林(RF)、最近邻分类器(NC)、支持向量机(SVM)算法、XGBoost算法构建安全评估模型;最后,使用贝叶斯算法对模型参数进行优化。实验结果表明,优化后的XGBoost相较于LR、RF、NC、SVM构建的模型在地下综合管廊的安全评估上具有更高的准确率,最高可达0.920 9。
【文章来源】:计算机应用. 2020,40(S1)北大核心CSCD
【文章页数】:5 页
【部分图文】:
模型构建流程
地下综合管廊中数据在采集过程中会存在数据缺失,本文首先对数据集的缺失值进行统计,根据每个特征的缺失值构造出is_null与isnull_Seg这两个特征,训练集缺失值分布情况如图2所示,测试集的数据缺失值分布如图3所示。可以看出,训练集测试集的数据缺失值分布基本一致,因此这两部分数据可以使用同一种缺失值处理策略。数据集中G_HS1与G_HS2这两个特征缺失值比例明显大于80%,这两个特征会带入较大的噪声,对结果造成不良影响,因此直接将其进行剔除。其中G_CH1、C_HS1、C_HS2、G_H1这些特征的缺失值比例在30%~80%,可能是某一种属性值的缺失,因此使用-1填充;其他的特征缺失值比例均在30%以下,说明在数据采集的过程中出现了数据丢失,本文使用均值填充。经过缺失值预处理之后的训练集大小为(6 700,32),测试集大小为(3 300,32)。图3 测试集数据缺失值分布情况
测试集数据缺失值分布情况
【参考文献】:
期刊论文
[1]基于梯度分布调节策略的Xgboost算法优化[J]. 李浩,朱焱. 计算机应用. 2020(06)
[2]地下综合管廊全生命周期安全评估技术[J]. 商冬凡,卢明,苗雷强,赵一凡. 建筑结构. 2019(S2)
[3]综合管廊全生命周期安全风险辨识体系[J]. 强万明,商冬凡,卢明,赵一凡. 土木工程与管理学报. 2019(05)
[4]基于深度LightGBM集成学习模型的谷歌商店顾客购买力预测[J]. 叶志宇,冯爱民,高航. 计算机应用. 2019(12)
[5]地下综合管廊全寿命周期风险评估与分析[J]. 张勇,张然然. 西安建筑科技大学学报(自然科学版). 2019(02)
[6]利用先验正态分布的贝叶斯网络参数学习[J]. 柴慧敏,赵昀瑶,方敏. 系统工程与电子技术. 2018(10)
[7]综合管廊多灾种耦合致灾风险评价方法[J]. 王述红,张泽,侯文帅,王斐笠. 东北大学学报(自然科学版). 2018(06)
[8]贝叶斯优化方法和应用综述[J]. 崔佳旭,杨博. 软件学报. 2018(10)
[9]基于数据融合的高速公路交通状况检测[J]. 崔艳玲,金蓓弘,张扶桑. 计算机学报. 2017(08)
硕士论文
[1]城市地下综合管廊运维安全风险管理研究[D]. 李宏远.北京建筑大学 2019
[2]综合管廊环境安全性监测多源信息融合应用研究[D]. 赵婷.西安建筑科技大学 2018
[3]Logistic回归及其相关方法在个人信用评分中的应用[D]. 张婷婷.太原理工大学 2017
[4]基于连续贝叶斯网络的火灾预警研究[D]. 吕灿.广东工业大学 2016
本文编号:3401891
【文章来源】:计算机应用. 2020,40(S1)北大核心CSCD
【文章页数】:5 页
【部分图文】:
模型构建流程
地下综合管廊中数据在采集过程中会存在数据缺失,本文首先对数据集的缺失值进行统计,根据每个特征的缺失值构造出is_null与isnull_Seg这两个特征,训练集缺失值分布情况如图2所示,测试集的数据缺失值分布如图3所示。可以看出,训练集测试集的数据缺失值分布基本一致,因此这两部分数据可以使用同一种缺失值处理策略。数据集中G_HS1与G_HS2这两个特征缺失值比例明显大于80%,这两个特征会带入较大的噪声,对结果造成不良影响,因此直接将其进行剔除。其中G_CH1、C_HS1、C_HS2、G_H1这些特征的缺失值比例在30%~80%,可能是某一种属性值的缺失,因此使用-1填充;其他的特征缺失值比例均在30%以下,说明在数据采集的过程中出现了数据丢失,本文使用均值填充。经过缺失值预处理之后的训练集大小为(6 700,32),测试集大小为(3 300,32)。图3 测试集数据缺失值分布情况
测试集数据缺失值分布情况
【参考文献】:
期刊论文
[1]基于梯度分布调节策略的Xgboost算法优化[J]. 李浩,朱焱. 计算机应用. 2020(06)
[2]地下综合管廊全生命周期安全评估技术[J]. 商冬凡,卢明,苗雷强,赵一凡. 建筑结构. 2019(S2)
[3]综合管廊全生命周期安全风险辨识体系[J]. 强万明,商冬凡,卢明,赵一凡. 土木工程与管理学报. 2019(05)
[4]基于深度LightGBM集成学习模型的谷歌商店顾客购买力预测[J]. 叶志宇,冯爱民,高航. 计算机应用. 2019(12)
[5]地下综合管廊全寿命周期风险评估与分析[J]. 张勇,张然然. 西安建筑科技大学学报(自然科学版). 2019(02)
[6]利用先验正态分布的贝叶斯网络参数学习[J]. 柴慧敏,赵昀瑶,方敏. 系统工程与电子技术. 2018(10)
[7]综合管廊多灾种耦合致灾风险评价方法[J]. 王述红,张泽,侯文帅,王斐笠. 东北大学学报(自然科学版). 2018(06)
[8]贝叶斯优化方法和应用综述[J]. 崔佳旭,杨博. 软件学报. 2018(10)
[9]基于数据融合的高速公路交通状况检测[J]. 崔艳玲,金蓓弘,张扶桑. 计算机学报. 2017(08)
硕士论文
[1]城市地下综合管廊运维安全风险管理研究[D]. 李宏远.北京建筑大学 2019
[2]综合管廊环境安全性监测多源信息融合应用研究[D]. 赵婷.西安建筑科技大学 2018
[3]Logistic回归及其相关方法在个人信用评分中的应用[D]. 张婷婷.太原理工大学 2017
[4]基于连续贝叶斯网络的火灾预警研究[D]. 吕灿.广东工业大学 2016
本文编号:3401891
本文链接:https://www.wllwen.com/guanlilunwen/chengjian/3401891.html