基于mRMR-RF特征选择和XGBoost模型的钓鱼网站检测
发布时间:2023-04-12 03:05
针对大量冗余数据带来的钓鱼网站检测准确率不够、误判率较高等问题,提出一种基于最大相关最小冗余(mRMR)和随机森林(RF)相结合的特征选择方法(mRMR-RF),并利用极端梯度提升(XGBoost)算法构建钓鱼网站检测模型。利用mRMR和RF算法分别对特征进行排序;综合两种特征排序得出最终的排序结果,并根据实验得出的最佳特征数选出XGBoost模型所需的最优特征子集;使用最优特征子集对XGBoost分类模型进行训练。实验结果表明,该方法相比其他分类方法可以提高钓鱼网站检测的准确率,具有实际意义。
【文章页数】:6 页
【文章目录】:
0 引 言
1 基础理论
1.1 互信息
1.2 最大相关最小冗余(mRMR)算法
1.3 随机森林
2 mRMR-RF特征选择方法在XGBoost中的应用
2.1 XGBoost算法
2.2 钓鱼网站检测模型
3 实 验
3.1 实验数据及说明
3.2 评价指标
3.3 实验结果及分析
(1) 实验一 利用mRMR-RF算法进行特征筛选。
(2) 实验二 利用XGBoost模型进行钓鱼网站检测。
4 结 语
本文编号:3790299
【文章页数】:6 页
【文章目录】:
0 引 言
1 基础理论
1.1 互信息
1.2 最大相关最小冗余(mRMR)算法
1.3 随机森林
2 mRMR-RF特征选择方法在XGBoost中的应用
2.1 XGBoost算法
2.2 钓鱼网站检测模型
3 实 验
3.1 实验数据及说明
3.2 评价指标
3.3 实验结果及分析
(1) 实验一 利用mRMR-RF算法进行特征筛选。
(2) 实验二 利用XGBoost模型进行钓鱼网站检测。
4 结 语
本文编号:3790299
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3790299.html