当前位置:主页 > 管理论文 > 移动网络论文 >

基于mRMR-RF特征选择和XGBoost模型的钓鱼网站检测

发布时间:2023-04-12 03:05
  针对大量冗余数据带来的钓鱼网站检测准确率不够、误判率较高等问题,提出一种基于最大相关最小冗余(mRMR)和随机森林(RF)相结合的特征选择方法(mRMR-RF),并利用极端梯度提升(XGBoost)算法构建钓鱼网站检测模型。利用mRMR和RF算法分别对特征进行排序;综合两种特征排序得出最终的排序结果,并根据实验得出的最佳特征数选出XGBoost模型所需的最优特征子集;使用最优特征子集对XGBoost分类模型进行训练。实验结果表明,该方法相比其他分类方法可以提高钓鱼网站检测的准确率,具有实际意义。

【文章页数】:6 页

【文章目录】:
0 引 言
1 基础理论
    1.1 互信息
    1.2 最大相关最小冗余(mRMR)算法
    1.3 随机森林
2 mRMR-RF特征选择方法在XGBoost中的应用
    2.1 XGBoost算法
    2.2 钓鱼网站检测模型
3 实 验
    3.1 实验数据及说明
    3.2 评价指标
    3.3 实验结果及分析
        (1) 实验一 利用mRMR-RF算法进行特征筛选。
        (2) 实验二 利用XGBoost模型进行钓鱼网站检测。
4 结 语



本文编号:3790299

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3790299.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8d42d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com