融合多源网络评估数据及URL特征的钓鱼网站识别技术研究
本文选题:数据挖掘 切入点:钓鱼网站识别 出处:《数据分析与知识发现》2017年06期
【摘要】:【目的】充分利用多源网络评估数据和URL异常特征数据,研究提高钓鱼网站识别准确性的可行性方案。【方法】采用8种机器学习技术,对比研究网络评估数据与传统的URL异常特征数据在钓鱼网站识别中的性能,并融合两类数据研究进一步提高钓鱼网站识别准确性的可行性方案。【结果】在钓鱼网站识别中,相比于传统的URL异常特征,利用网络评估数据可以取得更好的识别效果。融合两类数据对于提高识别准确性有一定帮助。【局限】未考虑钓鱼网站与正常网站的数量存在严重的不均衡问题。【结论】充分利用多源网络评估数据和URL异常特征数据识别钓鱼网站的方法是比较合理和有效的,对后续相关研究具有一定的借鉴意义。
[Abstract]:[objective] to make full use of multi-source network evaluation data and URL abnormal feature data to study the feasible scheme to improve the accuracy of phishing site identification. [methods] eight machine learning techniques were used.The performance of network evaluation data and traditional URL anomaly feature data in phishing site identification is compared, and the feasibility of further improving the accuracy of phishing site identification is studied by combining the two kinds of data. [results] in phishing site identification,Compared with the traditional URL anomaly feature, the network evaluation data can obtain better recognition effect.Fusion of two types of data is helpful to improve the accuracy of identification. [limitation] there is a serious imbalance between the number of phishing sites and normal websites. [conclusion] making full use of multi-source networks to evaluate data and URL heterogeneity.The method of identifying fishing sites with constant feature data is reasonable and effective.It has certain reference significance to the follow-up related research.
【作者单位】: 武汉大学信息管理学院;武汉大学电子商务研究与发展中心;
【基金】:国家自然科学基金面上项目“创新2.0超网络中知识流动和群集交互的协同研究”(项目编号:71373194) 国家自然科学基金青年基金项目“基于集成学习的区间型电力负荷预测技术研究”(项目编号:71601147)的研究成果之一
【分类号】:TP393.092
【相似文献】
相关期刊论文 前10条
1 ;就这样根除“钓鱼网站”![J];计算机与网络;2006年06期
2 ;“假苹果”、“假赌博”钓鱼网站肆虐[J];电脑爱好者;2010年23期
3 程科;;新型电信诈骗:“钓鱼网站”初探[J];中国公共安全(学术版);2011年03期
4 周耀鹏;;浅谈钓鱼网站的技术原理及防护[J];黑龙江科技信息;2011年29期
5 ;四招轻松识破假冒钓鱼网站[J];计算机与网络;2011年02期
6 李倩;;钓鱼网站技术与防护[J];硅谷;2012年01期
7 ;今年上半年我国共处理13923个钓鱼网站[J];金融科技时代;2012年08期
8 ;识破钓鱼网站避免上当的几个方法[J];计算机与网络;2013年01期
9 ;警惕无孔不入的钓鱼网站[J];微电脑世界;2013年07期
10 王栋贵;;使用网银:要防钓鱼网站盗号偷钱[J];新天地;2014年01期
相关会议论文 前1条
1 李晨;陈星霖;;一种多阶段控制方法在对抗钓鱼攻击中的应用[A];第26次全国计算机安全学术交流会论文集[C];2011年
相关重要报纸文章 前10条
1 本报记者 陈邓新;钓鱼网站量产的秘密[N];电脑报;2010年
2 本报记者 杜峰;钓鱼网站借“月饼”偷网银 谁为网购添加安全锁?[N];通信信息报;2011年
3 雷文君;钓鱼网站手段花样不断翻新[N];人民邮电;2011年
4 本报记者 张磊;钓鱼网站 年终兴风作浪[N];中国消费者报;2009年
5 本报记者 叶菁;“网银升级”成诈骗新伎俩 新增钓鱼网站唱双簧难辨别[N];通信信息报;2013年
6 北京商报记者 张绪旺;防范钓鱼网站不能单靠安全软件[N];北京商报;2013年
7 雷文;“可信网站”多重防范抵制节日钓鱼网站肆虐[N];人民邮电;2014年
8 雷文;“可信网站”标识阻止钓鱼网站肆虐[N];人民邮电;2013年
9 记者 郑申;网民如何放心网购?[N];金融时报;2012年
10 本报记者 张倩;钓鱼网站成上网首要公害 筑安全网需斩断黑色利益链[N];通信信息报;2013年
相关硕士学位论文 前10条
1 程思宇;客户端钓鱼网站智能检测系统的设计与实现[D];华北电力大学;2015年
2 殷兰芳;融合网页噪声和n-gram的钓鱼网站检测研究[D];中南林业科技大学;2015年
3 赵加林;基于K-Means和SVM的钓鱼网站识别的研究[D];西南交通大学;2016年
4 傅成乐;基于模糊关联分类的钓鱼网站检测方法研究[D];东北师范大学;2016年
5 刘昂;基于文本匹配的钓鱼网站检测系统的设计和实现[D];北京邮电大学;2013年
6 初一;基于Web页面特征的反钓鱼系统的设计与实现[D];北京邮电大学;2014年
7 马亚燕;基于专家知识库的反钓鱼系统的设计与实现[D];北京邮电大学;2014年
8 朱百禄;基于Web社区的钓鱼网站检测研究[D];天津理工大学;2013年
9 谭光林;反钓鱼系统的研究与设计[D];北京邮电大学;2013年
10 杨明星;基于登录页面及Logo图标检测的反钓鱼方案[D];太原理工大学;2015年
,本文编号:1703401
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1703401.html