基于URL混淆技术识别的钓鱼网页检测方法
本文选题:钓鱼网页 切入点:统一资源定位符(URL)混淆技术 出处:《计算机工程与应用》2017年20期 论文类型:期刊论文
【摘要】:针对钓鱼URL常用的混淆技术,提出一种基于规则匹配和逻辑回归的钓鱼网页检测方法(RMLR)。首先,使用针对违反URL命名标准及隐藏钓鱼目标词等混淆技术所构建的规则库对给定网页分类,若可判定其为钓鱼网址,则省略后续的特征提取及检测过程,以满足实时检测的需要。若未能直接判定为钓鱼网址,则提取该URL的相关特征,并使用逻辑回归分类器进行二次检测,以提升检测的适应性和准确率,并降低因规则库规模不足导致的误报率。同时,RMLR引入基于字符串相似度的Jaccard随机域名识别方法来辅助检测钓鱼URL。实验结果表明,RMLR准确率达到98.7%,具有良好的检测效果。
[Abstract]:Aiming at the obfuscation technique commonly used in phishing URL, a method of fishing page detection based on rule matching and logical regression is proposed. A rule base based on the obfuscation techniques such as violating the URL naming standard and hiding the phishing target words is used to classify a given web page. If it can be judged as a phishing site, it omits the subsequent feature extraction and detection process. In order to meet the needs of real-time detection, if not directly identified as a fishing site, the relevant features of the URL are extracted, and the second detection is carried out by using a logical regression classifier to improve the adaptability and accuracy of the detection. At the same time, the Jaccard random domain name recognition method based on string similarity is introduced to assist the detection of phishing URLs. The experimental results show that the accuracy of Jaccard is 98.7 and has good detection effect.
【作者单位】: 新疆大学信息科学与工程学院;
【基金】:国家自然科学基金(No.61303231,No.61433012,No.U1435215)
【分类号】:TP393.08
【相似文献】
相关期刊论文 前10条
1 李广丽;刘觉夫;;面向URL的网络机器人软件模型的研究与实现[J];华东交通大学学报;2007年01期
2 任兀;;易开发,易优化——ASP.NET4.0中的URL路由[J];科技信息;2010年28期
3 刘国卿;;基于MD5的URL防篡改算法设计[J];科技信息;2011年03期
4 海心阁 ,糯米;看懂网址 小心URL欺骗[J];中国会计电算化;2003年08期
5 耿长欣,刘培玉;URL净化算法的探讨及改进[J];计算机工程与设计;2004年08期
6 曾义聪;杨贯中;周志光;曾强聪;;基于层次语义的URL排序方法研究[J];计算机工程与设计;2008年13期
7 刘胜利;杨龙;;基于网络通信行为分析的窃密木马检测技术[J];保密科学技术;2012年12期
8 杨阳;基于URL的Web服务器数据访问[J];电脑编程技巧与维护;2003年10期
9 ;迅雷URL扫描 谁家的“杯具”[J];电脑爱好者;2010年09期
10 曹玖新;董丹;毛波;王田峰;;基于URL特征的Phishing检测方法(英文)[J];Journal of Southeast University(English Edition);2013年02期
相关重要报纸文章 前1条
1 海心阁 糯米;看懂网址,,小心URL欺骗[N];电脑报;2003年
相关硕士学位论文 前5条
1 崔静静;基于I-K-Means聚类的朴素贝叶斯HRNB分类算法在入侵检测中的应用研究[D];河南理工大学;2014年
2 张瑞琴;基于信息熵聚类的异常检测方法研究[D];北京交通大学;2016年
3 丁兴旺;面向网络爬虫的海量URL数据管理技术研究[D];哈尔滨工业大学;2008年
4 谢豪;近似字符串匹配研究及其在URL检测中的应用[D];华南理工大学;2011年
5 郝建波;微博突发话题检测、跟踪与传播预测技术研究[D];哈尔滨工程大学;2013年
本文编号:1649044
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1649044.html