基于CADW集成的钓鱼网站检测方法研究
发布时间:2021-07-20 22:01
近年来,信息诈骗类安全事件数量快速增长。一方面,钓鱼网站传播范围更广泛;另一方面,攻击手段更趋于多样化。如何全面准确地监测钓鱼网站成了挑战性的课题,受到了越来越多的关注。从钓鱼网站本质出发,钓鱼攻击者为了使网页在视觉上达到相似的效果,通常使用合法网站中的图像元素进行伪装;同时,在网页中以图片代替文字成为常见的规避检测的手段。因此基于图像相似性的钓鱼检测变得尤为重要。在图像特征提取方面,SIFT算法具有良好的特性,其提取的特征具有尺度不变性,能较好的适应钓鱼页面多变的情况。但在某些因素影响下,若一张图片中存在大量形状相似的区域,在使用SIFT进行图像匹配时会产生一定的误匹配点。为了解决这个问题,本文提出了一个新匹配算法,该方法在对特征进行匹配时加入几何一致性约束,剔除掉邻域斜率不相似的点,同时加入Pearson相关系数约束,对特征向量进行进一步筛选,有效地改善了原始匹配算法约束小,没有考虑空间几何约束信息的问题。对比改进前后的匹配算法,分别对经过噪声,旋转缩放、光照变化以及图像视角变化后的图像进行匹配,结果表明,改进后的匹配算法有效的降低了误配率,与原始SIFT算法相比,误配率降低4~6...
【文章来源】:山东科技大学山东省
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
的幼冤却场年钧鱼网站戴皿分布
据《全球中文钓鱼网站现状统计分析报告(2016年)》⑴数据显示,在2016??年,通过举报和自主检测等方式被识别的钓鱼网站有147211例,每月约有12268??个钓鱼网站被识别。图1.1是2012年至2016年期间,钓鱼网站数量发展趋势,??从图中可以看出,钓鱼网站数量虽存在波动,但整体上呈现上升趋势,并在2016??年到达峰值,较上一年网络钓鱼数量增长了近150.96%。??160000?147211??140000?,,??120000??100000?-?/??80000?70483?/*'??60000?一,??^^一,.4??4000C-??20000??2012?2013?2014?201S?2016??图1.1?2012运2016牵钓鱼网站数量分希??Fig.1.1?Number?distribution?of?phishing?from?2012?to?2016??由图1.2可知,钓鱼网站攻击目标排名前三的行业分别为支付、网络金融、??1??
2反钓鱼相关技术分析??2.1黑白名单钓鱼检测技术??基于黑白名单的检测是通过判断未知URL能否成功匹配黑白名单个网站是否是合法网。知识库中包含正常网站和非正常网站,白名单网站一般来源于网络爬虫或人工收集,非正常网站即所谓的黑名单一人工举报、审查、用户群的评级、APWG?(Anti-Phishing?Working?Group)(Anti-Phishing?Alliance?of?China)或己验证通过的钓鱼网站。安全厂黑白名单记录成MD5值,以防止错误标记,保证信息的正确性。对比的地址与黑名单中的URL,如果命中,则判定该网站为钓鱼网站。如问地址被白名单命中,则允许访问。黑白名单过滤模块主要包括对待行去重和规范化处理,然后按照黑名单、白名单以及路径黑名单顺序2.1是基于黑白名的钓鱼流图。??
【参考文献】:
期刊论文
[1]基于随机森林算法的用电负荷预测研究[J]. 李婉华,陈宏,郭昆,郭松荣,韩嘉民,陈羽中. 计算机工程与应用. 2016(23)
[2]基于图和LDA主题模型的关键词抽取算法[J]. 刘啸剑,谢飞,吴信东. 情报学报. 2016 (06)
[3]多特征分类识别算法融合的网络钓鱼识别技术[J]. 徐欢潇,徐慧,雷丽婷. 计算机应用研究. 2017(04)
[4]基于SURF算法的Android恶意应用钓鱼登录界面检测[J]. 徐强,梁彬,游伟,石文昌. 清华大学学报(自然科学版). 2016(01)
[5]基于超图的文本摘要与关键词协同抽取研究[J]. 莫鹏,胡珀,黄湘冀,何婷婷. 中文信息学报. 2015(06)
[6]基于AdaCostBoost算法的网络钓鱼检测[J]. 曾传璜,李思强,张小红. 计算机系统应用. 2015(09)
[7]基于SVM-RFE的钓鱼网页检测方法研究[J]. 王婷,彭勇,戴忠华,伊胜伟,韩兰胜. 华中科技大学学报(自然科学版). 2013(S2)
[8]词语位置加权TextRank的关键词抽取研究[J]. 夏天. 现代图书情报技术. 2013(09)
[9]基于高斯金字塔的运动目标检测[J]. 屠礼芬,仲思东,彭祺,梅天灿. 中南大学学报(自然科学版). 2013(07)
[10]基于URL特征的Phishing检测方法(英文)[J]. 曹玖新,董丹,毛波,王田峰. Journal of Southeast University(English Edition). 2013(02)
硕士论文
[1]基于内容分析的信息安全过滤技术研究[D]. 杨晓懿.四川大学 2005
本文编号:3293685
【文章来源】:山东科技大学山东省
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
的幼冤却场年钧鱼网站戴皿分布
据《全球中文钓鱼网站现状统计分析报告(2016年)》⑴数据显示,在2016??年,通过举报和自主检测等方式被识别的钓鱼网站有147211例,每月约有12268??个钓鱼网站被识别。图1.1是2012年至2016年期间,钓鱼网站数量发展趋势,??从图中可以看出,钓鱼网站数量虽存在波动,但整体上呈现上升趋势,并在2016??年到达峰值,较上一年网络钓鱼数量增长了近150.96%。??160000?147211??140000?,,??120000??100000?-?/??80000?70483?/*'??60000?一,??^^一,.4??4000C-??20000??2012?2013?2014?201S?2016??图1.1?2012运2016牵钓鱼网站数量分希??Fig.1.1?Number?distribution?of?phishing?from?2012?to?2016??由图1.2可知,钓鱼网站攻击目标排名前三的行业分别为支付、网络金融、??1??
2反钓鱼相关技术分析??2.1黑白名单钓鱼检测技术??基于黑白名单的检测是通过判断未知URL能否成功匹配黑白名单个网站是否是合法网。知识库中包含正常网站和非正常网站,白名单网站一般来源于网络爬虫或人工收集,非正常网站即所谓的黑名单一人工举报、审查、用户群的评级、APWG?(Anti-Phishing?Working?Group)(Anti-Phishing?Alliance?of?China)或己验证通过的钓鱼网站。安全厂黑白名单记录成MD5值,以防止错误标记,保证信息的正确性。对比的地址与黑名单中的URL,如果命中,则判定该网站为钓鱼网站。如问地址被白名单命中,则允许访问。黑白名单过滤模块主要包括对待行去重和规范化处理,然后按照黑名单、白名单以及路径黑名单顺序2.1是基于黑白名的钓鱼流图。??
【参考文献】:
期刊论文
[1]基于随机森林算法的用电负荷预测研究[J]. 李婉华,陈宏,郭昆,郭松荣,韩嘉民,陈羽中. 计算机工程与应用. 2016(23)
[2]基于图和LDA主题模型的关键词抽取算法[J]. 刘啸剑,谢飞,吴信东. 情报学报. 2016 (06)
[3]多特征分类识别算法融合的网络钓鱼识别技术[J]. 徐欢潇,徐慧,雷丽婷. 计算机应用研究. 2017(04)
[4]基于SURF算法的Android恶意应用钓鱼登录界面检测[J]. 徐强,梁彬,游伟,石文昌. 清华大学学报(自然科学版). 2016(01)
[5]基于超图的文本摘要与关键词协同抽取研究[J]. 莫鹏,胡珀,黄湘冀,何婷婷. 中文信息学报. 2015(06)
[6]基于AdaCostBoost算法的网络钓鱼检测[J]. 曾传璜,李思强,张小红. 计算机系统应用. 2015(09)
[7]基于SVM-RFE的钓鱼网页检测方法研究[J]. 王婷,彭勇,戴忠华,伊胜伟,韩兰胜. 华中科技大学学报(自然科学版). 2013(S2)
[8]词语位置加权TextRank的关键词抽取研究[J]. 夏天. 现代图书情报技术. 2013(09)
[9]基于高斯金字塔的运动目标检测[J]. 屠礼芬,仲思东,彭祺,梅天灿. 中南大学学报(自然科学版). 2013(07)
[10]基于URL特征的Phishing检测方法(英文)[J]. 曹玖新,董丹,毛波,王田峰. Journal of Southeast University(English Edition). 2013(02)
硕士论文
[1]基于内容分析的信息安全过滤技术研究[D]. 杨晓懿.四川大学 2005
本文编号:3293685
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3293685.html