基于链接分析的钓鱼网站检测方法
本文关键词: 钓鱼检测 链接分析 网络社区 相关网页群 网站签名 特征提取 感知哈希 出处:《南京邮电大学》2014年硕士论文 论文类型:学位论文
【摘要】:钓鱼攻击是一种网络诈骗行为,钓鱼者通过钓鱼邮件以及与合法网页十分相似甚至相同的假冒网站,,骗取受害人的敏感信息,使受害人遭受直接或间接的经济及名誉损失。随着近年来电子商务的发展和普及,钓鱼攻击更加变本加厉,因此钓鱼检测的研究刻不容缓。 钓鱼者之所以能够蒙蔽受害人,正是因为钓鱼网页与其模仿的目标网页之间特殊的链接关系以及高相似性。本文结合了钓鱼网页与目标网页之间特殊的链接关系和网络社区的链接构造特点,通过抓取与钓鱼网页相关的网页构造钓鱼网页的网络社区,识别钓鱼网页的相关网页群,进而确定潜在目标网页群。该方法是一种在线检测方法,不需要庞大的特征库或黑名单库,只需要利用网页之间的链接关系,减少了检测时间。 在获取了潜在目标网页群之后,我们从网站的角度出发,提取网站的网站签名,确定可疑网站的目标网站。这是因为钓鱼网页有时不仅仅是模仿某个单独的目标网页,而是模仿目标网站中的一些相互链接的网页,建立一个视觉上十分相似的钓鱼网站。通过比较钓鱼网页所在的网站与其潜在目标网页群中的网站签名之间的相似性来确定目标网站。我们从网页的全局特征和感知哈希特征两个方面提取了网站签名,再通过匹配算法匹配不同长度的网站签名,最终得到签名的相似度。最后实验验证了我们提出的钓鱼检测方法的可行性和有效性。
[Abstract]:Phishing attacks are a form of cyber fraud in which anglers defraud victims of sensitive information through phishing emails and fake websites that are very similar to or even identical to legitimate web pages. With the development and popularization of electronic commerce in recent years, the fishing attack becomes more and more serious, so the study of fishing detection is urgent. The reason the anglers are able to hoodwink their victims, It is precisely because of the special link relationship and high similarity between the phishing page and the target page that it imitates. This paper combines the special link relationship between the phishing page and the target web page and the link construction characteristics of the network community. By grabbing the web pages associated with phishing pages to construct the phishing web pages' network communities, the related web pages of phishing pages can be identified and the potential target web pages can be identified. This method is an online detection method. There is no need for a large library of features or blacklists, only to use the links between web pages to reduce the detection time. After we get a potential target page group, we extract the site's signature from a website's point of view and determine the target site for a suspicious site. This is because phishing pages sometimes do more than just mimic a single target page. Instead of imitating some of the linked pages in the target site, Build a visually similar phishing site. Determine the target site by comparing the similarity between the site where the phishing page is located and the signature of the site in its potential target page group. Two aspects of perceptual hashing feature are used to extract the website signature. Then the matching algorithm is used to match the different length of website signature, and finally the similarity of the signature is obtained. Finally, the feasibility and effectiveness of the proposed fishing detection method are verified by experiments.
【学位授予单位】:南京邮电大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.092
【相似文献】
相关期刊论文 前10条
1 李莹;网页中多层效果的灵活使用[J];电脑编程技巧与维护;2000年06期
2 李凡希;保存网页的好方法[J];电脑爱好者;2000年18期
3 张东淮;一步一步做网页(二)[J];电脑技术;2001年08期
4 陆伟;如何制作和发布网页[J];现代通信;2001年03期
5 叶知秋;特酷网页轻松做[J];电脑爱好者;2001年15期
6 沁心;网页自动演示小工具——HTML Autorunner[J];电脑爱好者;2001年18期
7 赵杰;刘志宇;邢军;;网页设计与开发[J];牡丹江师范学院学报(自然科学版);2001年03期
8 陈劲宏;网页减肥两三招[J];电脑知识与技术;2003年27期
9 温传伟;网页图片“当当当”[J];电脑知识与技术;2003年30期
10 斌子;网页沙龙[J];网络与信息;2003年07期
相关会议论文 前7条
1 张晓明;奈一雄;齐炯明;安媛媛;张建楠;王静娴;;基于信息隐藏的网页入侵检测技术与实现[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
2 林政;吕雅娟;刘群;马希荣;;基于双语混和网页的平行语料挖掘[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 熊德兰;鄢靖丰;陈静;;基于论坛主题的网页褒贬倾向性识别[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
4 隋春明;郭志丰;;网页防篡改技术在电力信息网中的应用[A];二○○九年全国电力企业信息化大会论文集[C];2009年
5 王海源;石睿智;;高校网页恶意代码的检测、清理与预防[A];中国高等教育学会教育信息化分会第十次学术年会论文集[C];2010年
6 戴玉刚;;藏文网页采集技术研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
7 刘世杰;唐世渭;杨冬青;王腾蛟;姚小波;;自动的WEB信息提取和集成[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
相关重要报纸文章 前10条
1 范德生 邓亚玲;守住网页的秘密[N];电脑报;2005年
2 贞;网页特效与瘦身专家[N];中国电脑教育报;2002年
3 网天;在自己的电脑上发布网页[N];大众科技报;2000年
4 杨兴平 六子;我的网页你别动[N];电脑报;2004年
5 杨耀祥;简繁网页批量互转有妙法[N];中国电脑教育报;2003年
6 河北 李永波;网页底图显个性[N];电脑报;2004年
7 ;让你的网页绽放最美丽的特效[N];中国电脑教育报;2004年
8 刘成富;编辑网页有妙法[N];计算机世界;2004年
9 绵阳南山 iled;让 Frontpage 2000 给我们“一了百了”[N];电脑报;2001年
10 陈宗伟;妙用查找替换功能编辑网页[N];电脑报;2004年
相关博士学位论文 前2条
1 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
2 胡燕;基于Web信息抽取的专业知识获取方法研究[D];武汉理工大学;2007年
相关硕士学位论文 前10条
1 刘典型;多页面特殊网页文字提取与合并技术研究[D];湖南大学;2010年
2 熊茜;虚拟表示模型在网页结构化设计中的应用[D];重庆大学;2006年
3 秦超;网页噪声识别与消除方法研究[D];山东科技大学;2011年
4 郭安;从韩国网页设计看网页艺术设计的视觉呈现[D];武汉理工大学;2008年
5 李翠轻;网页设计中视觉传达与信息传递的统一性研究[D];河北大学;2009年
6 万唯一;基于数字水印的网页防篡改技术研究[D];西南交通大学;2012年
7 刘晨曦;网页去噪音与分类算法研究[D];华侨大学;2008年
8 罗利民;网页防篡改技术的研究与应用[D];中南大学;2008年
9 聂璐;论网页界面设计中的人性化因素[D];湖南师范大学;2010年
10 屠辉;中文重复网页的检测算法研究[D];北京邮电大学;2010年
本文编号:1537786
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1537786.html