融合多重特征的钓鱼网站聚类算法研究
本文关键词:融合多重特征的钓鱼网站聚类算法研究 出处:《中南林业科技大学》2017年硕士论文 论文类型:学位论文
更多相关文章: 网络钓鱼 网络钓鱼防御 攻击者行为分析 多重特征 聚类
【摘要】:网络钓鱼作为电信诈骗的一种典型欺诈手段,已经引起学术界广发关注。网络钓鱼是一种利用社会工程和技术,针对用户身份数据和金融账号进行欺骗的犯罪机制。网络钓鱼防御是网络钓鱼的一种对抗手段。经过十几年的研究,网络钓鱼防御已经取得了一定的研究成果,但当前的网络钓鱼攻击采用团队化、机构化作战,攻击依旧很猖獗。针对当前网络钓鱼攻击者的团队化、机构化作战的行为方式,提出一种融合多重特征的钓鱼网站聚类算法。通过构造钓鱼网页DOM树,提取出描述钓鱼网站的特征,采用Kulczynski 2算法计算相似度,最后利用K-Means算法进行聚类分析。对eBay、PayPal的聚类结果分析,验证了网络钓鱼攻击者的团队化作案行为特征。本文的主要工作与贡献在于:(1)提出一种融合多重特征的钓鱼网站聚类算法。本论文取样于eBay、PayPal的钓鱼网站。首先,对数据进行预处理,并构造其DOM树。然后使用句法指纹算法进行特征描述,构造特征库进行统一索引,计算相似度。最后,基于这个数据库对钓鱼网页进行相似度聚类。(2)基于算法进行实验分析。对特征库中实验数据对象进行K-means聚类后,得到其聚类结果发现:eBay钓鱼网站聚类结果簇类中发现有83.6%的钓鱼网站相似度值相近或相等,PayPal钓鱼网站聚类结果簇类中发现有73.0%的钓鱼网站相似度值相近或相等。
[Abstract]:As a typical phishing fraud means of telecommunications fraud, has attracted academic attention. GF phishing is a use of social engineering and technology, to carry out criminal deception mechanism for user identity data and financial account. Phishing defense is a means of phishing. After ten years of research, phishing defense has made some achievements, but the current phishing attacks by team, mechanism of combat, attack is still rampant. In view of the current phishing attack team, the way of operational mechanism, proposed a fusion of multiple features of phishing phishing web clustering algorithm. By constructing DOM tree, extraction a description of the characteristics of phishing sites, using Kulczynski algorithm to calculate the similarity of 2, finally using the K-Means algorithm for clustering analysis. The analysis results of eBay, PayPal clustering The verification team into the case, behavior characteristics of phishing attackers. The main work and contributions of this paper are as follows: (1) proposed a fusion of multiple features of phishing sites clustering algorithm. This paper sampling in eBay, PayPal of the phishing site. Firstly, preprocess data, and construct the DOM tree. Then use the fingerprint syntactic feature description algorithm, structure feature library unified index, calculating the similarity. Finally, based on the database of phishing web similarity clustering. (2) the experiments of image analysis based on K-means clustering. After the experimental data in the feature library, the clustering results showed that: eBay clustering results in clusters of phishing sites there are 83.6% phishing sites found similarity values of similar or equal PayPal, the clustering results in clusters of phishing sites phishing sites found similarity value of 73% similar or equal.
【学位授予单位】:中南林业科技大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP393.092;TP311.13
【相似文献】
相关期刊论文 前10条
1 ;就这样根除“钓鱼网站”![J];计算机与网络;2006年06期
2 贾敬华;;整治钓鱼网站还需从长计议[J];互联网天地;2010年10期
3 ;“假苹果”、“假赌博”钓鱼网站肆虐[J];电脑爱好者;2010年23期
4 程科;;新型电信诈骗:“钓鱼网站”初探[J];中国公共安全(学术版);2011年03期
5 周耀鹏;;浅谈钓鱼网站的技术原理及防护[J];黑龙江科技信息;2011年29期
6 ;四招轻松识破假冒钓鱼网站[J];计算机与网络;2011年02期
7 李倩;;钓鱼网站技术与防护[J];硅谷;2012年01期
8 李群;;反钓鱼联盟累计处理钓鱼网站7万个,呈三大特点[J];网络与信息;2012年02期
9 ;今年上半年我国共处理13923个钓鱼网站[J];金融科技时代;2012年08期
10 ;识破钓鱼网站避免上当的几个方法[J];计算机与网络;2013年01期
相关会议论文 前1条
1 李晨;陈星霖;;一种多阶段控制方法在对抗钓鱼攻击中的应用[A];第26次全国计算机安全学术交流会论文集[C];2011年
相关重要报纸文章 前10条
1 方辉;钓鱼网站为何泛滥[N];人民邮电;2010年
2 记者 程武;支付交易类钓鱼网站激增[N];中华工商时报;2010年
3 乔锐;三季度钓鱼网站数量急剧增多[N];人民邮电;2010年
4 本报记者 周静;钓鱼网站半年钓走120亿 亚运门票销售被盯上[N];通信信息报;2010年
5 记者 李雪昆;10月钓鱼网站数量同比增八成[N];中国新闻出版报;2010年
6 本报记者 陈邓新;钓鱼网站量产的秘密[N];电脑报;2010年
7 本报记者 杜峰;钓鱼网站借“月饼”偷网银 谁为网购添加安全锁?[N];通信信息报;2011年
8 本报记者 李艺玲;节前钓鱼网站频频放饵 消费者网上购票谨防被骗[N];通信信息报;2011年
9 雷文君;钓鱼网站手段花样不断翻新[N];人民邮电;2011年
10 本报记者 赵海霞;微博钓鱼网站玩“潜伏” 用户小心提防勿上钩[N];通信信息报;2011年
相关硕士学位论文 前10条
1 程思宇;客户端钓鱼网站智能检测系统的设计与实现[D];华北电力大学;2015年
2 殷兰芳;融合网页噪声和n-gram的钓鱼网站检测研究[D];中南林业科技大学;2015年
3 赵加林;基于K-Means和SVM的钓鱼网站识别的研究[D];西南交通大学;2016年
4 傅成乐;基于模糊关联分类的钓鱼网站检测方法研究[D];东北师范大学;2016年
5 吕周;利用钓鱼网站窃取信用卡信息并转账行为的刑法规制研究[D];吉林大学;2017年
6 邓琼;融合多重特征的钓鱼网站聚类算法研究[D];中南林业科技大学;2017年
7 刘昂;基于文本匹配的钓鱼网站检测系统的设计和实现[D];北京邮电大学;2013年
8 初一;基于Web页面特征的反钓鱼系统的设计与实现[D];北京邮电大学;2014年
9 马亚燕;基于专家知识库的反钓鱼系统的设计与实现[D];北京邮电大学;2014年
10 朱百禄;基于Web社区的钓鱼网站检测研究[D];天津理工大学;2013年
,本文编号:1416456
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/1416456.html