基于网页结构的网站检测研究
[Abstract]:In order to accurately detect fake websites, a page similarity calculation method based on web structure is proposed. In this method, the web pages are divided into blocks and selected reasonably, and then the similar node groups are determined by preliminary comparison. Finally, the web page data is quantized and the similarity of the pages is calculated. Experiments show that this method can effectively detect the similarity of web pages, especially for the mirror images of fake websites, and the false alarm rate and false alarm rate are not more than 10%.
【作者单位】: 哈尔滨工业大学计算机科学与技术学院;
【基金】:国家自然科学基金(61170262,61371177)资助项目
【分类号】:TP393.092
【参考文献】
相关期刊论文 前3条
1 朱毅华;张超群;曾通;吴龙凤;徐玛丽;王东波;李晓晖;;基于子树相似度计算的网页评论提取算法研究[J];现代图书情报技术;2013年11期
2 何忠秀;王霜;安礼成;;基于向量空间的网页内容相似度计算方法研究[J];计算机与现代化;2010年09期
3 郭淼霞;吴扬扬;;基于Web超链接结构信息的网页分类技术研究[J];泉州师范学院学报;2008年04期
【共引文献】
相关期刊论文 前5条
1 李大辉;何清刚;王佰玲;邹新一;;基于网页结构的网站检测研究[J];高技术通讯;2015年Z2期
2 赵涛;张太红;陈燕红;;中文农业网页去重及相似度判断研究[J];计算机技术与发展;2015年01期
3 蒋宗礼;时福林;;基于链接关系的网页分类优化算法[J];计算机与现代化;2014年05期
4 郭淼霞;;中文网页分类研究综述[J];赤峰学院学报(自然科学版);2011年12期
5 郭淼霞;;网页分类中的数据预处理方法研究[J];莆田学院学报;2011年05期
【二级参考文献】
相关期刊论文 前10条
1 刘伟;严华梁;肖建国;曾建勋;;一种Web评论自动抽取方法[J];软件学报;2010年12期
2 聂卉;黄贵鹏;;树编辑距离在Web信息抽取中的应用与实现[J];现代图书情报技术;2010年05期
3 王利;刘宗田;王燕华;廖涛;;基于内容相似度的网页正文提取[J];计算机工程;2010年06期
4 安增文;徐杰锋;;基于视觉特征的网页正文提取方法研究[J];微型机与应用;2010年03期
5 许世明;武波;马翠;邸思;徐洪奎;杜如虚;;一种基于预分类的高效SVM中文网页分类器[J];计算机工程与应用;2010年01期
6 陈芨熙;顾新建;陈国海;魏江;;基于向量空间模型和专利文献特征的相似专利确定方法[J];浙江大学学报(工学版);2009年10期
7 毛雪云;曾国荪;王伟;;基于向量空间模型的网页文本可信性分类方法[J];计算机工程与应用;2008年25期
8 李姜;;基于DOM的评论发现及抽取模型研究[J];计算机工程与设计;2007年09期
9 郭晨娟;李战怀;;基于概念的网页相似度处理算法研究[J];计算机应用;2006年12期
10 马辉民;李卫华;吴良元;;VSM在中文文本聚类中的应用及实证分析[J];武汉理工大学学报(信息与管理工程版);2006年04期
,本文编号:2214880
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2214880.html