基于层次聚类的虚假用户检测
[Abstract]:The Internet is full of malicious users, and Internet service providers usually have a large number of registered users, making it difficult for the system to find false accounts. In view of the massive registration data, the false accounts registered by malicious users in batches are usually similar. In this paper, a system model of locating false accounts in mass data is proposed. The user name string pattern is used to pre-classify the massive data, and then the string similarity is calculated for each element of the classification, that is, the Levenshtein distance of string. Appropriate threshold is set and hierarchical clustering analysis is carried out to locate the group false accounts hidden in massive registration data. The experimental results show that the system model is effective. Compared with the existing model, the system has less dependence on the data dimension.
【作者单位】: 四川大学电子信息学院;
【分类号】:TP309
【相似文献】
相关期刊论文 前10条
1 潘大庆;;基于层次聚类的微博敏感话题检测算法研究[J];广西民族大学学报(自然科学版);2012年04期
2 郑晓鸣;吕士颖;王晓东;;一种基于随机抽取的有限深度层次聚类[J];郑州大学学报(理学版);2007年03期
3 汤周文;叶东毅;;基于层次聚类的差异化属性约简算法[J];计算机应用;2009年02期
4 文顺;赵杰煜;朱绍军;;基于贝叶斯和谐度的层次聚类[J];模式识别与人工智能;2013年12期
5 龚尚福;陈婉璐;贾澎涛;;层次聚类社区发现算法的研究[J];计算机应用研究;2013年11期
6 香红丽;王潇涵;罗淑云;;基于层次聚类方法研究课程关系结构[J];中国科教创新导刊;2011年26期
7 李晓飞;;基于动态层次聚类的离散化算法的研究[J];计算机应用与软件;2009年10期
8 张阔,徐鹏,李涓子,王克宏;基于优化层次聚类的文档逻辑结构抽取[J];清华大学学报(自然科学版);2005年04期
9 王旅;彭宏;胡劲松;梁华芳;;层次聚类在种群亲缘关系研究中的应用[J];计算机时代;2006年07期
10 黄健斌;康剑梅;齐俊杰;孙鹤立;;一种基于同步动力学模型的层次聚类方法[J];中国科学:信息科学;2013年05期
相关会议论文 前6条
1 吾守尔·斯拉木;吴启南;;基于层次聚类方法[A];第六届全国计算机应用联合学术会议论文集[C];2002年
2 彭楠峗;王厚峰;凌晨添;;基于层次聚类的网络新闻热点发现[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 杨建武;;Web检索结果的层次聚类研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 刘启亮;邓敏;李光强;王佳t,
本文编号:2318415
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2318415.html