当前位置:主页 > 管理论文 > 移动网络论文 >

基于多元特征的微博被劫持账户检测

发布时间:2021-12-30 17:55
  微博作为一个拥有大量用户的社交平台,其较大的影响力与开放性吸引了攻击者的目光。攻击者会利用异常账户进行网络犯罪,对异常账户的检测是维护社交网络安全的重要途径之一。基于攻击者的常规行为以及正常用户的行为特征,提出了一种微博中被劫持账户的检测方法。该方法使用6个特征对用户行为进行分析,使用异常得分刻画用户行为的异常程度,使用传统机器学习分类器检测被劫持账户。为验证本文方法的有效性,采用了由复旦大学提供的公开微博数据集进行实验,结果表明,采用决策树分类器时,本文方法对被劫持账户的检测精确率高达97. 5%。 

【文章来源】:武汉大学学报(理学版). 2020,66(02)北大核心CSCD

【文章页数】:8 页

【部分图文】:

基于多元特征的微博被劫持账户检测


被劫持账户检测框架

累积分布,累积分布,消息


发布时间特征为用户发布消息的确切时间。本文假设多数用户在一天中的某些相对固定的时间段内较为活跃,而在其他时间段内较为平静,如果用户在最不可能的时间发布消息,本文方法将其判定为异常。本文统计11 000个实验验本(详见2.1节)中用户在各个时间段内的消息总数,得到用户活跃时间段的累积分布函数(cumulative distribution function,CDF)(图2)。本文将活跃时间段定义为:一个用户在这些时间段内发布消息的数量超过其一天中发布消息的总数量的一半。由图2可以看出,约75%的用户每天活跃的时间不大于7个小时,因此在下文的正常阈值设定中,我们选择用户最为活跃的7个时间段作为正常阈值。当一个用户在其活跃的时间段内发布消息,则认为是该行为是正常的;如果用户在其最不活跃的时间段内突然活跃,则认为其所发消息有一定的概率是异常的。2)发布消息主题特征

累积分布,主题,累积分布,消息


一般来说,用户倾向于发布自己感兴趣的内容信息。例如,某用户是一个篮球球迷,那么他发布的消息更有可能是体育类的,所以我们将以此为基准来刻画用户的行为特征。实验中,将主题分为10类,分别是体育、财经、房产、家居、教育、科技、时尚、时政、游戏和娱乐。本文统计了11 000个实验样本(详见2.1节)中用户消息的主题分类。如图3所示,约85%的用户特别感兴趣的主题个数少于等于3个,在下文的阈值选取中,将用户最感兴趣的3个主题设置为正常阈值,当用户发布消息主题不属于其感兴趣的范围,本文方法将判定其行为是异常的。除此之外,微博还提供了热门主题作为用户讨论的话题。用户在发布讨论此类话题的消息时会带有符号“#”,“#”后就是话题。文献[14]定义了一种垃圾邮件发送者的行为特征,即利用热门话题,将不相干内容带一个热门标题,这样可以利用话题的流行性吸引眼球,从而提高点击量,使消息的扩散效果更好。因此可利用标签与文本内容的相似度特征,即用户发布消息的标题与文本主题不一致时,本文方法亦将判定其行为是异常的。

【参考文献】:
期刊论文
[1]在线社交网络中异常帐号检测方法研究[J]. 张玉清,吕少卿,范丹.  计算机学报. 2015(10)



本文编号:3558701

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3558701.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户17322***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com