多关系社交网络下恶意用户行为分析及特征构造研究
发布时间:2020-05-24 22:23
【摘要】:电子商务平台和社交网络平台的蓬勃发展,用户越来越借助于各类评论信息作出决策,这导致虚假和欺诈信息大量出现,发布虚假评论和欺诈信息的人通常被称为恶意用户。近年来,恶意用户检测已经成为学术界和工业界关注的热点问题。由于电子商务平台数据类型丰富,如评分、评论内容、发布评论时间等,主流的检测方法依托上述数据构建行为特征,再利用机器学习方法训练分类器。然而,社交网络以交互关系数据为主,数据类型相对匮乏,因此,社交网络的恶意用户检测需要“依赖于关系数据但独立于内容数据”的检测框架。已有的研究尝试从交互关系上定义复杂网络特征(如度、K-Core、Page Rank、连通分量等)及交互序列特征,隐含在多关系网络中的深层次语义信息未能获得充分利用。有鉴于此,本文的研究旨在充分挖掘隐含在异质关系网络中的深层次语义信息,从而定义出基于关系网络数据的一系列行为特征及隐特征。以真实社交网络Tagged.com多关系数据集为支撑,本文主要进行了以下两个方面的研究:1.基于非内容数据,充分挖掘隐含在异质关系网络中的深层次语义信息,从而定义出基于关系网络数据的一系列行为特征指标。由于Tagged数据集中没有公开发布关系属性对应的关系类型名称,所以我们首先根据数据集中关系属性的数据特征,结合Tagged.com网站实际公布的关系类型的特点,分析推测出各个关系属性对应的实际关系类型名称。接着,在各个关系上,结合实际关系类型意义,对比分析恶意用户和正常用户的行为模式差异,并基于非文本的数据信息,如活跃时间段、发送/接受比例、发送后得到回复的比例等,定义出符合关系网络数据特性的一系列行为特征指标。最后,依托于数据集中提供的每个用户的真实标记信息验证了特征指标在表征恶意用户与正常用户行为差异中的有效性。2.提出了一种新的“发送-接收”角色分离的图嵌入模型用于抽取和融合异质关系上的隐特征。首先用点代表用户,边代表用户间发生的关系在一个共享的嵌入空间中构建图。其次,提取各关系上发送方到接收方的交互次数做为交互向量,接着构建发送方特征矩阵与接收方用户特征矩阵,并以点积表示用户-用户交互向量,以这两种向量的差异性来拟合概率矩阵分解模型,并加入约束条件防止优化过程中的过拟合问题。最后通过多关系拼接方法获取每个用户在多关系社交网络中的隐特征。交叉验证的结果显示,本文提出的模型所提取的隐特征,对多关系社交网络中恶意用户的检测性能有显著贡献。
【图文】:
图 3.1 特征 FOTD 的 CDF 曲线 展示了针对假设 H1a 提出的特征 FOTD 的 CDF 曲线,聊天时“发送信息”的一阶时间差分值(以秒为单位,,将近 80%的正常用户会在给某用户发送完一条信息信息,也就是说正常用户会相对集中的在一段时间内与
与电邮、电子商务等平台不同,社交网络平台更注重多元化发展,用户之间可以通过多种多样的形式达到沟通交流的目的。这种多样化的交互关系也给了社交网络中的恶意用户可乘之机。图4.1通过一个具有三种交互关系(“发送信息”、“举报用户”和“送礼物”)的社交网络示例清晰地说明了关系间潜在联系的重要性。图 4.1 多关系间潜在联系的重要性示例图具体的来说,在“发送消息”(message)这个关系上,一个向很多用户发送信息广撒网的用户有很大的可能性是恶意用户;在“送礼物”(sendgift)这个关系上,若一个用户收到过来自其他用户送出的礼物,那么他有很大可能是正常用message messagemessagemessagemessagemessagemessagemessagesend giftsend giftblockblockblockblockuser iuser jSuspicious user who have sent many messages
【学位授予单位】:南京财经大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP18;TP391.1
本文编号:2679084
【图文】:
图 3.1 特征 FOTD 的 CDF 曲线 展示了针对假设 H1a 提出的特征 FOTD 的 CDF 曲线,聊天时“发送信息”的一阶时间差分值(以秒为单位,,将近 80%的正常用户会在给某用户发送完一条信息信息,也就是说正常用户会相对集中的在一段时间内与
与电邮、电子商务等平台不同,社交网络平台更注重多元化发展,用户之间可以通过多种多样的形式达到沟通交流的目的。这种多样化的交互关系也给了社交网络中的恶意用户可乘之机。图4.1通过一个具有三种交互关系(“发送信息”、“举报用户”和“送礼物”)的社交网络示例清晰地说明了关系间潜在联系的重要性。图 4.1 多关系间潜在联系的重要性示例图具体的来说,在“发送消息”(message)这个关系上,一个向很多用户发送信息广撒网的用户有很大的可能性是恶意用户;在“送礼物”(sendgift)这个关系上,若一个用户收到过来自其他用户送出的礼物,那么他有很大可能是正常用message messagemessagemessagemessagemessagemessagemessagesend giftsend giftblockblockblockblockuser iuser jSuspicious user who have sent many messages
【学位授予单位】:南京财经大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP18;TP391.1
【参考文献】
相关期刊论文 前7条
1 莫倩;杨珂;;网络水军识别研究[J];软件学报;2014年07期
2 伍之昂;王有权;曹杰;;推荐系统托攻击模型与检测技术[J];科学通报;2014年07期
3 伍之昂;庄毅;王有权;曹杰;;基于特征选择的推荐系统托攻击检测算法[J];电子学报;2012年08期
4 邱云飞;王建坤;邵良杉;刘大有;;基于用户行为的产品垃圾评论者检测研究[J];计算机工程;2012年11期
5 赵妍妍;秦兵;刘挺;;文本情感分析[J];软件学报;2010年08期
6 江峰;杜军威;眭跃飞;曹存根;;基于边界和距离的离群点检测[J];电子学报;2010年03期
7 陈志贤;;垃圾邮件过滤技术研究综述[J];计算机应用研究;2009年05期
本文编号:2679084
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/2679084.html