当前位置:主页 > 管理论文 > 移动网络论文 >

社交网络中异常用户检测研究

发布时间:2020-06-01 23:45
【摘要】:随着互联网的发展,社交网络已经渗透到人们生活、学习、工作、娱乐的各个方面,网络的多元化趋势使信息的传播方式越来越丰富。社交网络不仅将线下的社交活动拓展到线上,使得彼此间交流更为方便,用户更是可以通过社交平台展示自己以及获得热门资讯和自己感兴趣的话题。然而,为了获取利益,一些恶意用户正是利用社交网络平台的优越性传播一些恶意信息,如色情内容、垃圾广告、网络钓鱼等。这些恶意用户通过虚假账号或盗用正常用户账号的方式传播大量恶意消息,这种恶意行为严重影响了用户的上网体验以及用户的信息财产安全。如今,异常用户的泛滥已经成为社交媒体服务行业面临的一个严重问题。因此,社交网络的异常用户检测问题一直都是这些年来学者及商业界研究的热门领域。本文以新浪微博社交网络平台为研究对象,展开了对新浪微博平台异常用户检测的研究,主要完成了以下三方面工作,其理论方法亦适用于其它社交网络平台。(1)结合本文的研究目的,为了获得理想的实验数据源,我们利用Scrapy爬虫框架分别设计了针对正常微博用户和异常微博用户的个性化网络爬虫系统,实现了对用户的微博内容、用户信息、用户关系等数据的高效采集并实时导入MongoDB数据库中,并利用异常用户评判标准构建异常用户检测实验数据集。(2)本文通过探究新浪微博正常用户与异常用户的用户信息特征、行为特征,对正常用户与异常用户的数据进行深入分析,并结合领域知识提取新的特征,按需求进行特征提取、数据格式化等数据预处理操作。利用特征选择算法将所有特征按等级排序找出影响异常用户检测结果的重要因子,构建基于用户特征的异常用户检测模型,将加权投票的随机森林算法作为训练和检测模型,并将该模型与其他算法进行对比分析。(3)随机森林模型中参数的选取对模型性能的影响至关重要,传统的方法通常根据经验值来选取参数,无法确定是否达到实验的理想效果,为了确定模型的最优参数,我们引入标准粒子群算法(SPSO)来对模型的参数进行优化,构造基于SPSO优化的加权投票随机森林异常用户检测模型,使模型的检测性能得到显著提升。
【图文】:

社交,攻击者,账户,用户检测


户数量吸引了许多为谋取利益的攻击者[7-10]关注。攻击者通过创建大量虚假账正常账户(统称异常账户)来向用户发送虚假广告、钓鱼、色情、诈骗等不良恶意行为严重影响了用户的上网体验以及用户的信息财产安全。由于社交网络用户许多社交功能,用户间可以建立朋友关系,而且发布的信息具有公开性,网络中的不良信息比传统的垃圾邮件信息更具威胁性。就新浪微博社交平台来通过恶意点赞、关注、评论、发送恶意链接等方式获取利益。如图 1.1 所示,户通过提供恶意访问、关注等非正常的微博服务来获取利益。现如今购物网站直接搜索到提供这种服务的店铺,但仍可以通过地下市场购买到这种服务,这社交网站中用户的社交关系以及网站的信用体系。Thomas[11]发现,异常用户一社交互动,但会发送大量的好友请求,并在一些热门微博下发表垃圾内容以吸的注意。针对目前社交网络的异常账户检测技术,攻击者也会不断的更新攻击隐藏身份等各种手段躲避被检测到的可能。这一现象给社交网络异常用户检测极大的挑战,学术界及工业界需要不断的改善异常用户的检测技术以应对异常攻击模式。因此,社交网络的异常用户检测技术需要随着攻击者攻击方式的改新,一直是信息安全领域研究的技术难题。

用户关系,互相关,互联网站


广西师范大学 2019 届硕士研究生学位论文整理网络显示,目前新浪微博的用户数量已经超过了 5 亿[5]。互联网站中其访问热度排在前 20 位[4],且每天的访网站和 Twitter 很类似,用户能够发布不多于 140 字符的话题,也可以给其他任何用户发送聊天消息,并且类软件有好友权限的限制。被关注的用户在收到关注略或者关注对方,互相关注的用户便成为了微博好友名 ID,用户分享的动态信息会自动呈现在好友或者粉他人的方式获得感兴趣话题的最新资讯。图 3.1 描述 A 关注 B,B 和 C 是互相关注的关系。
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.1;TP393.092

【相似文献】

相关期刊论文 前10条

1 王超琼;陈s,

本文编号:2692251


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2692251.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户74f62***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com