基于行为分析的社交网络异常账号的检测
发布时间:2019-10-07 21:49
【摘要】:随着互联网的发展,社交网络平台(以下简称"社交平台")逐渐成为我们日常生活中重要的社交工具。社交平台的类型、内容丰富多样,覆盖了社会上各类阶层的用户群体,一些流行且影响力较大的社交网络平台吸引了亿万用户注册登录使用。社交平台在某些方面给予了用户极大的便利,比如减少了用户间沟通空间与时间的距离,但是社交平台存储的巨量用户信息也成为了不法分子或者利益集团的目标,特别是针对社交平台存在的各类的异常账号进行恶意地发布或转发不良信息,给社会和公众造成了极大的损害。针对此种情况,社交平台需通过主动、定时的检测平台的用户行为数据,对异常账户判定和处理,将具有极其重要的作用与意义。本文在梳理了国内外社交网络用户行为分析相关成果的基础上,选择了新浪微博数据作为数据信息来源,利用隐马尔可夫过程对异常用户进行建模与检测,并对检测数据进行统计分析。首先,通过论证与对比,选择利用网络爬虫技术对新浪微博的用户行为数据进行了采集、处理,基于链接的网页分析算法,设计微博信息爬取技术框架,应用Python语言及MySQL数据库技术,通过获取微博URL地址、建立用户列表、自动登录微博,实现抓取微博信息。根据数据用户账号的特征,对数据进行了分析。然后遴选隐马尔可夫模型作为社交网络平台用户行为分析模型。提出并创建了基于隐马尔可夫过程的对社交网络异常用户行为进行检测的模型。通过获取的新浪微博数据对该模型进行训练,得到训练模型参数,利用模型进行用户行为的检测,对微博异常用户进行检测与判定,通过不同的可观察序列对隐变量状态最大概率路径进行计算与判定,从而从数据集分辩出正常和异常用户。并对检测数据进行了统计特性分析,实验证实该模型可有效检测出微博数据的异常账号。根据微博用户行为特征,选择微博特定特征的虚假粉丝,对隐马尔可夫模型进行训练,并进行虚假粉丝的检测,实验表明该模型可有效检测出社交网络微博用户具有特定特征的虚假粉丝账号,证实基于隐马尔可夫过程的具有特定特征的虚假粉丝账号正确检测概率要大于通常意义下异常账号正确检测概率。最后对基于隐马尔可夫过程的异常账号检测系统进行了设计与实现。系统可以对异常账号、虚假粉丝、过度关注、过度转发和过度广告用户进行检测,可以选择不同的隐变量和可观察变量维数及参数,为基于隐马尔可夫过程的异常账号深入研究奠定基础。
【图文】:
用网络爬虫获得微博信息P9’W,需要首先得到各用户微博地址,其次要具有有效逡逑的访问身份,模拟用户自动的登录,通过分析页面信息进行爬取,将爬取到的信逡逑息存储下来,如图3-1。逡逑爬取数据首先要构造爬取的技术框架,通过网络爬虫技术对微博页面中的地逡逑址进行抓取,可获得用户诸多的信息,例如:用户名、微博数、转发数等等。逡逑20逡逑
通大学硕±学位论文逦社交网络用户行为数据的获过互联网链接到微博的服务器(weibo.com)并登陆,其次通过爬虫程序面获取地址链接,并抓取页面中含有的URL地址,通过深度遍历算法将己需要的地址存储到本地的URL地址库中,爬虫技术抓取到的地址可用户的浏览习惯、感兴趣的领域等等,有助于进行用户行为分析,如图3-
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP393.09;TP274
本文编号:2545938
【图文】:
用网络爬虫获得微博信息P9’W,需要首先得到各用户微博地址,其次要具有有效逡逑的访问身份,模拟用户自动的登录,通过分析页面信息进行爬取,将爬取到的信逡逑息存储下来,如图3-1。逡逑爬取数据首先要构造爬取的技术框架,通过网络爬虫技术对微博页面中的地逡逑址进行抓取,可获得用户诸多的信息,例如:用户名、微博数、转发数等等。逡逑20逡逑
通大学硕±学位论文逦社交网络用户行为数据的获过互联网链接到微博的服务器(weibo.com)并登陆,其次通过爬虫程序面获取地址链接,并抓取页面中含有的URL地址,通过深度遍历算法将己需要的地址存储到本地的URL地址库中,爬虫技术抓取到的地址可用户的浏览习惯、感兴趣的领域等等,有助于进行用户行为分析,如图3-
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP393.09;TP274
【参考文献】
相关期刊论文 前10条
1 陈琳;任芳;;基于Python的新浪微博数据爬虫程序设计[J];信息系统工程;2016年09期
2 姚子瑜;屠守中;黄民烈;朱小燕;;一种半监督的中文垃圾微博过滤方法[J];中文信息学报;2016年05期
3 张宇翔;孙菀;杨家海;周达磊;孟祥飞;肖春景;;新浪微博反垃圾中特征选择的重要性分析[J];通信学报;2016年08期
4 李旭军;刘业政;姜元春;;在线社交网络中群体互动行为的时间特征(英文)[J];计算物理;2016年02期
5 张玉清;吕少卿;范丹;;在线社交网络中异常帐号检测方法研究[J];计算机学报;2015年10期
6 杨善林;王佳佳;代宝;李旭军;姜元春;刘业政;;在线社交网络用户行为研究现状与展望[J];中国科学院院刊;2015年02期
7 周中华;张惠然;谢江;;基于Python的新浪微博数据爬虫[J];计算机应用;2014年11期
8 游翔;葛卫丽;;微博数据获取技术及展望[J];电子科技;2014年10期
9 莫倩;杨珂;;网络水军识别研究[J];软件学报;2014年07期
10 高俊波;梅波;;基于文本内容分析的微博广告过滤模型研究[J];计算机工程;2014年05期
相关硕士学位论文 前3条
1 赵建勋;微博恶意用户识别[D];北京交通大学;2016年
2 林成峰;新浪微博恶意用户研究及检测[D];上海交通大学;2014年
3 邓夏玮;基于社交网络的用户行为研究[D];北京交通大学;2012年
,本文编号:2545938
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2545938.html