基于数据挖掘的识别社交网站Sybil攻击的算法研究
发布时间:2021-10-15 21:10
随着在线社交网络技术的快速发展,网络社交已经成为大多数人必不可少的生活方式。在利益的驱动下,针对社交网络的攻击也变得越来越频繁。与单个用户相比,由多个用户合谋发起的Sybil攻击破坏性更强。Sybil用户团体特点是组织性和结构性都很强,团体内的用户会几乎同时段对相同目标店铺发起Sybil攻击,这种Sybil攻击能够在较短时间内对目标店铺声誉评分造成巨大变化,声誉评分急剧上升或是下降取决于Sybil活动的雇佣者是店铺本身还是其竞争对手。无论结果如何,都对正常的市场秩序造成了损害。因此需要一种有效的识别在线社交网络中Sybil攻击的方法。本论文主要研究了如何有效识别社交网络中的Sybil攻击的算法。本文以用户评价类社交网站大众点评网为研究对象,设计了基于改进的逻辑回归算法的识别社交网站的Sybil攻击的方案。首先爬取大众点评网上一段时间内用户对排名靠前商家的评论数据,获得了用户评价数据集。数据的采集用到了网上现有的采集工具。其次对获取的数据集进行了数据清洗工作,包括对数据集里面的缺失值、异常值、重复数据等脏数据进行处理。获得可以使用的评价数据集,为接下来的特征分析、模型构建和实验验证等工作...
【文章来源】:南京邮电大学江苏省
【文章页数】:50 页
【学位级别】:硕士
【部分图文】:
总体评分各分段人数分布图
南京邮电大学专业学位硕士研究生学位论文第四章社交网站数据挖掘分析25数据各字段说明如下:用户ID,字段类型为long,字段表示为Review_ID,字段为九位数字,如377313283代表其中一个用户;点评餐厅名,字段类型为string,字段表示为Merchant,如:广东道至正餐厅(区庄店);餐厅评分(包括整体评分,味道、环境、服务分项评分),字段类型均为int,字段表示分别为Rating、Score_taste、Score_environment、Score_service,评分从0到5分别表示满意程度,分数越高表示用户越满意;如图4.1到4.4分别为各项评分人数分布图。图4.1总体评分各分段人数分布图图4.2口味评分各分段人数分布图
南京邮电大学专业学位硕士研究生学位论文第四章社交网站数据挖掘分析26图4.3环境评分各分段人数分布图图4.4服务评分各分段人数分布图从总体评分和各项评分分段分布图来看,评分3及以上的人数为大多数,评分3以下的人数占比较校且总体评分和各分项评分在各分段的人数分布趋势一致。点评时间,字段类型为time,字段表示为Time,如2018年10月1日;点评获得点赞数和评论数,字段类型均为int,字段表示为Num_thumbs_up和Num_response;
【参考文献】:
期刊论文
[1]基于词向量和增量聚类的短文本聚类算法[J]. 杨波,杨文忠,殷亚博,何雪琴,袁婷婷,刘泽洋. 计算机工程与设计. 2019(10)
[2]机器学习及其相关算法简介[J]. 周昀锴. 科技传播. 2019(06)
[3]社交网络中基于模块度最大化的标签传播算法的研究[J]. 陈晶,万云. 通信学报. 2017(02)
[4]利用加权用户关系图的谱分析探测大规模电子商务水军团体[J]. 韩忠明,杨珂,谭旭升. 计算机学报. 2017(04)
[5]针对有向社交网络的Sybil检测方法[J]. 王永程,孟艳红. 西安电子科技大学学报. 2016(02)
[6]一种基于逻辑回归算法的水军识别方法[J]. 张良,朱湘,李爱平,王志华,鲁鹏. 信息安全与技术. 2015(04)
[7]网络水军识别研究[J]. 莫倩,杨珂. 软件学报. 2014(07)
[8]基于Web数据挖掘的网站知识获取及应用——以大众点评网为例[J]. 尤建新,孟银薇. 上海大学学报(自然科学版). 2014(03)
[9]基于语言结构和情感极性的虚假评论识别[J]. 任亚峰,尹兰,姬东鸿. 计算机科学与探索. 2014(03)
[10]基于自适应聚类的虚假评论检测[J]. 宋海霞,严馨,余正涛,石林宾,苏斐. 南京大学学报(自然科学版). 2013(04)
博士论文
[1]垃圾短信过滤关键技术研究[D]. 黄文良.浙江大学 2008
硕士论文
[1]基于改进阶梯网络算法的广告转化率预测[D]. 李岩.江苏科技大学 2019
[2]众包营销中微博与水军的联合检测[D]. 倪泽阳.东南大学 2018
[3]基于机器学习的水军识别及话题影响力分析研究[D]. 高云雪.北京工业大学 2018
[4]基于淘宝用户评价情感分析的综合排序方法[D]. 李圆圆.华中科技大学 2018
[5]社交网络女巫攻击防御策略研究[D]. 司书山.重庆邮电大学 2018
[6]基于微博的一种用户影响力度量方法研究及实现[D]. 沈徽.燕山大学 2015
[7]C2C电子商务中虚假评价用户的识别方法研究[D]. 许敏.南京师范大学 2014
本文编号:3438629
【文章来源】:南京邮电大学江苏省
【文章页数】:50 页
【学位级别】:硕士
【部分图文】:
总体评分各分段人数分布图
南京邮电大学专业学位硕士研究生学位论文第四章社交网站数据挖掘分析25数据各字段说明如下:用户ID,字段类型为long,字段表示为Review_ID,字段为九位数字,如377313283代表其中一个用户;点评餐厅名,字段类型为string,字段表示为Merchant,如:广东道至正餐厅(区庄店);餐厅评分(包括整体评分,味道、环境、服务分项评分),字段类型均为int,字段表示分别为Rating、Score_taste、Score_environment、Score_service,评分从0到5分别表示满意程度,分数越高表示用户越满意;如图4.1到4.4分别为各项评分人数分布图。图4.1总体评分各分段人数分布图图4.2口味评分各分段人数分布图
南京邮电大学专业学位硕士研究生学位论文第四章社交网站数据挖掘分析26图4.3环境评分各分段人数分布图图4.4服务评分各分段人数分布图从总体评分和各项评分分段分布图来看,评分3及以上的人数为大多数,评分3以下的人数占比较校且总体评分和各分项评分在各分段的人数分布趋势一致。点评时间,字段类型为time,字段表示为Time,如2018年10月1日;点评获得点赞数和评论数,字段类型均为int,字段表示为Num_thumbs_up和Num_response;
【参考文献】:
期刊论文
[1]基于词向量和增量聚类的短文本聚类算法[J]. 杨波,杨文忠,殷亚博,何雪琴,袁婷婷,刘泽洋. 计算机工程与设计. 2019(10)
[2]机器学习及其相关算法简介[J]. 周昀锴. 科技传播. 2019(06)
[3]社交网络中基于模块度最大化的标签传播算法的研究[J]. 陈晶,万云. 通信学报. 2017(02)
[4]利用加权用户关系图的谱分析探测大规模电子商务水军团体[J]. 韩忠明,杨珂,谭旭升. 计算机学报. 2017(04)
[5]针对有向社交网络的Sybil检测方法[J]. 王永程,孟艳红. 西安电子科技大学学报. 2016(02)
[6]一种基于逻辑回归算法的水军识别方法[J]. 张良,朱湘,李爱平,王志华,鲁鹏. 信息安全与技术. 2015(04)
[7]网络水军识别研究[J]. 莫倩,杨珂. 软件学报. 2014(07)
[8]基于Web数据挖掘的网站知识获取及应用——以大众点评网为例[J]. 尤建新,孟银薇. 上海大学学报(自然科学版). 2014(03)
[9]基于语言结构和情感极性的虚假评论识别[J]. 任亚峰,尹兰,姬东鸿. 计算机科学与探索. 2014(03)
[10]基于自适应聚类的虚假评论检测[J]. 宋海霞,严馨,余正涛,石林宾,苏斐. 南京大学学报(自然科学版). 2013(04)
博士论文
[1]垃圾短信过滤关键技术研究[D]. 黄文良.浙江大学 2008
硕士论文
[1]基于改进阶梯网络算法的广告转化率预测[D]. 李岩.江苏科技大学 2019
[2]众包营销中微博与水军的联合检测[D]. 倪泽阳.东南大学 2018
[3]基于机器学习的水军识别及话题影响力分析研究[D]. 高云雪.北京工业大学 2018
[4]基于淘宝用户评价情感分析的综合排序方法[D]. 李圆圆.华中科技大学 2018
[5]社交网络女巫攻击防御策略研究[D]. 司书山.重庆邮电大学 2018
[6]基于微博的一种用户影响力度量方法研究及实现[D]. 沈徽.燕山大学 2015
[7]C2C电子商务中虚假评价用户的识别方法研究[D]. 许敏.南京师范大学 2014
本文编号:3438629
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3438629.html
最近更新
教材专著