当前位置:主页 > 管理论文 > 移动网络论文 >

基于半监督的社交网络垃圾用户检测的研究

发布时间:2017-12-18 23:30

  本文关键词:基于半监督的社交网络垃圾用户检测的研究


  更多相关文章: 半监督学习 社交网络垃圾 社交网络图


【摘要】:近年来,随着新兴技术的发展以及web 2.0的普及,社交网络呈现了爆炸式的增长,已取代了传统的门户网站和博客网站成为了最受欢迎网民关注的网络服务平台。社交网络每天还会产生大量的信息,由于其开放性实时性,使得原本再网页搜索作弊行为更多得转移到社交网络上来,这些垃圾作弊信息严重的影响了用户在社交平台的体验,同时浪费了大量用户的时间,如何过滤这些垃圾信息逐步引起了各个社交网络平台的重视。为了检测限制这些垃圾信息发布者,已经有很多研究者提出了解决方案,而其中监督学习分类的方法,占了绝大多数,这种检测方法利用挖掘账户的信息特征,建立分类模型,对在线对账户进行预测分类,从而过滤限制这些垃圾信息。但这种监督学习需要有足够但训练集,而社交网络用户量庞大,不可能通过人工的方式对大量数据进行标记,然而如果没有足够且准确适当的标记数据,监督分类模型很容易出现偏差。因此,如果能利用少量的标记数据,建立检测模型,将会节省大量对人力时间资源。本文分析发现社交网络缺少大量标记数据对问题,通过调研提出一种半监督垃圾账户检测机制,可以通过少量的标记数据同时挖掘用户的网络信息,不断预标记用户,再从中选出置信度较高的用户,作为新的训练集,然后重新训练学习模型,通过不断的迭代最终得出一个优化的分类模型。本文首先对社交网络作弊进行了介绍,接着介绍了本文用到的数据挖掘的知识,然后对现有对研究做了深入分析后,详细阐述了半监督垃圾信息检测的算法,最后通过真实的Twitter数据集,验证了模型的正确性,本文提出的模型可以在标记数据不足的情况下,依然能训练学习得到和监督分类一样高效的分类模型。
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.09;TP311.13

【相似文献】

中国期刊全文数据库 前10条

1 李林容;;社交网络的特性及其发展趋势[J];新闻界;2010年05期

2 陈琛;沙昊;;社交网络的开放融合图谱[J];通信世界;2010年48期

3 杨宇良;;网络让我们更远还是更近[J];互联网天地;2011年01期

4 陈昱;;社交网络革命与国家安全关系[J];情报杂志;2011年S2期

5 劳伦·考克斯;;请在工作时更新你的状态[J];科技创业;2011年05期

6 斯蒂芬·卡斯;;在线社区能否解决隐私问题[J];科技创业;2011年08期

7 陈云鹏;;电子商务引领社交网络走进2.0时代[J];上海信息化;2012年01期

8 马文刚;;智慧的物联社交网络[J];上海信息化;2012年03期

9 朱乾龙;张倩;杜娟;;我国社交网络繁荣背后面临深层次问题困扰[J];世界电信;2012年06期

10 刘华;;社交网络的融合之路[J];软件工程师;2012年07期

中国重要会议论文全文数据库 前10条

1 赵云龙;李艳兵;;社交网络用户的人格预测与关系强度研究[A];第七届(2012)中国管理学年会商务智能分会场论文集(选编)[C];2012年

2 宫广宇;李开军;;对社交网络中信息传播的分析和思考——以人人网为例[A];首届华中地区新闻与传播学科研究生学术论坛获奖论文[C];2010年

3 杨子鹏;乔丽娟;王梦思;杨雪迎;孟子冰;张禹;;社交网络与大学生焦虑缓解[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年

4 毕雪梅;;体育虚拟社区中的体育社交网络解析[A];第九届全国体育科学大会论文摘要汇编(4)[C];2011年

5 杜p,

本文编号:1306058


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1306058.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7ccc6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com