新浪微博恶意用户研究及检测
本文选题:新浪微博 切入点:恶意用户检测 出处:《上海交通大学》2014年硕士论文
【摘要】:近年来,随着互联网的普及,微博作为一种新的媒体形式和交流平台也越来越流行。与此同时,微博平台上不断涌现出的各种恶意行为,,开始成为破坏微博安全和内容质量的最大威胁。如何鉴别恶意用户,成为社交网络研究领域的一个重要课题。现有的针对微博的研究大多数以Twitter为平台,其成果无法直接应用于新浪微博等中文微博平台。因此,专门针对中文微博的研究也是相当有必要的。 本文以新浪微博为研究对象,提出了一种基于行为特征检测的微博恶意用户鉴别方法。我们采用了多种方法收集了恶意用户样本:通过架设主动式蜜罐账号,我们吸引了114个恶意用户;利用微博爬虫程序,我们捕获了1459个恶意用户。此外,我们还从淘宝购买了微博推广服务,从而获得了8000个恶意用户样本。我们将恶意用户样本按照行为模式进行分类,归纳总结了三种不同的恶意行为模式:过度广告、重复转发以及过度关注。我们针对所得到的三种不同行为模式的恶意用户进行了深入的分析,通过与正常用户比较统计特征值的方法,归纳总结了他们的特点并且找到了能够区分恶意用户与正常用户的特征。在此基础上,我们利用机器学习技术实现了多种恶意行为分类器,并且将这些分类器整合在一起构成了自动检测系统。我们利用重新收集的测试数据集对该系统进行了测试。该系统能检测出82.06%的恶意用户,而误报率则只有5.92%。
[Abstract]:In recent years, with the popularity of the Internet, micro-blog as a new form of media and communication platform is more and more popular. At the same time, a variety of malicious behavior on the micro-blog platform continue to emerge, become the greatest threat to micro-blog security and content quality. How to identify malicious users, has become an important research topic in the field of social network the existing micro-blog. Most of the studies on Twitter platform, the results can not be directly applied to Sina micro-blog and micro-blog Chinese platform. Therefore, the research on Chinese micro-blog is quite necessary.
This paper takes Sina and micro-blog as the research object, presents a micro-blog malicious user identification method based on behavior detection. We used a variety of methods to collect the samples through the erection of a malicious user: active honeypot account, we attracted 114 malicious users; using micro-blog crawler, we captured 1459 malicious users. In addition, we also purchased from Taobao micro-blog promotion service, so as to obtain 8000 malicious users. We will sample the sample according to the malicious user behavior patterns are classified, summarized three kinds of malicious behavior in different modes: excessive advertising, repeated and excessive attention. We aim at three kinds of behavior patterns obtained by malicious users an in-depth analysis of eigenvalue method by comparison with normal user statistics, summarizes their characteristics and found to distinguish malicious The characteristics of the user and normal user. On this basis, we use machine learning techniques to achieve a variety of malicious behavior classifier, and the classifier together constitute an automatic detection system. We set the system is tested by test data to collect. This system can detect 82.06% malicious users, and false alarm rate it is only 5.92%.
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.092
【共引文献】
相关期刊论文 前10条
1 沈红;谢红彬;;微博营销浪潮中的省级旅游局官方微博营销现状[J];旅游论坛;2013年06期
2 黄国伟;刘云霞;陈志;;基于用户反馈的个性化垃圾邮件过滤方法[J];电子设计工程;2014年15期
3 方佳明;祖亚玲;朱文龙;;基于游客视角的旅游社会媒体使用收益分析[J];电子科技大学学报(社科版);2014年05期
4 黄静;朱丽娅;周南;;企业家微博信息对其形象评价的影响机制研究[J];管理世界;2014年09期
5 王西涛;邵娟;杜彩云;;旅游目的地微博营销研究[J];重庆科技学院学报(社会科学版);2015年04期
6 丁明秀;;微博视域下学校思想政治教育面对的挑战与机遇[J];教学与管理;2013年21期
7 李英乐;于洪涛;刘力雄;;基于SVM的微博转发规模预测方法[J];计算机应用研究;2013年09期
8 王红玲;郑纲;;改进的贝叶斯算法在垃圾邮件过滤中的应用[J];信息通信;2013年09期
9 刘行军;王伟军;;微博信息传播影响因素的探索性分析[J];理论月刊;2014年01期
10 翟军昌;车伟伟;;一种基于条件熵的垃圾邮件过滤算法[J];计算机与现代化;2014年02期
相关会议论文 前2条
1 蒋文瑛;王洪伟;;基金管理企业微博营销策略的选择研究——以J公司为例[A];第十一届中国不确定系统年会、第十五届中国青年信息与管理学者大会论文集[C];2013年
2 刘勇;王永庆;;掘金社会化媒体[A];第九届(2014)中国管理学年会——管理与决策科学分会场论文集[C];2014年
相关博士学位论文 前7条
1 闫幸;企业微博互动对消费者品牌忠诚和购买意愿的影响机制研究[D];华中科技大学;2013年
2 刘行军;微博用户及其信息传播影响因素研究[D];华中师范大学;2013年
3 方益权;马克思主义政治哲学视域下的网络危机事件研究[D];浙江大学;2013年
4 王少剑;移动微博技术对农村基本公共服务绩效的作用机理研究[D];浙江大学;2014年
5 王玉华;网络公共事件传播中微博伦理失范与规制研究[D];中国科学技术大学;2014年
6 闫幸;企业微博互动对消费者品牌忠诚和购买意愿的影响机制研究[D];华中科技大学;2013年
7 周鹏;面向危机事件感知的微博信息加工方法研究[D];华中科技大学;2013年
相关硕士学位论文 前10条
1 庞胜楠;电视媒体与社交媒体互动研究[D];山东师范大学;2013年
2 代琳娜;微博污染传播模型的研究与应用[D];郑州大学;2013年
3 颜冰凤;微博的思想政治教育功能及其实现研究[D];西南大学;2013年
4 曹嘉健;微时代下的文化狂欢:聚焦微博的传媒社会学解读[D];华东师范大学;2013年
5 王惟迅;中国微博客平台下网络营销效果影响因素探究[D];北京邮电大学;2013年
6 闫红秀;基于微博的小学品德与社会主题探究学习活动设计[D];河北大学;2013年
7 崔婉虹;我国微博扩散普及的影响因素研究[D];河北大学;2013年
8 张磊;从混沌的微博信息到有序的情报收集[D];西南大学;2013年
9 葛彦菲;基于社会网络分析的涉农微博交流特性研究[D];南京农业大学;2012年
10 艾文婧;微博平台的信息碎片化研究[D];陕西师范大学;2012年
本文编号:1669000
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1669000.html