微博内作弊和推广联盟的检测算法研究
本文选题:微博 + 推广联盟 ; 参考:《大连理工大学》2013年硕士论文
【摘要】:近几年来,微博类型的社交网络作为新兴的网上交流平台,已经受到大众的强烈欢迎。然而这类平台在给大家带来便利的同时,也给营销者和作弊者提供了传播信息的平台。不少的作弊账户开始在社交网络上开始作弊行为,而且据有效统计,社交网络上的作弊成功率远高于邮件和搜索引擎作弊行为。 据研究发现,在微博上已经存在大量的推广联盟和作弊联盟,这样的联盟比传统的作弊方式,比如垃圾邮件方式,或者单一的推广或者作弊账户的危害大的多,严重影响了微博的安全环境。不论是推广联盟还是作弊联盟,他们都控制大量的微博账户来帮助他们传播对正常用户来说无用的或者有害的信息。由于掌控着大量的账户,信息的传播范围就会比掌控单一账户来传播的范围要大得多,因此从推广或者作弊联盟中传播出来的信息会影响更多的正常用户。由于传统的检测方法主要是检查单个的账户或者单条微博,而不是将整个的联盟查找出来,因此,急需一种方法来将微博内的推广和作弊联盟检测出来,以保证微博平台的可靠性和安全性。 在这篇文章中,研究了很多的已有的工作,提出了一种可靠的框架来同时检测作弊和推广联盟。这个框架主要由三部分组成,首先将那些为了同样目的而发布URL的账户连接起来组成一个用户图,然后从这个用户图中提取可能是为了作弊或者推广目的而存在的候选联盟,最后提取联盟的特征来区分它们的目的。这个框架中最重要的一部分就是一种由链接驱动的估计算法,来估计微博账户发布链接的目的之间的相似度。另-个重要的贡献是为区分联盟目的而提出了很多有用的特征,然后用可靠的分类算法来对他们的目的进行分类。最终在大规模的微博数据集上的实验结果表明,这个框架对检测微博内推广和作弊联盟有较高的准确度,而且能准确地区分它们的实际目的。
[Abstract]:In recent years, Weibo type social networks as a new online communication platform, has been strongly welcomed by the public. However, such platforms not only provide convenience, but also provide a platform for marketers and cheaters to disseminate information. Many cheating accounts begin to cheat on social networks, and according to effective statistics, the success rate of cheating on social networks is much higher than that on email and search engines. According to research, there are already a large number of promotion alliances and cheating coalitions on Weibo, which are far more harmful than traditional cheating methods, such as spam, or a single promotion or cheating account. The security environment of Weibo is seriously affected. Both promotion and cheating coalitions control a large number of Weibo accounts to help them spread information that is useless or harmful to normal users. With a large number of accounts under control, information can spread much more widely than a single account, so information from promotion or cheating coalitions can affect more regular users. Because the traditional detection method is mainly to check a single account or a single Weibo, rather than find out the whole alliance, so it is urgent to use a method to detect the promotion and cheating alliance in Weibo. To ensure the reliability and security of Weibo platform. In this paper, we study a lot of existing work and propose a reliable framework to detect cheating and promote coalitions at the same time. The framework consists of three parts, which first connect accounts that publish URL for the same purpose to form a user graph, and then extract candidate coalitions that may exist for cheating or promotion purposes. Finally, the features of the alliance are extracted to distinguish their purpose. The most important part of this framework is a link-driven estimation algorithm to estimate the similarity between the purposes of Weibo account publishing links. Another important contribution is that many useful features are proposed to distinguish the purpose of a coalition, and then their purposes are classified by a reliable classification algorithm. Finally, the experimental results on large scale Weibo datasets show that the framework has high accuracy in detecting Weibo extension and cheating coalitions, and it can accurately distinguish their actual purpose.
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP393.092
【相似文献】
相关期刊论文 前10条
1 白振锋;萧宝瑾;;智能天线自适应波束赋形算法的研究[J];山西电子技术;2007年01期
2 刘晨;杨鹏;吕文生;;体视化技术及其在地下采矿方法设计系统中的应用研究[J];中国矿业;2006年01期
3 刘晨;杨鹏;吕文生;;基于体视化技术的地下采矿方法设计系统研究[J];矿业工程;2006年02期
4 尤齐;徐昌彪;毕元梅;祁彦;;容断网络中的组播路由算法研究[J];数据通信;2008年03期
5 戴光明,李庆华;三维体可视化若干问题研究[J];计算机工程;2002年07期
6 杨小明;罗云;;ISODATA算法的实现与分析[J];采矿技术;2006年02期
7 王建文;李迅;张辉;马宏绪;;递归贝叶斯估计框架下的非线性滤波算法综述[J];计算机科学;2010年08期
8 吴文生;一种新的外存分类法[J];微计算机应用;1989年05期
9 章毓晋;客观的图象质量测度及其在分割评价中的应用[J];电子与信息学报;1997年01期
10 闵华清;卢炎生;蒋晓宇;;基于共同进化计算的分类规则算法[J];华南理工大学学报(自然科学版);2006年06期
相关会议论文 前10条
1 黄孜祺;肖健;陈海玲;;数据挖掘技术的比较[A];广西计算机学会2008年年会论文集[C];2008年
2 孙向军;刘凯龙;王世鑫;庞海洋;;基于决策树的数据挖掘模型研究[A];'2006系统仿真技术及其应用学术交流会论文集[C];2006年
3 瞿俊;姜青山;董槐林;;基于高斯混合模型的层次聚类算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
4 关菁华;刘大有;贾海洋;;自适应多分类器集成学习算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
5 何文趋;何玉章;;一种数据库文件的外分类算法[A];第十届全国数据库学术会议论文集[C];1992年
6 刘星毅;;基于欧式距离的最近邻改进算法[A];广西计算机学会2010年学术年会论文集[C];2010年
7 刘智;;基于Hough变换的四边形分类识别算法研究[A];广西计算机学会2010年学术年会论文集[C];2010年
8 鲁新平;乌恩;张焱;李吉成;杨卫平;;基于背景差分的弱信号目标检测技术[A];第九届全国光电技术学术交流会论文集(下册)[C];2010年
9 丁旭;张韵农;李丹;;基于MIMO-OFDM系统的信道估计算法综述[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
10 周星;高志军;胡震宇;唐平;;月面巡视探测器立体匹配技术研究与仿真分析[A];中国宇航学会深空探测技术专业委员会第七届学术年会论文集[C];2010年
相关博士学位论文 前10条
1 汪庆淼;基于目标函数的模糊聚类新算法及其应用研究[D];江苏大学;2014年
2 李小冬;核极限学习机的理论与算法及其在图像处理中的应用[D];浙江大学;2014年
3 李守晓;电学成像算法及气固两相流研究[D];天津大学;2012年
4 尹晓;基因组重组排序问题的算法研究[D];山东大学;2010年
5 徐迪红;复杂背景下的交通标志检测和分类算法研究[D];武汉大学;2010年
6 高小方;流形学习中的若干问题研究[D];山西大学;2011年
7 胥海威;基于改进随机聚类决策森林算法的遥感影像分类研究[D];中南大学;2012年
8 黄浩;基于近邻关系的稀有类挖掘[D];浙江大学;2012年
9 蔡先发;基于图的半监督算法及其应用研究[D];华南理工大学;2013年
10 史伟光;基于射频识别技术的室内定位算法研究[D];天津大学;2012年
相关硕士学位论文 前10条
1 鲁铮;基于T-RBM算法的DBN分类网络的研究[D];吉林大学;2014年
2 王璐;切割与布局问题的算法分类研究[D];北京交通大学;2009年
3 郑建光;基于特征值的波束形成(EBB)方案研究[D];南京邮电大学;2011年
4 朱小林;基于社团发现算法的船舶主机系统故障诊断研究[D];大连海事大学;2012年
5 王晓丹;基于小波变换的自适应滤波算法的分析与应用[D];延边大学;2008年
6 王会岩;基于Curvelet变换和改进Isomap算法的人耳识别[D];重庆大学;2013年
7 肖托;一种改进的支持向量数据描述算法[D];哈尔滨工程大学;2013年
8 陈昊;加权K-NN算法及其应用[D];河北大学;2005年
9 黄杰;KNNModel算法的改进及其应用[D];福建师范大学;2011年
10 宋一川;基于QPSO优化及平均每跳距离修正的SQDV-HOP算法[D];吉林大学;2013年
,本文编号:1895455
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1895455.html