社交媒体中协作用户检测
本文关键词:社交媒体中协作用户检测,,由笔耕文化传播整理发布。
【摘要】:社交媒体的快速发展吸引了大量用户,从而迅速成为企业和个人进行营销和推广活动的重要场所。在这些活动中,通过帐号的有组织协作行为,可以迅速产生相似信息的大量重复出现,从而提高信息的展示次数,影响普通用户。协作行为的发现与过滤对于垃圾信息清理、舆情分析、精准营销都具有重要作用。然而,由于社交媒体数据量大、数据更新迅速、协同行为相对密度低,社交媒体中准确、高效地协作行为发现具有重要的研究意义。本文研究了社交媒体中的协作行为和协作用户发现问题,主要贡献如下:1.对社交媒体中采用协作行为进行营销和推广的手段进行了分类,定义并描述了四种典型的协作行为用户,对它们的协作行为特征、用户特征、数据特征进行了分析,并分别设计了协作行为检测方法,为社交媒体协作行为发现与过滤确定了框架。2.提出了基于局部敏感哈希(Locality-sensitive Hashing, LSH)的社交媒体消息重复性检测方法,及其高效MapReduce实现,以发现协作行为用户所产生的大量近似重复性消息。这一方法所检测到的协作行为用户与其它用户具有明显不同的用户信息、社交网络结构,以及行为模式。实验结果表明,该方法能够有效定位隐式与显式营销帐号。3.利用帐号的转发特征,提出了基于主题模型的社交媒体协作行为和协作帐号组发现方法。该方法首先利用帐号与消息、帐号与帐号之间的关系,确定帐号的转发画像(retweet profile,RP),并利用LDA方法,发现具有相似行为特征的帐号组。接着,我们基于少量训练数据,利用标签传递方法,对协作行为帐号进行分类,从而确定协作账号组。实验结果表明,该方法能够有效发现水军与傀儡帐号小组。4.本文的研究基于200万微博帐号的5年消息,整理了包含1.8万协作帐号及其消息内容、行为记录的训练数据集。通过实验,验证了所提方法的有效性,并为后续相关研究,提供了扎实的数据资源。综上所述,本文从营销和推广行为检测应用需求、协作行为发现、协作帐号与帐号组的发现这三个方面开展了研究,在一个统一的框架下,提出了两种协作行为和帐号发现方法,并通过海量真实数据上的实验,验证了方法的有效性。
【关键词】:社交媒体 协作行为发现 重复检测 主题模型 垃圾消息检测
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.092
【目录】:
- 摘要6-7
- Abstract7-12
- 第一章 绪论12-16
- 1.1 研究背景与意义12-14
- 1.2 本文工作14-15
- 1.3 本文结构15-16
- 第二章 相关工作16-26
- 2.1 社交媒体用户行为分析16-18
- 2.2 垃圾信息检测18-20
- 2.3 社交媒体垃圾用户检测20-24
- 2.3.1 垃圾用户检测21-23
- 2.3.2 垃圾用户群体检测23-24
- 2.4 本章小结24-26
- 第三章 社交媒体数据模型与问题描述26-34
- 3.1 数据模型26-29
- 3.1.1 用户信息26
- 3.1.2 社交网络26-27
- 3.1.3 时间轴与微博27-29
- 3.2 问题描述29-32
- 3.3 本章小结32-34
- 第四章 基于近似重复性检测的垃圾用户过滤算法34-50
- 4.1 基于内容的检测框架介绍34-35
- 4.2 文本相似度计算35-37
- 4.3 基于哈希函数的算法37-43
- 4.3.1 最小哈希37-39
- 4.3.2 面向最小哈希的LSH39-41
- 4.3.3 算法优化41-43
- 4.4 实验与分析43-49
- 4.4.1 数据集与预处理43-44
- 4.4.2 性能测试44-45
- 4.4.3 用户行为分析45-49
- 4.5 本章小结49-50
- 第五章 协作转发用户过滤方法50-84
- 5.1 协作用户及协作用户群体过滤框架50-52
- 5.2 基于主题模型的社区发现52-57
- 5.2.1 LDA介绍52-54
- 5.2.2 用户社区发现54-57
- 5.3 基于账号-消息关系的特征提取57-63
- 5.3.1 转发关系建模57-62
- 5.3.2 用户相似度计算62-63
- 5.4 基于账号-账号关系的特征提取63-67
- 5.4.1 基于转发拓扑结构64
- 5.4.2 基于转发拓扑结构和内容64-67
- 5.5 半监督协作转发垃圾用户分类方法67-71
- 5.5.1 标签传递算法68-70
- 5.5.2 基于RP-LDA的标签传递算法70-71
- 5.5.3 协作垃圾用户群体过滤71
- 5.6 实验与分析71-83
- 5.6.1 数据集71-72
- 5.6.2 直接转发关系构建72-73
- 5.6.3 实验结果73-81
- 5.6.4 垃圾用户群体分析81-83
- 5.7 本章小结83-84
- 第六章 总结与展望84-88
- 6.1 总结84-85
- 6.2 展望85-88
- 附录A 微博数据介绍88-94
- 参考文献94-108
- 致谢108-110
- 攻读硕士学位期间发表论文和科研情况110-111
【相似文献】
中国期刊全文数据库 前10条
1 启程;;社交媒体之“湿”与社会之痛[J];检察风云;2011年17期
2 冯岩;;人文城市发展中的社交媒体管理[J];城市发展研究;2012年03期
3 翟菁;张莉钥;;谱写2011年社交媒体研究“五部曲”[J];今传媒;2012年07期
4 ;伦敦奥运,社交媒体奥运[J];新闻记者;2012年09期
5 ;德国“社交媒体经理”走俏[J];青年记者;2013年10期
6 赵瑞云;;社交媒体客服,重在构建交互方式[J];通信世界;2013年07期
7 阴卫芝;;美国五所高校社交媒体准则研究[J];新闻爱好者;2013年02期
8 颜运梅;;澳大利亚国家图书馆社交媒体的应用与政策解读[J];图书馆建设;2013年08期
9 赵星植;;论社交媒体对“指示符号”的过度使用[J];新闻传播;2013年08期
10 ;调查:社交媒体让人们的生活更美好[J];新闻记者;2014年02期
中国重要会议论文全文数据库 前3条
1 袁靖华;;微博的理想与现实——兼论社交媒体建构公共空间的三大困扰因素[A];数字未来与媒介社会2[C];2010年
2 洪婧茹;;社交媒体与上海大学生的环保参与:从线上关注到线下行动[A];中华新闻传播学术联盟第六届研究生学术研讨会论文集[C];2014年
3 王斌;郑满宁;;扭转“逆差”:社交媒体时代国人形象传播机制及策略[A];新闻学论集(第30辑)[C];2014年
中国重要报纸全文数据库 前10条
1 本报记者 陈晓平;社交媒体重构商业?[N];21世纪经济报道;2011年
2 一鸣;出版商介入社交媒体的危险[N];中国图书商报;2011年
3 Chris Nerney;社交媒体带来的5大安全威胁[N];网络世界;2011年
4 李鑫源;社交媒体影响不容小窥[N];科技日报;2011年
5 陈晓平;社交媒体的“葫芦论”[N];21世纪经济报道;2011年
6 肖明超(新生代市场监测机构副总经理);社交媒体引发营销裂变[N];中国图书商报;2011年
7 朱永磊 贝恩大中华区电信、媒体与高科技业务主管;如何成为社交媒体的长期赢家[N];通信产业报;2012年
8 洪琳;2012年全球社交媒体收入将达到169亿美元[N];人民邮电;2012年
9 商报记者 晓雪;如何用社交媒体赚钱[N];中国图书商报;2012年
10 本报首席记者 王磊;社交媒体权力不能“无需负责”[N];文汇报;2013年
中国硕士学位论文全文数据库 前10条
1 李雪絮;社交媒体广告的表现策略研究[D];浙江理工大学;2013年
2 吕蒙;网络社交媒体关系网络与品牌传播[D];辽宁大学;2013年
3 吴祖宏;大学生手机社交媒体依赖的问卷编制及特点研究[D];西南大学;2014年
4 张茜茹;大学生社交媒体依赖的测量及其与主观幸福感的关系[D];山西师范大学;2015年
5 赵洁;论社交媒体[D];武汉理工大学;2010年
6 庞胜楠;电视媒体与社交媒体互动研究[D];山东师范大学;2013年
7 杨玲;中国社交媒体内容与功能分析[D];武汉理工大学;2013年
8 周春平;奔驰(中国)汽车公司社交媒体营销策略研究[D];上海外国语大学;2014年
9 任庆军;社交媒体对大学生流行文化的影响研究[D];天津师范大学;2014年
10 刘熙荧;中国社交媒体社交模式研究[D];湖南大学;2014年
本文关键词:社交媒体中协作用户检测,由笔耕文化传播整理发布。
本文编号:469088
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/469088.html