基于用户特征的社会化媒体社团检测研究
本文关键词:基于用户特征的社会化媒体社团检测研究
【摘要】:随着Web2.0时代网络应用与移动终端设备的蓬勃发展,社会化媒体如雨后春笋般涌现,社会化媒体主张以用户为中心,鼓励用户创造内容。人们不仅将真实生活中的好友关系搬到了互联网上,还建立了不同于线下关系的线上虚拟朋友关系,如对名人、专业领域或娱乐公众号等添加关注,构建起全新的沟通与交流平台。当用户的好友规模日益壮大,发现沟通的效率反而大不如前,所有的朋友和公众账号每天发布的信息都会出现在用户的主页上,而用户主要关心的可能是某个朋友某方面主题的更新。过滤用户并不是真正关心的内容是社会化媒体必须解决的问题,这一问题的核心是如何正确真正地对用户的朋友圈进行分组。针对用户朋友圈分类模糊的问题,本文深入研究了社会化媒体的用户特征,得出两种在不同情形下适用的朋友圈检测算法:基于用户关系结构的社团检测算法和基于用户特征的社团检测算法。前一种算法适用于缺少用户基本特征的情形,从用户相互关注产生的关系拓扑结构入手,通过改进NJW多路谱聚类算法,使得算法可以对输入用户关系网络自动聚类。后一种算法适用于用户特征数据较完整的情形,综合考虑了用户基本特征和用户关系特征,并能根据用户个人网络的发展阶段,调节这两种特征相似性的比例。本文的主要研究成果为:(1)深入研究社会化媒体用户特征,将用户特征分为用户基本特征和用户行为特征,并对用户关系模型进行深入分析。本文还详细地阐述了通过爬虫技术来获取社会化媒体用户特征数据所遇到的两个技术难点。(2)基于用户关系结构的社团检测算法,对输入用户关系结构进行谱分析,由扰动理论中最大本征间隙所在位置与输入网络拓扑之间存在的关系,得到聚类数目,从而弥补了NJW多路谱聚类算法在确定聚类数目方面的不足,增强算法的自动性。(3)基于用户特征的社团检测算法,认为拥有共同好友数与相同特征背景的用户更易成为朋友,综合考虑了用户关系特征和用户基本特征,并能根据用户个人网络的发展阶段,调节两种特征的相似性的比例。最后,通过边聚类算法,将用户的个人网络进行聚类。
【关键词】:社团检测 用户特征 谱聚类 本征间隙
【学位授予单位】:江苏科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:O157.5;TP311.13
【目录】:
- 摘要5-6
- Abstract6-12
- 第1章 绪论12-16
- 1.1 研究背景12-13
- 1.2 国内外研究现状13-14
- 1.3 本文工作14-15
- 1.4 本文组织结构15-16
- 第2章 复杂网络与社团检测16-26
- 2.1 复杂网络理论16-22
- 2.1.1 复杂网络的发展与定义16-17
- 2.1.2 复杂网络基本理论17-21
- 2.1.3 复杂网络的特性21-22
- 2.2 社团检测算法22-25
- 2.2.1 社团的定义22-23
- 2.2.2 基于模块度的社团检测算法23
- 2.2.3 基于层次的社团检测算法23-25
- 2.2.4 基于谱的社团检测算法25
- 2.2.5 基于网络动力学的社团检测算法25
- 2.3 本章小结25-26
- 第3章 谱聚类算法26-32
- 3.1 谱聚类算法理论基础26-30
- 3.1.1 图划分准则26-28
- 3.1.2 谱聚类算法相关矩阵28-30
- 3.1.3 Fiedler向量与谱30
- 3.2 谱聚类算法的一般过程30-31
- 3.3 本章小结31-32
- 第4章 用户特征与特征数据获取技术32-42
- 4.1 社会化媒体32
- 4.2 用户特征32-35
- 4.2.1 用户基本特征33
- 4.2.2 用户行为特征33-34
- 4.2.3 用户关系模型34-35
- 4.3 特征数据获取技术35-41
- 4.3.1 四种常用数据获取技术36
- 4.3.2 技术难点36-37
- 4.3.3 模拟登录37-40
- 4.3.4 动态数据获取40-41
- 4.4 本章小结41-42
- 第5章 基于用户关系结构的社团检测算法42-48
- 5.1 NJW算法42
- 5.2 基于用户关系结构的社团检测算法42-44
- 5.3 实验过程44-47
- 5.3.1 实验环境44
- 5.3.2 实验数据44-45
- 5.3.3 结果与分析45-47
- 5.4 本章小结47-48
- 第6章 基于用户特征的社团检测算法48-58
- 6.1 用户特征相似性模型48-50
- 6.1.1 边聚类48
- 6.1.2 用户基本特征相似性48-49
- 6.1.3 用户关系特征相似性49-50
- 6.1.4 连边相似性50
- 6.2 基于用户特征的朋友圈检测算法50-53
- 6.3 特征提取53-54
- 6.4 实验过程54-57
- 6.4.1 实验环境54
- 6.4.2 实验数据54-55
- 6.4.3 评价标准55-56
- 6.4.4 结果与分析56-57
- 6.5 本章小结57-58
- 总结与展望58-60
- 参考文献60-64
- 攻读硕士学位期间所发表的学术论文64-66
- 致谢66-67
- 详细摘要67-68
【相似文献】
中国期刊全文数据库 前10条
1 王乐鹏;李春丽;王颖;;社交电视——社会化媒体发展的新趋势[J];科技广场;2013年09期
2 刘松涛;;社会化媒体概述与发展趋势[J];科技信息;2014年03期
3 汪彦;;对社会化媒体盈利模式及功能局限性的思考——以新浪微博为例[J];中国科技信息;2013年07期
4 张伦;;基于社会化媒体的信息传播行为:理论与实践的变革[J];科学与社会;2014年01期
5 肖明超;;微博:加速的公众数字风潮与营销猜想[J];科技智囊;2010年11期
6 唐兴通;;2012新媒体营销的8个看点[J];科技智囊;2012年02期
7 邓莎莎;张朋柱;张晓燕;李欣苗;;基于欺骗语言线索的虚假评论识别[J];系统管理学报;2014年02期
8 薛晓丽;樊彩锋;;高校传统影院社会化媒体营销推广探析——以华大青年剧场为例[J];科技创业月刊;2011年13期
9 李震;;基于AISAS模式的社会化媒体营销研究[J];技术与创新管理;2012年04期
10 张焱;王利红;;幸福感、积极情绪与工作绩效的实证研究——基于社会化媒体和MBA群体[J];科技创业月刊;2012年05期
中国重要会议论文全文数据库 前6条
1 王岚;;利用社会化媒体进行新媒体内容传播[A];中国新闻技术工作者联合会2013年学术年会、五届五次理事会暨第六届“王选新闻科学技术奖”和优秀论文奖颁奖大会论文集(广电篇)[C];2013年
2 吕天鹤;;论社会化媒体对科层制的冲击——以微博为例[A];“传播与中国·复旦论坛”(2013)——网络化关系:新传播与当下中国论文集[C];2013年
3 李艳丽;;社会化媒体在体育产业中的应用现状与发展策略研究[A];2013体育计算机应用论文集[C];2013年
4 华迎;王永贵;李兵;;社会化媒体中用户创造内容(UGC)采纳行为影响因素研究[A];2013中国信息经济学会学术年会暨博士生论坛论文集[C];2013年
5 刘涛;杨有庆;;社会化媒体与都市空间的社会化表征[A];“传播与中国·复旦论坛”(2012)——可沟通城市:理论建构与中国实践论文集[C];2012年
6 信莉丽;庄严;;美联社微博新闻本土化研究[A];2014中国传播论坛:“国际话语体系与国际传播能力建设”研讨会会议论文集[C];2014年
中国重要报纸全文数据库 前10条
1 本报记者 胡海波 编译;社会化媒体:危机公关的利器[N];中国民航报;2011年
2 杨吉;社会化媒体对企业意味着什么[N];上海证券报;2013年
3 杨吉;社会化媒体对企业意味着什么[N];中华读书报;2013年
4 杨吉 法学博士 浙江传媒学院互联网与社会研究中心秘书长;社会化媒体企业意味着什么[N];中国图书商报;2013年
5 本报记者 周婷;社会化媒体掀起营销浪潮[N];中国证券报;2010年
6 祝华新;社会化媒体:社会管理新挑战[N];人民政协报;2011年
7 本报记者 李延生;借力社会化媒体[N];中国企业报;2011年
8 记者 李思;社会化媒体“遍地开花”[N];上海金融报;2011年
9 任沁沁 胡雅婷;梦想成真,社会化媒体正在融入生活[N];新华每日电讯;2012年
10 上海社科院信息研究所知识管理研究中心主任、副研究员 王兴全;“数字化野火”:风险与治理[N];文汇报;2013年
中国博士学位论文全文数据库 前10条
1 赵宇翔;社会化媒体中用户生成内容的动因与激励设计研究[D];南京大学;2011年
2 丁方舟;中国网络行动的动因、过程与影响[D];浙江大学;2015年
3 姚远;面向社会化媒体的用户生成内容推荐技术研究[D];南京大学;2015年
4 朱文龙;社会化媒体调查的适用性与模式效果研究[D];电子科技大学;2014年
5 刘欣;面向社会化媒体的内容推荐若干关键技术研究[D];北京邮电大学;2015年
6 潘p,
本文编号:1083204
本文链接:https://www.wllwen.com/kejilunwen/yysx/1083204.html