社交网络中的用户行为特征分析与挖掘
发布时间:2017-09-17 10:41
本文关键词:社交网络中的用户行为特征分析与挖掘
更多相关文章: 社交网络 微博用户行为 spam问题 支持向量机
【摘要】:可以说自从有了人类以来就产生了社交网络,而研究人类在社交网络中的行为模式与相互作用原理一直是学术界的热门领域。然而针对真实的人类社交网络,由于数据采集、试验困难等的限制,对社交网络的研究一直停留在定性分析的层面。各种在线社交应用的流行带来了数据量的激增,海量的用户行为数据被记录下来。这为我们更好的研究社交网络中的人类行为带来了便利。 本文以复杂网络理论为基础,以新浪微博平台为数据来源,从宏观层面和微观层面对微博用户的行为特征进行了分析。宏观层面上对微博用户行为产生的用户网络特征进行了实证统计研究,验证了微博网络的小世界特性和无标度特性,与复杂网络特性相吻合,奠定了后续研究的基础;微观层面上对微博用户的个体属性,发微博行为和微博转发行为进行了实证分析,并通过对比分析,对微博上spam用户的行为进行建模。然后首次提出了利用增量学习的支持向量机(I-SVM)算法结合spam用户行为模型对其进行动态检测的方法,并进行实验验证了该方法的有效性。 实验表明此方法准确率高,并且可以有效应对spam用户行为的动态性问题。而且基于支持向量机算法对数据维度不敏感的优点,此方法的运行效率高,可以应对大规模数据集的处理。
【关键词】:社交网络 微博用户行为 spam问题 支持向量机
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.092
【目录】:
- 摘要4-5
- ABSTRACT5-9
- 第一章 绪论9-15
- 1.1 研究背景及意义9-11
- 1.2 研究现状11-12
- 1.3 本文的主要研究工作12-13
- 1.4 本文的组织结构13-15
- 第二章 社交网络中的用户行为模型15-29
- 2.1 社交网络宏观特征分析理论15-18
- 2.1.1 度与度分布(Degree & Degree Distribution)15-16
- 2.1.2 平均路径长度(Mean Path Length)与网络直径(Network Diameter)16
- 2.1.3 聚类系数(Clustering Coefficient)16-17
- 2.1.4 介数(Betweenness)17
- 2.1.5 度相关性(Degree Correlation)17-18
- 2.2 社交网络模型18-21
- 2.2.1 规则网络18
- 2.2.2 ER随机图18-19
- 2.2.3 WS小世界网络模型19-20
- 2.2.4 BA无标度网络20-21
- 2.3 社交网络用户行为研究21-23
- 2.3.1 用户行为的实证统计研究21-22
- 2.3.2 用户行为的模型理论研究22-23
- 2.4 社交网络中spam行为分析23-26
- 2.5 社交网络上spam问题的检测方法26-28
- 2.5.1 微博平台的反spam问题机制26-27
- 2.5.2 基于微博内容的检测方法27
- 2.5.3 基于微博用户分析的检测方法27-28
- 2.6 本章小结28-29
- 第三章 微博网络用户行为实证研究29-47
- 3.1 数据集采集与存储29-38
- 3.1.1 数据集获取29-30
- 3.1.2 抓取系统30-32
- 3.1.3 数据结构化与存储32-34
- 3.1.4 数据预处理34-35
- 3.1.5 数据全文检索35-38
- 3.2 新浪微博网络的网络特性分析38-41
- 3.2.1 新浪微博的无标度特性分析39-40
- 3.2.2 新浪微博网络的小世界特性分析40-41
- 3.3 新浪微博用户行为实证分析41-46
- 3.3.1 新浪微博用户发微博行为实证分析41-42
- 3.3.2 新浪微博用户的微博转发行为实证分析42-46
- 3.4 本章小结46-47
- 第四章 新浪微博用户行为研究与SPAM用户检测47-61
- 4.1 微博spam用户行为模式分析与特征向量提取47-52
- 4.2 支持向量机(Support Vector Machine)52-55
- 4.2.1 线性可分支持向量机52-54
- 4.2.2 非线性支持向量机54
- 4.2.3 常用的核函数54-55
- 4.3 支持向量机的增量学习55-56
- 4.4 spam用户检测系统56-58
- 4.5 测试与实验分析58-59
- 4.6 本章小结59-61
- 第五章 总结和下一步工作61-63
- 5.1 全文总结61
- 5.2 下一步工作展望61-63
- 参考文献63-65
- 致谢65-67
- 攻读学位期间发表的学术论文目录67
【参考文献】
中国期刊全文数据库 前3条
1 李楠楠;周涛;张宁;;人类动力学基本概念与实证分析[J];复杂系统与复杂性科学;2008年02期
2 李楠楠;张宁;周涛;;人类通信模式中基于时间统计的实证研究[J];复杂系统与复杂性科学;2008年03期
3 汪秉宏;韩筱璞;;人类行为的动力学与统计力学研究[J];物理;2010年01期
,本文编号:868975
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/868975.html