微博关键用户和用户社区网络挖掘研究
发布时间:2017-09-02 06:38
本文关键词:微博关键用户和用户社区网络挖掘研究
更多相关文章: 社区网络 关键用户 特征分析 用户关系 挖掘算法
【摘要】:自从国内微博兴起以来,我国的互联网领域发展迅猛,特别是社会化媒体更是日新月异。微博已经成为工具应用到大众的日常生活、学习和工作中。微博平台产生的用户数据量巨大。庞大的信息在当今的信息高速公路(互联网)上迅速传播到每个角落,微博正在悄然改变着人们的信息获取方式,彻底改变了新闻的传播方式,同时也给更多的草根阶层融入社会并参与社会活动带来革命性的影响。在国内,以新浪微博为代表的Web2.0时代迅速崛起,2014年8月15日,新浪对外公告显示,新浪微博拥有超1.56亿的活跃用户,他的用户注册量已经超过了6亿,并且每天有超过6140万活跃用户驻留在新浪微平台。根据微博平台规则,每一个微博用户都有一个关注列表,该列表为微博用户接受信息提供依据。研究人员称其为信息传递频道,微博用户之间通过关注与另一个微博用户形成联系,微博平台上所有用户之间的关联关系就构成了一个庞大的微博用户社区网络。本文分析了微博用户个体以及微博用户群体的属性特征,利用微博开放平台API获取用户数据并导入My SQL数据库,在基本的用户社区网络挖掘算法基础上提出新的改进挖掘方法。这些研究将对微博舆情控制、网络安全、好友推荐、电子商务等具有实际意义。本文研究主要内容可以分为三个方面,如下:一、本文分析了新浪微博开放平台使用特点。分别阐述微博开放平台API和网络爬虫两种常用的数据获取方式。分析给出两种数据获取手段的优劣。本文采用多用户频率控制的API调用获取新浪微博用户数据。对用户数据做了抽取、清洗等预处理工作,最后把清理后的用户数据存储到My SQL数据库中。二、本文对微博平台上关键用户的识别进行设计。阐述了微博用户特征的属性的含义,并对这些属性归类成他人和个人两类影响因子。利用微博用户的敏感属性特征对关键用户进行识别发现。定义了微博关键用户识别的定量化计算公式,给出了微博关键用户识别的模型,并进行试验对比分析。三、本文对微博平台上用户之间形成的虚拟社区网络进行挖掘。利用微博用户社区网络图概念,从挖掘算法、挖掘流程以及挖掘结果的评价三个方面阐述实现过程。提出了改进的用户相似度模型的层次聚类挖掘方法对微博用户社区进行聚类分析,实验结果表明社区挖掘效果有所提升。
【关键词】:社区网络 关键用户 特征分析 用户关系 挖掘算法
【学位授予单位】:南华大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.13;TP393.092
【目录】:
- 摘要4-6
- Abstract6-12
- 第1章 绪论12-18
- 1.1 研究背景与意义12-14
- 1.1.1 研究背景12-13
- 1.1.2 研究意义13-14
- 1.2 研究现状14-16
- 1.3 本文的结构与内容16-18
- 第2章 相关概念和技术18-24
- 2.1 新浪微博简介18-19
- 2.1.1 服务功能18
- 2.1.2 使用特点18-19
- 2.2 关键用户挖掘19-20
- 2.2.1 关键用户的概念19-20
- 2.2.2 关键用户挖掘技术20
- 2.3 社区网络挖掘20-23
- 2.3.1 社区网络概念20-22
- 2.3.2 社区网络挖掘技术22-23
- 2.4 本章小结23-24
- 第3章 微博用户数据的抽取和存储24-44
- 3.1 用户数据抽取方式24-39
- 3.1.1 新浪微博开放平台24-26
- 3.1.2 网络爬虫模拟登陆26-32
- 3.1.3 两种获取数据的方法对比32-34
- 3.1.4 多用户多应用轮回切换调用API34-39
- 3.2 数据解析和存储39-41
- 3.2.1 数据解析39-40
- 3.2.2 数据存储40-41
- 3.3 本章小结41-44
- 第4章 微博关键用户挖掘44-54
- 4.1 微博关键用户的识别依据44-47
- 4.1.1 微博用户特征44-45
- 4.1.2 微博用户分组45-47
- 4.2 微博用户影响力评价体系47-48
- 4.3 微博关键用户识别模型构建48-52
- 4.3.1 模型指标定量化48-50
- 4.3.2 微博关键用户识别流程50
- 4.3.3 实验及结果50-52
- 4.4 本章小结52-54
- 第5章 微博用户社区网络挖掘54-66
- 5.1 微博用户社区网络特征和相关计算54-56
- 5.1.1 微博用户社区特征54-55
- 5.1.2 微博用户社区网相关计算55-56
- 5.2 挖掘结果的评价和挖掘流程56-59
- 5.2.1 微博用户社区网络挖掘结果评价56-58
- 5.2.2 微博用户社区挖掘流程58-59
- 5.3 基于改进的相似度层次聚类社区网络挖掘59-64
- 5.3.1 微博用户相似度计算59-61
- 5.3.2 微博用户分层聚类划分的实现61-63
- 5.3.3 实验结果63-64
- 5.4 本章小结64-66
- 第6章 总结和展望66-68
- 6.1 论文总结66
- 6.2 进一步展望66-68
- 参考文献68-73
- 攻读硕士学位期间发表的论文73-74
- 致谢74
【共引文献】
中国期刊全文数据库 前10条
1 汤向男;;关系化信息流:微博环境下的“把关人”[J];东南传播;2011年04期
2 罗宜虹;孙玉红;;微博意见领袖的产生、角色、类型分析——以新浪微博为例[J];传播与版权;2014年09期
3 孙秀丽;郑亦麒;;大学生微博创业的困境及转变[J];创新与创业教育;2015年01期
4 陈红;;微博特点及思考[J];华中人文论丛;2012年01期
5 潘景宏;;基于微博的网络营销现状研究[J];吉林省教育学院学报(学科版);2011年12期
6 陈建新;;基于微博的企业营销研究[J];计算机与现代化;2012年12期
7 黄元骋;;我国体育微博把关现状及对策研究[J];哈尔滨体育学院学报;2013年02期
8 罗宜虹;周文平;孙玉红;;微博意见领袖在信息传播中的社会责任——以新浪微博为例[J];河北经贸大学学报(综合版);2014年04期
9 陈华明;李畅;;个体群组关系的构建:微博中的群体认同研究[J];四川大学学报(哲学社会科学版);2012年03期
10 李怀忠;;微博广告传播对策研究——以新浪微博为例[J];商;2013年05期
,本文编号:776965
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/776965.html