社交网络信息传播建模与节点影响力研究
本文关键词:社交网络信息传播建模与节点影响力研究,由笔耕文化传播整理发布。
【摘要】:人类正迈入信息化时代,信息正成为重要的社会财富。随着微博等社交网络的飞速发展,其在网络舆情监控以及广告投放效果评估领域应用得越来越广泛。越来越多的学者开始关注和研究微博网络,微博网络中的信息传播机制研究和影响力评估逐渐成为研究中的热点。本文选取社交网络中使用最为广泛的新浪微博为研究对象,首先利用网络爬虫抓取原始数据,并从中提取出影响用户转发行为因素和用户节点影响力评估指标相关的数据,得到期望数据集;接着在抓取到的数据基础上建立微博消息传播模型——基于转发行为概率预测的加权有向拓扑模型;最后在建立微博消息传播模型的基础上,基于改进Page Rank算法对微博网络中的用户节点进行影响力评估研究。数据的抓取是整个研究的基础。在比较各种网页数据抓取方式的特点之后,选取能够很方便的按照自定义需求进行数据抓取的基于网页爬虫的抓取方式。在抓取到指定规模的原始数据后,根据需要将数据分为微博用户属性和微博内容属性。其中微博用户属性包括用户ID、关注数、粉丝数、微博数量以及是否为认证用户等;微博内容属性包括创建时间、是否包含特殊符号、转发数、评论数等。最后还对数据抓取过程中的关键问题特别是反爬策略等问题进行了分析和解决。在抓取到的数据集的基础上,对微博信息传播机制和传播规律进行研究,并建立基于转发行为预测的微博消息传播模型。针对当前社交网络信息传播的研究侧重于从微观层面出发,对单个用户的转发行为进行分析,而少有从拓扑层面对整个社交网络中的信息传播过程建模的研究。本文首先确定了影响转发行为的特征因素——主要是微博内容与用户兴趣、微博用户的社会关系、微博文本与用户属性以及受激活次数这四个方面。在对这四大类特征因素进行分析的基础上,利用逻辑斯蒂回归模型二分类得到节点间的信息转发概率,进而建立基于转发预测的加权有向拓扑信息传播模型,给出模型的生长演化过程,并在采集到数据集上进行验证实验。实验结果证明所构建的模型能够很好的反映微博网络的网络结构,能够较好的模拟微博网络中的信息传播过程。在构建微博消息传播模型的基础上,本文还对微博网络中用户节点的影响力评估进行了研究,改进网页重要性评估算法Page Rank以适应微博网络的特点,特别是针对算法中投票阶段和缩放机制存在的问题进行了改进。现有的影响力评估研究,一般只简单地考虑微博的转发数和评论数这两个指标的影响,但微博作为新兴的社交媒体,仅考虑微博转发数和评论数已经不能准确的评估消息影响力,因此我们需要对微博网络中消息的传播进行进一步分析,提取更多的特征因素以更好的评估用户节点的影响力。在确定影响力大小衡量指标——主要是信息传播度、传播活跃程度以及传播受众广度后,对Page Rank算法进行改进,主要是针对其投票阶段的平均分配权值的方式忽略了个体重要性差异进行改进,并确定按传播活跃程度和传播度的数值化乘积作为分配PR值的权值,以达到让传播能力强的节点获得更多的投票的目的。最后在数据集上的实验结果表明改进后的算法比原始Page Rank具有更好的命中比例。
【关键词】:微博 信息传播 影响力 Page Rank
【学位授予单位】:东华大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP393.092
【目录】:
- 摘要4-6
- ABSTRACT6-10
- 第一章 绪论10-17
- 1.1 研究背景与意义10-12
- 1.2 研究现状分析12-15
- 1.2.1 社交网络研究现状概述12-14
- 1.2.2 社交网络研究现状问题分析14-15
- 1.3 研究目标与主要内容15-17
- 1.3.1 本文研究目标15
- 1.3.2 本文主要内容15-16
- 1.3.3 本文章节安排16-17
- 第二章 数据集获取17-27
- 2.1 引言17
- 2.2 现有抓取方式及分析17-21
- 2.2.1 基于网络爬虫的微博数据抓取17-19
- 2.2.2 基于新浪API的微博数据抓取19-21
- 2.3 数据抓取关键问题解决21-23
- 2.4 数据采集具体实现23-25
- 2.5 数据采集结果描述25
- 2.6 本章小结25-27
- 第三章 社交网络信息传播建模27-41
- 3.1 引言27
- 3.2 社交网络拓扑与信息传播关系分析27-30
- 3.2.1 网络节点出度与信息传播28-29
- 3.2.2 网络节点入度与信息传播29-30
- 3.3 社交网络用户转发因素分析30-33
- 3.3.1 特征因素提取30-31
- 3.3.2 特征因素分析31-33
- 3.4 社交网络信息转发预测模型建立33-35
- 3.4.1 模型初始化33
- 3.4.2 模型的生长演化33-35
- 3.5 社交网络信息传播结果分析35-39
- 3.5.1 外部参数对网络结构的影响35-36
- 3.5.2 网络节点度分布36-37
- 3.5.3 网络节点势分布37-38
- 3.5.4 网络节点度-势相关性38
- 3.5.5 网络聚集特性38-39
- 3.6 本章小结39-41
- 第四章 基于PageRank算法改进的用户影响力度量研究41-58
- 4.1 引言41
- 4.2 用户影响力分析41-44
- 4.2.1 影响力定义41-42
- 4.2.2 用户影响力关键因素分析42-44
- 4.3 PageRank算法分析44-50
- 4.3.1 收缩机制存在问题46-49
- 4.3.2 投票阶段存在问题49-50
- 4.4 改进算法的提出50-53
- 4.4.1 PR值分配比例计算50-51
- 4.4.2 收缩机制的改进51
- 4.4.3 邻居节点差异性的改进51-53
- 4.5 算法实验结果分析53-57
- 4.5.1 实验数据集描述54
- 4.5.2 实验结果与分析54-57
- 4.6 本章小结57-58
- 第五章 结束语58-60
- 5.1 结论58-59
- 5.2 本文的创新点59
- 5.3 下一步研究工作展望59-60
- 致谢60-61
- 研究生期间参加的科研工作及成果61-62
- 参考文献62-63
【相似文献】
中国期刊全文数据库 前10条
1 刘耀;王锦贵;;网络信息传播的技术控制:模式与评价研究[J];情报资料工作;2006年01期
2 金镇;毕强;;作为一门学科的网络信息传播[J];情报资料工作;2006年03期
3 张继兰;金镇;;网络信息传播与和谐大连建设研究[J];大连海事大学学报(社会科学版);2006年04期
4 王振新;吴新年;;我国网络信息传播新环境风险分析及对策建议[J];现代情报;2007年01期
5 刘耀;王锦贵;;网络信息传播的技术控制模式研究[J];情报理论与实践;2007年02期
6 金镇;;论网络信息传播的跨学科研究[J];现代情报;2007年07期
7 孟庆兰;;网络信息传播效果分析[J];图书馆学研究;2007年11期
8 许艳;;网络信息传播与知识创新关系研究[J];商场现代化;2008年35期
9 袁淑艳;李永先;;网络信息传播保障体系的构建[J];情报科学;2008年04期
10 邱均平;陈远;倪超群;;论网络信息传播的价值[J];山东社会科学;2009年01期
中国重要会议论文全文数据库 前10条
1 谢金林;;控制,引导还是对话:网络舆论的政府治理[A];“中国特色社会主义行政管理体制”研讨会暨中国行政管理学会第20届年会论文集[C];2010年
2 严耕;;网络信息的意识形态冲突与社会和谐[A];和谐·创新·发展——首届北京中青年社科理论人才“百人工程”学者论坛文集[C];2007年
3 贺筱媛;胡晓峰;;危机条件下的网络信息传播行为建模方法研究[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
4 韦路;谢点;;全球网络信息传播格局透视——基于世界各国宏观数据的实证分析[A];2014中国传播论坛:“国际话语体系与国际传播能力建设”研讨会会议论文集[C];2014年
5 殷俊;柴樱芝;;民族地区突发事件的信息传播与舆论引导——从“玉树地震”网络信息传播看网络舆论引导力的提升[A];中国少数民族地区信息传播与社会发展论丛(2010年刊)[C];2010年
6 毛牧然;范卿瑞;;论辽宁省网络舆论正负向价值的引导与管控[A];第十届沈阳科学学术年会论文集(经济管理与人文科学分册)[C];2013年
7 郭华;齐淑娟;;网络环境下更要注重创新[A];第五届全国核心期刊与期刊国际化、网络化研讨会论文集[C];2007年
8 帅庆;;论网络中女性的权益保护[A];2009年中国社会学年会“中国社会变迁与女性发展”论坛论文集[C];2009年
9 王烨;;论网络信息的意识形态属性对现实社会的影响[A];吉林省行政管理学会“政府管理创新与转变经济发展方式”学术年会论文集(《吉林政报》2010·专刊2)[C];2011年
10 陈烨;凌秀丽;;网络环境下的图书馆信息传播[A];公共文化服务与图书馆实践的创新——浙江省图书馆学会第十次学术研讨会论文集[C];2006年
中国重要报纸全文数据库 前10条
1 汪磊 广州大学人文学院教授;网络语言热的冷思考[N];中国社会科学报;2010年
2 特约撰稿 江苏省连云港市司法局法制处 吴学安;影视剧呼唤法律保护网络信息传播权[N];民主与法制时报;2014年
3 本报记者 姜锦铭 实习生 唐牛;网络假新闻多,是缺少竞争所致?[N];新华每日电讯;2009年
4 华东政法大学 闫艳;网络法的价值追求[N];检察日报;2010年
5 王晨;发展健康向上的网络文化[N];人民日报;2011年
6 本报记者 李悦春;发展健康向上的网络文化[N];云南日报;2011年
7 张玉胜;网络执政能力当为官员“必修课”[N];中国新闻出版报;2012年
8 记者 李川 实习生 杨彬驰;营造安全稳定可靠有序的网络环境[N];天津日报;2014年
9 科学导报评论员 高乐乐;让网络医疗信息有法可依[N];科学导报;2014年
10 本报记者 顾汶;网络媒体路在何方[N];中国高新技术产业导报;2001年
中国博士学位论文全文数据库 前4条
1 胡青青;网络热词的伦理研究[D];湖南师范大学;2015年
2 唐朝生;在线社交网络信息传播建模及转发预测研究[D];燕山大学;2014年
3 李超;基于多维属性的社会网络信息传播模型研究[D];中国科学院深圳先进技术研究院;2014年
4 罗莉;网络信息传播中的法律问题研究[D];中国政法大学;2001年
中国硕士学位论文全文数据库 前10条
1 陈靖;网络道德建设的问题与出路[D];山东师范大学;2007年
2 王振新;网络信息传播风险分析及对策研究[D];中国科学院研究生院(文献情报中心);2007年
3 张驰;完善网络信息传播监管机制研究[D];中国社会科学院研究生院;2012年
4 张伟;大规模复杂网络信息传播平台关键技术研究[D];河北师范大学;2015年
5 李亮;我国网络文学实体出版中的问题研究[D];河北大学;2015年
6 吴嵩倩;网络时代的社会控制[D];南京信息工程大学;2015年
7 黄丹丽;论网络舆论对大学生思想观念的影响及应对策略[D];南京信息工程大学;2015年
8 孙冉;网络时代中国共产党党群沟通研究[D];兰州大学;2015年
9 刘思慧;网络时代条件下执政党建设研究[D];郑州大学;2015年
10 闫淼;网络围观的成因及传播特征探析[D];山东大学;2015年
本文关键词:社交网络信息传播建模与节点影响力研究,,由笔耕文化传播整理发布。
本文编号:339789
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/339789.html