基于极性分析的微博信息传播模型研究
本文关键词:基于极性分析的微博信息传播模型研究,,由笔耕文化传播整理发布。
【摘要】:研究微博网络中的信息传播机制,在市场营销、舆情管控等方面都具有重要意义。现有的信息传播模型,大多集中于研究用户网络关系结构对信息传播的影响。而越来越多的现象表明,微博文本的极性分类和极性强度与该信息传播的广度有着积极的关联。本文就是通过研究极性在信息传播中的作用,建立一个融入极性因素的新的信息传播模型,并运用这个模型解决微博影响力最大化问题。极性是指一段评论性文本的情感倾向以及这种倾向的强弱程度,极性分析则是计算这段文本的极性的过程。根据微博的书写特点和表达形式,本文首先提出了一种规则和监督学习相结合的方法,对中文微博的极性进行分类,并计算微博含有的极性强度。然后,通过微博传播关系图和回归模型,定性和定量地验证了极性对微博消息的传播范围和速度的正面影响。接着,将极性特征加入基于用户转发行为预测的逻辑回归模型中,并结合线性阀值传播模型,建立了一种融入极性因素的信息传播模型。最后,我们将这一新模型应用于影响力最大化估计问题中,提出了一种基于主题和极性的微博影响力最大化估计的方法。实验结果表明,极性越强,微博的传播范围就越广,传播速度就越快。我们提出的融入极性因素的信息传播模型能较好地模拟微博的转发传播机制;基于主题和极性的微博影响力最大化估计的方法,也降低了计算时间复杂度,并扩大了影响节点范围。
【关键词】:极性 信息传播 影响力最大化
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.1;TP393.092
【目录】:
- 摘要4-5
- Abstract5-11
- 第1章 绪论11-18
- 1.1 课题背景11
- 1.2 国内外研究现状11-16
- 1.2.1 极性分析12-13
- 1.2.1.1 基于词典和规则的分析方法12-13
- 1.2.1.2 监督学习的方法13
- 1.2.1.3 基于语义的分析方法13
- 1.2.2 信息传播模型13-15
- 1.2.2.1 基于传播过程的模型13-14
- 1.2.2.2 基于影响力的模型14
- 1.2.2.3 基于转发因素的模型14-15
- 1.2.3 影响力最大化估计15-16
- 1.2.4 小结16
- 1.3 论文的主要工作及组织结构16-18
- 第2章 相关技术综述18-29
- 2.1 微博的极性分析18-22
- 2.1.1 情感词典18-19
- 2.1.2 文本表示技术19-20
- 2.1.2.1 布尔模型19-20
- 2.1.2.2 概率模型20
- 2.1.2.3 向量空间模型20
- 2.1.3 分类模型20-22
- 2.1.3.1 K-最近邻分类模型20
- 2.1.3.2 朴素贝叶斯分类模型20-21
- 2.1.3.3 支持向量机分类模型21-22
- 2.2 微博中的信息传播22-25
- 2.2.1 基于传播过程的信息传播模型23
- 2.2.2 基于影响力的信息传播模型23-25
- 2.2.3 基于转发因素的信息传播模型25
- 2.3 影响力最大化估计25-28
- 2.3.1 KK算法26
- 2.3.2 启发式算法26-28
- 2.4 本章小结28-29
- 第3章 中文微博的极性分析29-39
- 3.1 算法流程29-30
- 3.2 预处理30-34
- 3.2.1 微博特有的信息统计及交互信息过滤30-31
- 3.2.2 微博分词31-32
- 3.2.3 词性标注32-34
- 3.3 特征提取34-37
- 3.3.1 微博内容特征35
- 3.3.2 微博媒体特征35-37
- 3.4 极性分类及强度计算37-38
- 3.4.1 极性分类37-38
- 3.4.2 极性强度计算38
- 3.5 本章小结38-39
- 第4章 融入极性因素的微博信息传播模型39-51
- 4.1 信息传播关系图39-42
- 4.2 极性对信息传播的影响42-44
- 4.3 融入极性的信息传播模型44-50
- 4.3.1 问题定义44-45
- 4.3.2 特征选择45-47
- 4.3.3 模型思路47-49
- 4.3.4 算法流程49-50
- 4.4 本章小结50-51
- 第5章 基于主题和极性的微博用户影响力最大化51-61
- 5.1 影响力最大化问题51
- 5.2 用户影响力行为分析51-54
- 5.2.1 用户交互行为分析51-52
- 5.2.2 用户活跃度分析52
- 5.2.3 用户主题偏好和情感极性分析52-54
- 5.3 用户影响力计算54-57
- 5.3.1 用户之间影响力54-55
- 5.3.2 用户在整个网络中的影响力55
- 5.3.3 TPIRank算法55-57
- 5.4 基于TPIRank的影响力最大化算法57-60
- 5.4.1 算法流程57-58
- 5.4.2 影响因子58
- 5.4.3 启发阶段58-59
- 5.4.4 贪婪阶段59-60
- 5.4.5 搜索阶段60
- 5.5 本章小结60-61
- 第6章 实验与分析61-76
- 6.1 实验数据61-63
- 6.1.1 转发样本识别62
- 6.1.2 忽略样本识别62-63
- 6.2 评测标准63-65
- 6.2.1 准确率、召回率、F值63-64
- 6.2.2 影响力最大化估计的评测标准64-65
- 6.3 实验设计65-66
- 6.3.1 极性对转发范围和速度的影响65
- 6.3.2 微博信息传播模型对转发行为的预测65
- 6.3.3 微博影响力最大化估计65-66
- 6.4 实验结果及分析66-75
- 6.4.1 极性对转发范围和速度的影响66-69
- 6.4.2 微博信息传播模型对转发行为的预测69-73
- 6.4.3 微博影响力最大化估计73-75
- 6.5 本章小结75-76
- 第7章 总结与展望76-79
- 7.1 本文总结76-77
- 7.2 未来工作展望77-79
- 参考文献79-84
- 攻读硕士学位期间主要的研究成果84-85
- 致谢85
【相似文献】
中国期刊全文数据库 前10条
1 赵丽;袁睿翕;管晓宏;贾庆山;;博客网络中具有突发性的话题传播模型[J];软件学报;2009年05期
2 邓清华;金聪;刘俊;;邮件病毒传播模型及其分析[J];计算机工程与设计;2009年12期
3 左黎明;刘二根;汤鹏志;;U盘病毒随机传播模型[J];微电子学与计算机;2010年03期
4 申志伟;张彬;陈文基;;基于有害信息传播模型的互联网治理研究[J];北京邮电大学学报(社会科学版);2010年05期
5 李红伟;杨小帆;;带有用户意识的计算机多病毒传播模型[J];计算机工程;2012年01期
6 靳令征;;在云概念中三种计算机病毒传播模型应用分析[J];科技创新导报;2012年11期
7 杨春霞;胡丹婷;胡森;;微博病毒传播模型研究[J];计算机工程;2012年15期
8 郭强;;基于个体局部交互作用的舆情传播模型研究[J];计算机应用研究;2012年11期
9 陈秋霞;陈宏伟;;云计算环境下的病毒传播模型研究[J];湖北工业大学学报;2013年05期
10 H.Mermoz;王安南;;基阵处理辅助传播模型设计[J];水声译丛;1978年03期
中国重要会议论文全文数据库 前10条
1 徐苒;潘郁;;基于复杂网络的大学生群体危机事件初期传播模型及应急对策[A];中国运筹学会第九届学术交流会论文集[C];2008年
2 张良德;;密集市区传播模型研究[A];2008年“ICT助力两型社会建设”学术研讨会论文集[C];2008年
3 周涛;杨锐;任捷;柏文洁;汪秉宏;;具有相同感染能力的病毒传播模型行为分析[A];2006全国复杂网络学术会议论文集[C];2006年
4 辜姣;王茹;蔡勖;;一维环上具有遗忘-记忆机制的二态传播模型[A];2006全国复杂网络学术会议论文集[C];2006年
5 吴价;毛玉明;;无线自组织网传播模型探讨[A];中国通信学会第五届学术年会论文集[C];2008年
6 古智超;;基于传播模型的GSM街道底层站规划研究[A];2012全国无线及移动通信学术大会论文集(下)[C];2012年
7 赵明峰;;LTE传播模型浅析[A];2013年中国通信学会信息通信网络技术委员会年会论文集[C];2013年
8 孙仁诚;邵峰晶;李淑静;;多信息传播模型研究及仿真[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
9 周士弘;刘福臣;;基于NMPQ声传播模型的二元垂直阵匹配场定位[A];中国声学学会2005年青年学术会议[CYCA'05]论文集[C];2005年
10 尧文彬;赵旭凇;白承灏;;TD-LTE传播特性对比分析[A];2012全国无线及移动通信学术大会论文集(上)[C];2012年
中国重要报纸全文数据库 前1条
1 微软亚洲研究院副院长 张峥;暴力“中断者”[N];中国经营报;2010年
中国博士学位论文全文数据库 前7条
1 于秀辉;基于传播模型的数字“微内容”网络扩散研究[D];北京邮电大学;2011年
2 赵远萍;即时通信系统拓扑建模及消息传播模型研究[D];北京邮电大学;2010年
3 于凯;双层耦合网络上的信息传播模型研究[D];大连理工大学;2015年
4 焦玉;人类动力学建模及其对网络传播过程的影响[D];吉林大学;2012年
5 潘新;基于复杂网络的舆情传播模型研究[D];大连理工大学;2010年
6 张金慧;肺结核传播模型的定性分析及数据模拟[D];华中师范大学;2014年
7 韩兰胜;计算机病毒的传播模型及其求源问题研究[D];华中科技大学;2006年
中国硕士学位论文全文数据库 前10条
1 李凌燕;城市轨道交通网络突发大客流传播机理及组织优化[D];西南交通大学;2015年
2 赵灵燕;具有时滞的HIV-1病毒传播模型的Hopf分岔分析[D];云南师范大学;2015年
3 许凌之;基于极性分析的微博信息传播模型研究[D];浙江大学;2015年
4 甘紫文;学术网络主题影响力最大化研究[D];浙江大学;2015年
5 郑蕾;面向社会网络的信息传播模型研究[D];上海交通大学;2011年
6 杨宝龙;基于信任的正影响传播模型研究[D];东华大学;2015年
7 马寅;社会网络影响力最大化算法及传播模型的研究[D];兰州大学;2012年
8 代琳娜;微博污染传播模型的研究与应用[D];郑州大学;2013年
9 施亚;微博消息传播模型和预测机制研究[D];北京交通大学;2013年
10 贾世达;一种基于微博的信息传播模型及在股票价格预测中的应用[D];西安电子科技大学;2013年
本文关键词:基于极性分析的微博信息传播模型研究,由笔耕文化传播整理发布。
本文编号:302552
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/302552.html