当前位置:主页 > 管理论文 > 移动网络论文 >

基于深度学习的微博转发预测系统

发布时间:2020-06-06 05:10
【摘要】:社交媒体是近些年发展迅速的互联网领域之一,每天都有大量的用户在社交媒体网络上进行信息共享和状态分发。微博作为起步最早发展速度较快的社交媒体网络平台,吸引了大量的用户注册和使用。转发是微博实现信息传播的一个重要机制,用户接收其他用户分享的信息之后,可以将信息转发到自己的社交媒体平台上,从而将信息分享给更多的用户。而且随着移动互联网的兴起,如4G网络,Wi-Fi网络的大规模覆盖,智能手机的迅速普及,进一步吸引了更多用户使用微博。基于这样的应用场景,对微博转发过程进行分析就具有非凡的意义。对于公司而言,预测微博转发数量可以帮助公司进行流量监控和设备调整,从而提高用户体验。对于政府而言,舆情分析的重要组成部分就是设法得到当前社交媒体用户关注的焦点,而微博转发预测可以在一定程度上帮助政府及时应对由于信息爆发性传播而产生的群体事件。本文主要通过三个角度描述微博转发过程的特征,即用户社交网络结构,用户转发微博时序间隔和微博文本自然语言特征,利用深度学习框架,预测一条给定微博的转发数量。本论文的研究内容主要由两部分组成:其一在给定用户的社交媒体网络结构的基础上,利用图嵌入方法提取每一位用户的网络结构特征,其基本思想是将由节点和连接边构成的图向量化,从而达到降维和提取信息的目的。网络结构特征可以在一定程度上反映用户所在在线社交社区的特点(如社区用户之间连接是否紧密,不同用户的相似性高低),从而为微博转发预测提供信息;其二是通过使用递归神经网络,整合用户的网络结构特征,用户转发微博的时间间隔和规律以及微博文本的自然语言特征,得到一条给定微博的深度学习模型的转发预测特征,之后即可利用深度学习网络训练得到的转发预测特征进行微博转发数量预测。本论文提出了基于社交网络一阶相似性和二阶相似性的Fast Line图嵌入算法和基于递归神经网络的微博转发预测系统,Fast Line和微博预测系统均是吸取了近几年最先进的算法的优点,并对先进算法存在的缺陷和不足进行改进。本论文的Fast Line图嵌入算法利用近似优化目标方程的方法,使得参数训练速度相比较基线方法提高了一倍以上,同时图嵌入结果的准确度与基线方法持平。本论文的微博预测系统与DeepCas方法的预测结果相比可以提高30%的预测准确率。
【图文】:

图嵌入,随机游走,示例,技术


大量语料库中句子的分析,我们就可以得到一种语言或者对应语料库的分布和特征。同样的,对于随机游走产生的大量节点序列的分析,我们可以得到对应原始网络图的结构分布和特征信息。如图2.3的给出的示例。图 2.3 基于随机游走的图嵌入技术示例Fig. 2.3 The example of Graph embedding algorithm based on random walk.DeepWalk[31]是典型的使用随机游走对网络进行采样的图嵌入算法。DeepWalk一大亮点在于将语言模型Word2Vec[32,33]用于网络表示学习,将随机游走的路程视作语言模型中的句子,随机游走的节点视作句子中的单词。语言模型中的优化目标是,给定一个单词,预测其邻居单词,即最大化给定单词的邻居单词的出现概率。应用于网络表示学习中,在图结构上进行随机游走,随机游走的路径类比为语言模型中的句子,给定图节点的表示特征,最大化游走中邻居节点的概率。Word2Vec使用一个包含输入层,一层隐藏层和输入层的深度学习网络求解单词的低维嵌入表示,Word2Vec输入网络的数据每个单词对应的One-Hot向量表示(只有一个位置为1

均匀分布,随机游走,示例


辽宁科技大学硕士毕业论文下文,也就是节点的邻域。NLP中,单词的上下文是当前单词周围的字,DeepWalk用随机游走得到网络中节点的邻域。都是给定一个中心节点的数据,调整参数,也就是节点的图嵌入表示向量,,使得中心节点周围的上下文出现的概率最大。因为在原始框架中,优化以上提出的目标方程时间消耗和空间消耗很大,所以一般采用Hierarchy Softmax和负采样等方法近似求解最优值,加速深度神经网络参数学习过程。我们将会在第三章给出关于这两个加速算法的更多细节。2.1.5 Node2VecNode2vec是DeepWalk的改进方法。在DeepWalk中,随机游走的转换概率一般遵循均匀分布,即与节点的度成反比关系。Node2Vec认为DeepWalk的随机游走策略会偏向于深度优先搜索,而节点邻域的信息可能无法得到有效的采样。因此,Node2Vec改进了随机游走的策略,从而使得随机游走得到的节点序列可以保持广度优先和深度优先的所有特征,同时考虑到局部和宏观的信息,以达到很高的适用性。图2.4 给出Node2Vec随机游走的示例。
【学位授予单位】:辽宁科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP393.092;TP18

【参考文献】

相关期刊论文 前6条

1 黄英来;孙晓芳;刘镇波;高萌;;微博转发预测算法评测系统的建立及性能比较[J];哈尔滨理工大学学报;2013年04期

2 李英乐;于洪涛;刘力雄;;基于SVM的微博转发规模预测方法[J];计算机应用研究;2013年09期

3 谢婧;刘功申;苏波;孟魁;;社交网络中的用户转发行为预测[J];上海交通大学学报;2013年04期

4 吴凯;季新生;刘彩霞;;基于行为预测的微博网络信息传播建模[J];计算机应用研究;2013年06期

5 张e

本文编号:2699209


资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2699209.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ac1a1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com