基于深度融合特征的政务微博转发规模预测模型
发布时间:2022-01-09 02:03
【目的】预测政务微博的转发规模,研究及评估影响政府微博传播规模的重要特征,把握政务微博的信息舆论走向。【方法】针对政务微博的特点,提出一种深度融合特征的政务微博转发预测方案,引入卷积神经网络(CNN)和梯度提升决策树(GBDT)将发布者特征、时间特征及内容特征深度融合,预测政务微博的转发规模并对影响转发规模的特征进行重要性排序,找出影响政务微博转发规模的最重要特征。【结果】引入文本语义特征显著提升了转发规模的预测准确率,所提模型将政务微博转发规模的预测准确率提升至0.933。特征重要性实验结果表明,文本语义特征在影响政务微博转发规模的所有特征中最为重要。【局限】未考虑间接转发对整体转发规模的影响。【结论】深度融合发布者特征、时间特征及内容特征的CNN+GBDT模型能够显著提高政务微博转发规模预测的准确率。
【文章来源】:数据分析与知识发现. 2020,4(Z1)北大核心CSSCICSCD
【文章页数】:11 页
【部分图文】:
4种算法的F1值对比
基于深度融合特征的政务微博转发预测流程
现有的研究工作通常选择微博的主题、题材、是否包含多媒体信息等作为微博的内容特征。然而,这些信息不能体现微博文本的语义特征。相关研究表明,高转发微博文本内容之间具有一定的相似性,从而吸引用户频繁转发。CNN在文本语义特征提取、处理短文本分类问题中表现优异[7],可作为判别高转发文本之间语义相似性的手段。CNN模型对微博文本预测其高转发概率的过程如图2所示,包括输入层、卷积层、池化层和全连接层。每一层的输出是下一层的输入。卷积层作为特征提取层,通过滤波器提取局部特征,经过卷积核函数运算产生特征图,输出到池化层。池化层属于特征映射层,提取每张特征图中的典型特征,最后通过全连接层映射得到输出分类向量。采用Word2Vec训练微博文本,将词向量设定为m维,对于句子长度为n的微博文本,得到一个m×n的词向量矩阵作为卷积层的输入。利用h×k的滤波器对微博文本的词向量矩阵E[1:n]进行卷积操作,如公式(3)所示。
【参考文献】:
期刊论文
[1]我国政务微博转发规模分类预测[J]. 李倩倩,姜景,李瑛,刘怡君. 情报杂志. 2018(01)
[2]政务微博传播效果影响因素研究——以“江宁公安在线”为例[J]. 张漫锐,刘文波. 今传媒. 2017(10)
[3]基于转发行为的政务微博信息传播模式研究[J]. 陈然,刘洋. 电子政务. 2017(07)
[4]微博信息转发影响因素研究[J]. 李倩,张碧君,赵中英. 软件导刊. 2017(01)
[5]我国地方政务微博“上情下达”传播效能研究——基于31个省会城市政务微博传播中央政府工作报告的实证分析[J]. 刘泱育. 新闻大学. 2017(01)
[6]基于用户特征的微博转发预测研究[J]. 仇学明,肖基毅,陈磊. 南华大学学报(自然科学版). 2016(04)
[7]基于混合特征学习的微博转发预测方法[J]. 马晓峰,王磊,陈观淡. 计算机应用与软件. 2016(11)
[8]基于用户行为特征的微博转发预测研究[J]. 刘玮,贺敏,王丽宏,刘悦,沈华伟,程学旗. 计算机学报. 2016(10)
[9]融合热点话题的微博转发预测研究[J]. 陈江,刘玮,巢文涵,王丽宏. 中文信息学报. 2015(06)
[10]基于LDA主题特征的微博转发预测[J]. 李志清. 情报杂志. 2015(09)
本文编号:3577726
【文章来源】:数据分析与知识发现. 2020,4(Z1)北大核心CSSCICSCD
【文章页数】:11 页
【部分图文】:
4种算法的F1值对比
基于深度融合特征的政务微博转发预测流程
现有的研究工作通常选择微博的主题、题材、是否包含多媒体信息等作为微博的内容特征。然而,这些信息不能体现微博文本的语义特征。相关研究表明,高转发微博文本内容之间具有一定的相似性,从而吸引用户频繁转发。CNN在文本语义特征提取、处理短文本分类问题中表现优异[7],可作为判别高转发文本之间语义相似性的手段。CNN模型对微博文本预测其高转发概率的过程如图2所示,包括输入层、卷积层、池化层和全连接层。每一层的输出是下一层的输入。卷积层作为特征提取层,通过滤波器提取局部特征,经过卷积核函数运算产生特征图,输出到池化层。池化层属于特征映射层,提取每张特征图中的典型特征,最后通过全连接层映射得到输出分类向量。采用Word2Vec训练微博文本,将词向量设定为m维,对于句子长度为n的微博文本,得到一个m×n的词向量矩阵作为卷积层的输入。利用h×k的滤波器对微博文本的词向量矩阵E[1:n]进行卷积操作,如公式(3)所示。
【参考文献】:
期刊论文
[1]我国政务微博转发规模分类预测[J]. 李倩倩,姜景,李瑛,刘怡君. 情报杂志. 2018(01)
[2]政务微博传播效果影响因素研究——以“江宁公安在线”为例[J]. 张漫锐,刘文波. 今传媒. 2017(10)
[3]基于转发行为的政务微博信息传播模式研究[J]. 陈然,刘洋. 电子政务. 2017(07)
[4]微博信息转发影响因素研究[J]. 李倩,张碧君,赵中英. 软件导刊. 2017(01)
[5]我国地方政务微博“上情下达”传播效能研究——基于31个省会城市政务微博传播中央政府工作报告的实证分析[J]. 刘泱育. 新闻大学. 2017(01)
[6]基于用户特征的微博转发预测研究[J]. 仇学明,肖基毅,陈磊. 南华大学学报(自然科学版). 2016(04)
[7]基于混合特征学习的微博转发预测方法[J]. 马晓峰,王磊,陈观淡. 计算机应用与软件. 2016(11)
[8]基于用户行为特征的微博转发预测研究[J]. 刘玮,贺敏,王丽宏,刘悦,沈华伟,程学旗. 计算机学报. 2016(10)
[9]融合热点话题的微博转发预测研究[J]. 陈江,刘玮,巢文涵,王丽宏. 中文信息学报. 2015(06)
[10]基于LDA主题特征的微博转发预测[J]. 李志清. 情报杂志. 2015(09)
本文编号:3577726
本文链接:https://www.wllwen.com/guanlilunwen/zhengwuguanli/3577726.html