当前位置:主页 > 社科论文 > 新闻传播论文 >

微博用户转发预测特征的特征选择研究

发布时间:2020-06-19 21:04
【摘要】:微博用户转发预测研究对社交网络的信息传播和推荐研究具有重要的学术价值,在公共舆论管理、个性化推荐、市场营销等方面具有重要的应用价值。本文主要研究微博中普通用户转发一条微博的重要影响因素,目的是更好的理解用户的转发行为,同时提高转发预测效果。本文通过分析微博用户转发行为的影响因素,综合相关文献,汇总了影响用户转发行为的众多特征,在规模较大的真实微博数据集上实现了特征提取与特征选择,建立因子分解机预测模型,在测试集上对用户的转发行为做出预测,通过对比研究了各种特征和特征组合在微博用户转发行为预测上的有效性。本文的工作主要有四个方面:(1)综合相关文献,分析汇总了大量影响用户转发行为的特征,并在真实的新浪微博数据集上实现了特征提取。(2)通过每次使用一组类型特征训练建立因子分解机预测模型的方式,研究了用户特征、作者特征、微博特征、兴趣特征和社交特征五种不同类型特征对模型预测性能的影响。实验表明,兴趣特征和微博特征对模型预测性能的影响最大。(3)对微博特征全集实现了Filter特征选择和Wrapper特征选择,研究了各种特征和特征子集对模型预测性能的影响。实验表明,转发相似度特征与分类预测的相关性最高。Wrapper方法选择的最优特征子集,在几乎保证预测效果的同时,大幅降低了特征维度,提高了运行效率。(4)利用预测性能最好的最优特征子集建立因子分解机预测模型,对用户的转发行为进行预测,预测精度达到了89.0%,F1度量达到了66.8%,AUC面积达到了95.0%。
【学位授予单位】:西北大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:G206;TP391.3
【图文】:

过程图,特征选择,过程


图 2 特征选择过程图中可以看出,特征子集搜索和子集评价是特征选择关键的环节,在没有作为先验假设的前提下进行特征选择,需要遍历所有可能的子集,这在计重的组合爆炸问题,特征个数稍多就难以进行,比如,含有 n 个特征的集

ROC曲线,特征预测,ROC曲线,兴趣类型


图 3 不同类型特征预测 ROC 曲线以明显看出,兴趣类型特征预测的 ROC 曲线最靠近左上角8.5%,与信息检索常用的评价指标评价结果类似,兴趣特征,说明兴趣类型特征对微博用户转发预测的重要性最大。其

【参考文献】

相关期刊论文 前6条

1 邓青;马晔风;刘艺;张辉;;基于BP神经网络的微博转发量的预测[J];清华大学学报(自然科学版);2015年12期

2 匡冲;刘知远;孙茂松;;微博转发者的个性化排序[J];山东大学学报(理学版);2014年11期

3 齐超;陈鸿昶;于岩;;基于行为分析的微博信息传播效果[J];计算机应用;2014年08期

4 曹玖新;吴江林;石伟;刘波;郑啸;罗军舟;;新浪微博网信息传播分析与预测[J];计算机学报;2014年04期

5 李英乐;于洪涛;刘力雄;;基于SVM的微博转发规模预测方法[J];计算机应用研究;2013年09期

6 张e

本文编号:2721340


资料下载
论文发表

本文链接:https://www.wllwen.com/xinwenchuanbolunwen/2721340.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5c2d6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com