基于转发层次分析的新浪微博热度预测研究
发布时间:2017-10-10 03:29
本文关键词:基于转发层次分析的新浪微博热度预测研究
更多相关文章: 微博 爬虫 静态特征 动态特征 热度指数 多分类问题
【摘要】:微博作为新型的消息传播媒介,其影响力和传播速度都超越了传统主流媒体,预测微博热度对舆情监测、政府宣传、企业营销及热点推送等具有重要意义。通过分析微博转发的层次规律,结合转发量、转发深度及广度指标,定义新的热度指数计算方法。将微博热度划分为5个等级,对转发数大于100的微博预测其热度达到特定等级的概率。使用有监督的机器学习算法,先后提取训练样本的静态和动态特征训练热度预测模型。通过自主开发的Big Data爬虫开放平台获取来源于新浪微博的训练样本,并应用十折交叉验证法进行实验,结果表明,相比只使用静态特征的热度预测模型,加入微博动态特征能有效提高预测性能,平均F1值达到76.9%。
【作者单位】: 山西大学计算机与信息技术学院;中国科学院高能物理研究所计算中心;
【关键词】: 微博 爬虫 静态特征 动态特征 热度指数 多分类问题
【基金】:国家“863”计划基金资助项目“基于媒体大数据的大众信息消费服务平台及应用示范”(SS2014AA012305)
【分类号】:TP393.092
【正文快照】: 中文引用格式:翟晓芳,刘全明,程耀东,等.基于转发层次分析的新浪微博热度预测研究[J].计算机工程,2015,41(7):31-35.英文引用格式:Zhai Xiaofang,Liu Quanming,Cheng Yaodong,et al.Research on Hotness Prediction in Sina MicroblogBased on Forw ard Level Analysis[J].Com
【参考文献】
中国期刊全文数据库 前4条
1 张e,
本文编号:1004092
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1004092.html