基于微博挖掘的流行趋势预测
本文关键词:基于微博挖掘的流行趋势预测
更多相关文章: 微博 流行趋势预测 特征融合 相似度 粒子群优化
【摘要】:近年来,随着Web 2.0和移动互联网的飞速发展,互联网上涌现了大量的社交网络平台。微博作为其中一种社交网络平台,以其高便捷性、高原创性、强交互性和强草根性的特点吸引了大量用户,成为人们生活中获取与分享信息的重要平台。研究如何及时准确地预测微博未来的流行趋势,对内容推荐、广告营销以及舆情监控等领域都具有重要意义。本文以新浪微博为研究对象,对微博流行趋势预测进行了研究,具体工作如下:1.分别分析了内容、时序和网络这三类因素对微博转发过程的影响。实验结果表明,不包含链接的微博更容易被转发;微博中提及的人数越多,其最终转发数的分布范围越小,且转发数都比较少;不同时间段发布的微博,其最终转发数差别较大;微博最终转发数与其最小转发时间间隔之间存在一定的负相关性;初期曝光量较小的微博,其最终转发数的分布范围也较小,且大部分的转发数都较少;微博最终转发数与其早期转发网络的链接密度之间近似呈现负线性相关。2.分析了现有研究中常用微博特征存在的不足,然后在此基础上从微博的内容、时序和网络三个方面提取了一系列新特征,将新特征与常用特征相结合,对逻辑斯蒂回归、朴素贝叶斯、支持向量机和随机森林等分类模型进行训练并对目标微博的流行度范围进行预测。实验结果显示,在加入本文提取的新特征后,这四种模型的预测正确率分别提高了1.91%,14.80%,2.92%和6.92%。3.将提取的微博特征应用到基于相似度的微博流行趋势预测方法中,给出了基于加权马氏距离的微博相似度计算方法,根据提取的微博特征选取与目标微博最相似的6)条历史微博,将其加权平均流行度作为目标微博的最终流行度。在此基础上,还利用粒子群算法对选取的历史微博数量和特征权重进行了优化。实验结果显示,与仅使用常用特征时的最优结果相比,相对绝对误差降低了0.0801,正确率提高了9.00%;与未经过粒子群算法优化的方法相比,相对绝对误差降低了0.0640,正确率提高了6.00%。
【关键词】:微博 流行趋势预测 特征融合 相似度 粒子群优化
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:G206;TP393.092
【目录】:
- 摘要5-6
- ABSTRACT6-11
- 第一章 绪论11-22
- 1.1 研究背景与意义11-12
- 1.2 国内外研究现状12-20
- 1.2.1 Web内容流行趋势预测12-15
- 1.2.2 基于相似度的微博流行趋势预测15-16
- 1.2.3 基于机器学习的微博流行趋势预测16-19
- 1.2.4 基于转发模拟的微博流行趋势预测19-20
- 1.3 论文主要工作20-21
- 1.4 论文组织结构21-22
- 第二章 相关技术介绍22-30
- 2.1 常用的分类模型22-26
- 2.1.1 逻辑斯蒂回归模型22-23
- 2.1.2 朴素贝叶斯模型23-24
- 2.1.3 支持向量机模型24-25
- 2.1.4 随机森林模型25-26
- 2.2 常用的邻近性度量指标26-28
- 2.3 粒子群优化算法28-29
- 2.4 本章小结29-30
- 第三章 微博转发过程实证分析30-40
- 3.1 问题的提出和相关工作30-31
- 3.2 实验设计31-33
- 3.2.1 数据介绍31
- 3.2.2 实验方法及过程31-33
- 3.3 实验结果及分析33-39
- 3.3.1 微博转发数变化曲线及分布33-35
- 3.3.2 微博用户粉丝数与朋友数分布35
- 3.3.3 内容因素对微博转发的影响35-36
- 3.3.4 时序因素对微博转发的影响36
- 3.3.5 网络因素对微博转发的影响36-39
- 3.4 本章小结39-40
- 第四章 基于特征融合的微博流行趋势预测40-58
- 4.1 问题的提出和相关工作40-41
- 4.2 基于特征融合的微博流行趋势预测41-47
- 4.2.1 算法步骤41-42
- 4.2.2 转发链和网络构造42
- 4.2.3 微博内容特征42-43
- 4.2.4 微博时序特征43-44
- 4.2.5 微博网络特征44-47
- 4.3 实验设计47-50
- 4.3.1 数据介绍47-48
- 4.3.2 评价指标48-49
- 4.3.3 实验方法及过程49-50
- 4.4 实验结果及分析50-57
- 4.4.1 特征重要性51-52
- 4.4.2 分类模型预测效果对比52-53
- 4.4.3 不同类别特征的有效性53
- 4.4.4 全部特征与常用特征预测效果对比53
- 4.4.5 预测时刻对预测效果的影响53-55
- 4.4.6 流行度阈值对预测效果的影响55-56
- 4.4.7 模型时间性能对比56-57
- 4.5 本章小结57-58
- 第五章 基于相似度的微博流行趋势预测58-72
- 5.1 问题的提出和相关工作58-59
- 5.2 基于相似度的微博流行趋势预测59-62
- 5.2.1 算法步骤59-60
- 5.2.2 微博特征提取60
- 5.2.3 微博相似度60-61
- 5.2.4 目标微博流行度61
- 5.2.5 方法参数选择61-62
- 5.2.6 方法时间复杂度62
- 5.3 实验设计62-64
- 5.3.1 实验数据62
- 5.3.2 评价指标62-63
- 5.3.3 实验方法及过程63-64
- 5.4 实验结果及分析64-71
- 5.4.1 预测效果对比64-65
- 5.4.2 不同类别特征的有效性65-66
- 5.4.3 相似微博数量对预测效果的影响66-68
- 5.4.4 全部特征与常用特征预测效果对比68-69
- 5.4.5 预测时刻对预测效果的影响69-71
- 5.4.6 方法时间性能对比71
- 5.5 本章小结71-72
- 第六章 总结与展望72-74
- 6.1 工作总结72-73
- 6.2 工作展望73-74
- 致谢74-75
- 参考文献75-80
- 攻读硕士学位期间取得的成果80-81
【相似文献】
中国期刊全文数据库 前10条
1 张鸿鸣,刘铁军,薛赤,程耀华;微机预测人体乙脑流行趋势[J];计算机应用研究;1992年05期
2 ;电脑流行趋势[J];技术与市场;1997年02期
3 张磊;;自然之风,吹动2010流行趋势 航嘉2010流行趋势[J];电脑爱好者;2010年15期
4 胡豆豆;一篮子鸡蛋或一篮子理想 2005年手机流行趋势预测[J];数字通信;2004年20期
5 ;编者的话 流行趋势[J];今日电子;1994年03期
6 ;孤独的“手机”是可耻的——手机联网娱乐流行趋势[J];数字通信;2004年03期
7 ;飞越激情,奏响时尚乐章——宝鸟2005高级职业装流行趋势专场发布会[J];通信企业管理;2005年08期
8 ;’93—’94秋冬服装流行趋势[J];中国邮政;1994年02期
9 潘会洋,史长俊,马秀贞,邱耀文,张丰厚,李志诚,何振华,梁居正,陈明远,王保童;甘肃省1949—1990年麻风病流行趋势与防治对策的探讨[J];兰州科技情报;1995年02期
10 罗平;转页扇流行趋势漫谈[J];家庭电子;1999年08期
中国重要会议论文全文数据库 前10条
1 陈万青;;中国癌症负担现状和流行趋势[A];第十三届中国科协年会第18分会场-癌症流行趋势和防控策略研究研讨会论文集(补充)[C];2011年
2 赵乐修;陈恭信;唐焱;张斌;解静荣;李毅;沈彬华;王春兰;邓洪斌;吕月玲;杜锦堂;;新疆克拉玛依市癌症流行趋势调查研究[A];第十三届中国科协年会第18分会场-癌症流行病趋势和防控策略研讨会论文集[C];2011年
3 娄玉生;王国明;张万祥;赵文仙;张腊萍;;温县狂犬病暴发流行趋势浅析[A];中华医学会第一届全国公共卫生学术会议暨第四届中国现场流行病学培训项目汇编[C];2009年
4 曹玉广;许芬;吴森林;段纪俊;;武汉市肺癌流行趋势及对策[A];2002年湖北省减轻自然灾害白皮书——湖北省2002年重大自然灾害合趋势分析会商会论文集[C];2002年
5 侯浚;;河北省常见恶性肿瘤的流行趋势及防治对策[A];第四届中国肿瘤学术大会暨第五届海峡两岸肿瘤学术会议论文集[C];2006年
6 吴建林;熊国屏;;四川省结核病流行趋势及新世纪控制策略探讨[A];中国防痨协会全国学术会议大会学术报告[C];2001年
7 ;未来之重新定义:2012/2013秋冬针织品流行趋势[A];第十七届全国花式纱线及其织物技术进步研讨会论文集[C];2011年
8 顾晏如;徐晓霞;钱兴才;;无锡地区1989~1998年性病流行趋势的分析[A];江苏省性学会第三次学术会议论文集[C];2000年
9 梁金星;;癌症流行趋势和防控策略研究[A];第十三届中国科协年会第18分会场-癌症流行病趋势和防控策略研讨会论文集[C];2011年
10 约翰C.彼得;;全球肥胖症的流行趋势:挑战和机遇[A];儿童营养与健康学术研讨会论文汇编[C];2005年
中国重要报纸全文数据库 前10条
1 中法时装培训中心法国设计师DELOR;流行趋势与设计灵感[N];中国纺织报;2002年
2 梁勇;流行趋势不是皇帝的新装[N];中国纺织报;2007年
3 上海新闻中心 刘征;上海发布旅游纪念(礼)品流行趋势[N];华东旅游报;2009年
4 中国纺织工业协会副会长、中国家用纺织品行业协会名誉会长 杨东辉;流行趋势从“经院”走向民间[N];中国纺织报;2010年
5 汝乃尔;上海发布旅游纪念品流行趋势预测[N];中国旅游报;2011年
6 本报记者 沈则瑾;2011年旅游纪念品(礼品)流行趋势发布[N];经济日报;2011年
7 本报记者 贾榕;转型求变渐成流行趋势[N];中国纺织报;2014年
8 苏州大学艺术学院副院长、教授 李超德;中国服装的流行趋势与话语权[N];中国纺织报;2006年
9 ;09/10秋冬流行趋势同期发布[N];中国服饰报;2009年
10 记者 杨江;借助流行趋势发布打响“品牌战”[N];石狮日报;2010年
中国硕士学位论文全文数据库 前9条
1 汝海洋;流行趋势在产品设计上的运用研究[D];东华大学;2015年
2 陈鄂;基于大数据的家纺流行趋势预测研究[D];武汉纺织大学;2016年
3 李锴;基于微博挖掘的流行趋势预测[D];电子科技大学;2016年
4 胡晨曦;论流行趋势报告中说服效果的实现—基于评价理论中态度资源选择的研究[D];广东外语外贸大学;2009年
5 戴航;服装流行趋势设计手稿的研究[D];东华大学;2007年
6 路晓丹;20世纪欧洲女裙造型设计流行趋势研究[D];武汉纺织大学;2014年
7 宋先璐;广州市恶性肿瘤流行趋势,1997-2006[D];南方医科大学;2007年
8 罗s,
本文编号:1121631
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1121631.html