基于微博数据的电影票房预测研究
本文关键词:基于微博数据的电影票房预测研究
【摘要】:随着社交网络的快速发展,越来越多的研究人员开始关注如何利用社交媒体数据预测现实社会将要发生的事件。社交媒体中蕴含着与用户思想、行为相关的海量数据,深入挖掘相关信息并将其应用到预测恐怖活动、国家选举、社会突发事件等热点问题正成为当前研究的热门课题之一,这类研究对指导政府行为、商业活动、生产生活都具有十分重要的意义。本文以微博数据预测电影票房为例,深入探究社交媒体预测现实事件的可行性和准确性。本文首先介绍了电影票房预测的研究背景和意义,并从早期预测和实时预测两方面分析了电影票房预测的研究现状。在后续的章节中,文章介绍了微博的发展历程和特点以及微博数据的抓取、清洗。然后我们提出了基于微博数量特征、情感强度和宣传营销特征等多项特征分量融合的预测输入模型,并引入多元线性回归模型、BP神经网络模型、支持向量机模型对预测输入模型的准确性进行验证。本文的主要研究内容和创新点如下:1.在微博数据清洗阶段,提出了去除僵尸粉、广告用户和临时用户的算法,有效减少异常数据,提高了预测精度;2.提出了基于情感强度的微博用户行为分析方法,将用户的情感倾向和情感的激烈程度相结合,更准确地判定用户对特定电影的喜好程度;3.对微博营销内容分析归类后提出将投资方、院线、演员的宣传行为作为重要的参考因素加入预测模型;4.在对微博特征分析分类的基础上,提出了基于数量特征、情感强度特征和宣传特征的多特征预测输入模型;5.针对微博中出现的异常数据,提出了改进的BP神经网络,在输入层和隐含层之间加入记忆层,减少异常数据对实验结果的影响,提高预测模型的容错能力。在实验仿真阶段,文章对影响票房的各个特征分量进行分析,找出其相关性,并对比分析不同预测模型和不同预测方法对预测准确度的影响。实验验证了本文提出的预测模型与现有预测方法相比具有较高的准确性和容错能力。同时实验得到一系列重要结论,对电影投资拍摄、影院排片和电影早期宣传营销等提供了理论指导。
【关键词】:微博 票房预测 情感强度 BP神经网络
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP393.092
【目录】:
- 中文摘要3-4
- 英文摘要4-8
- 1 绪论8-13
- 1.1 电影票房预测的研究背景和意义8-10
- 1.1.1 电影市场发展迅速8
- 1.1.2 电影票房预测的商业价值8-10
- 1.2 国内外研究现状10-12
- 1.2.1 早期预测10-11
- 1.2.2 实时预测11-12
- 1.3 论文主要内容和章节安排12-13
- 2 微博数据处理13-20
- 2.1 引言13
- 2.2 微博的进化历程13-14
- 2.3 微博特征分析14-16
- 2.4 微博数据的爬取16-17
- 2.5 微博数据的清洗17-19
- 2.6 小结19-20
- 3 基于微博多特征融合的电影票房预测模型20-31
- 3.1 引言20
- 3.2 微博数据的特征提取20-28
- 3.2.1 微博数据的数量特征20-21
- 3.2.2 微博数据的情感特征21-25
- 3.2.3 微博数的宣传特征25-28
- 3.3 基于多特征的输入模型28-29
- 3.4 小结29-31
- 4 现有预测模型分析和改进31-46
- 4.1 引言31-32
- 4.2 多元线性回归模型32-35
- 4.2.1 模型的推导33-34
- 4.2.2 最小二乘估计34-35
- 4.3 支持向量机模型35-38
- 4.3.1 最优分类超平面35-36
- 4.3.2 支持向量回归机36-37
- 4.3.3 非线性回归问题37-38
- 4.4 BP神经网络模型38-43
- 4.4.1 BP神经网络38
- 4.4.2 BP神经元和BP网络模型38-40
- 4.4.3 BP网络的学习40-42
- 4.4.4 BP网络的局限性42-43
- 4.5 改进的BP神经网络模型43-45
- 4.6 小结45-46
- 5 实验结果及分析46-58
- 5.1 引言46
- 5.2 数据的初始化46-49
- 5.3 微博特征分量与票房相关性分析49-50
- 5.4 基于数量和情感强度的预测方法分析50-53
- 5.4.1 基于情感强度和基于传统关键字方法对比50-52
- 5.4.2 基于数量和情感方法的预测准确度对比52-53
- 5.5 不同预测模型准确度分析53-54
- 5.6 与现有预测模型对比分析54-55
- 5.7 改进的BP神经网络模型预测准确度分析55-57
- 5.8 小结57-58
- 6 总结与展望58-60
- 6.1 论文总结58
- 6.2 展望58-60
- 致谢60-61
- 参考文献61-64
- 附录 A. 作者在攻读学位期间发表的论文目录64
【相似文献】
中国期刊全文数据库 前10条
1 夏丹;;我国3D电影票房影响因素的实证分析[J];现代传播(中国传媒大学学报);2012年09期
2 胡小莉;李波;吴正鹏;;电影票房的影响因素分析[J];中国传媒大学学报(自然科学版);2013年01期
3 ;传媒数字[J];现代视听;2013年02期
4 ;每周热门节点——1996年全美电影票房排行[J];每周电脑报;1997年08期
5 ;中国电影票房破百亿[J];青年记者;2011年03期
6 王文文;周澍民;;社会化媒体对电影票房的预测价值研究[J];新闻传播;2013年12期
7 晋斌;张辉;;基于马尔科夫链模型的中国3D电影票房研究[J];中国传媒大学学报(自然科学版);2014年02期
8 笈藜;;电影票房分账别让观众买单[J];声屏世界;2012年12期
9 ;传媒数字[J];现代视听;2013年07期
10 ;传媒数字[J];现代视听;2012年12期
中国重要会议论文全文数据库 前1条
1 昝胜锋;朱文雁;;嵌入式广告、文化暗合与电影票房[A];建设经济文化强省:挑战·机遇·对策——山东省社会科学界2009年学术年会文集(4)[C];2009年
中国重要报纸全文数据库 前10条
1 记者 周南焱;北京电影票房10个月破6亿元[N];北京日报;2009年
2 记者 张景华;北京2012年电影票房首超16亿[N];光明日报;2013年
3 记者 李晚成;去年电影票房2.7亿元[N];江西日报;2013年
4 记者 周南焱 实习生 孙杰;北京电影票房去年进账超16亿元[N];北京日报;2013年
5 记者 龚雪 通讯员 于松业;去年省电影票房突破8亿元[N];湖北日报;2013年
6 记者 卫小林;海南去年电影票房历史性突破[N];海南日报;2013年
7 吕蓁;电影票房成新型炒股风向标[N];中国文化报;2013年
8 记者 龚雪 通讯员 姚海陆 于松业;春节假期电影票房超4千万[N];湖北日报;2013年
9 记者 吴园园;电影票房:5月一周顶过去一年[N];北京商报;2013年
10 北京商报记者 吴园园;全年电影票房仍将平稳增长[N];北京商报;2013年
中国硕士学位论文全文数据库 前4条
1 王雪娟;电影票房预测研究发展史简论[D];重庆大学;2015年
2 王伟;基于微博数据的电影票房预测研究[D];重庆大学;2015年
3 杨威;基于微博数据的电影票房预测模型研究[D];安徽大学;2014年
4 聂鸿迪;中国电影票房的影响因素及其实证研究[D];北京交通大学;2015年
,本文编号:972042
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/972042.html