基于微博数据的电影票房预测
发布时间:2017-04-02 19:17
本文关键词:基于微博数据的电影票房预测,由笔耕文化传播整理发布。
【摘要】:从全球范围来看,电影行业是增长最迅速的产业。每年都有成千上万部的电影上映,电影市场年均复合增长率也在逐年增长。然而人们的喜好是非常难预测的,一部电影上映之后,能够满足自负盈亏的平衡点具有相当高的风险,所以,电影票房预测一直是电影行业非常关注的问题。电影票房的研究在经历“观众研究”和利用元数据、多因子的方法进行模型改进和影响因子的研究阶段之后,研究者们充分利用了网民在线生成的海量内容作为预测的主要信息来源,建立了更加高效、准确的票房预测模型。预测算法都是在电影上映之前进行的,预测进行的越早价值越大,但是由于互联网数据的滞后性,是电影上映之前和发布之后的微博数据量差距特别大,电影上映之前的微博数据量占总量的一小部分,大多数的微博数据都集中在电影上映的第一天或者是第一周,模型预测的性能和准确性一般都不高。为了尽量的消除互联网数据的滞后性对预测结果的影响,本文提出了一种新的基于微博数据的预测模型来预测电影票房,我们提出将整个预测过程分为三个时间阶段,使用预测算法构建了3个在时间维度连续的模型,即电影上映之前、电影上映一周以后、电影上映两周以后分别预测电影上映后第一周的票房、电影上映后二周累计票房、电影上映后三周累计票房。将模型变量分为两类,一是实际票房数据,二是微博数据。在预测电影上映两周、三周累计票房的时候,已经有了第一、二周的实时票房数据,可以将实际票房也加入到预测模型中。在参考前人研究模型变量基础之上,我们对微博数据做出提及、情感提及、积极情感、消极情感四个维度特征,并在这四个维度之上派生了十二个维度。3个预测模型都是通过遗传算法优化的支持向量回归机进行构建的,通过仿真实验得到了各个模型的最佳参数,并通过绝对误差值指标验证了该模型的科学性和合理性,并且预测的时间越晚,准确率越高。
【关键词】:票房预测 微博数据 支持向量回归机 遗传算法
【学位授予单位】:河北大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:J943
【目录】:
- 摘要5-6
- Abstract6-10
- 第1章 绪论10-18
- 1.1 选题的背景及研究意义10-12
- 1.1.1 选题背景10-11
- 1.1.2 研究意义11-12
- 1.2 国内外研究进展12-15
- 1.2.1 电影观众研究12-13
- 1.2.2 模型改进及影响因子研究13-14
- 1.2.3 基于网民在线生成的海量内容14-15
- 1.3 研究目的和研究方法15-16
- 1.3.1 研究目的15
- 1.3.2 研究方法15-16
- 1.4 本文的创新点16
- 1.5 论文的基本框架16-18
- 第2章 相关的理论基础18-27
- 2.1 微博数据18-20
- 2.1.1 微博的定义及功能分析18-19
- 2.1.2 微博数据的特性19-20
- 2.2 支持向量回归机相关理论20-25
- 2.2.1 线性支持向量回归机21-24
- 2.2.2 非线性支持向量回归机24-25
- 2.3 遗传算法优化的支持向量回归机25-26
- 2.4 本章小结26-27
- 第3章 基于微博数据的电影票房预测设计27-39
- 3.1 电影票房预测流程概述27-28
- 3.2 电影选择和数据采集28-33
- 3.2.1 电影选择28-29
- 3.2.2 电影票房数据采集29-30
- 3.2.3 微博数据采集30-33
- 3.3 模型架构和变量体系设计33-37
- 3.3.1 模型架构设计33
- 3.3.2 变量体系设计33-37
- 3.4 预测模型的构建37-38
- 3.5 性能评价38
- 3.6 本章小结38-39
- 第4章 仿真实验与结果分析39-51
- 4.1 实验数据39-45
- 4.2 仿真实验与结果分析45-49
- 4.3 本章小结49-51
- 第5章 总结与展望51-52
- 5.1 论文的主要工作和结论51
- 5.2 进一步研究工作的展望51-52
- 参考文献52-54
- 致谢54-55
- 攻读硕士学位期间发表论文及科研情况55
本文关键词:基于微博数据的电影票房预测,,由笔耕文化传播整理发布。
本文编号:283037
本文链接:https://www.wllwen.com/wenyilunwen/dianyingdianshilunwen/283037.html