当前位置:主页 > 文艺论文 > 影视论文 >

基于Stacking方法的电影票房预测

发布时间:2021-09-02 21:14
  随着电影产业的不断发展壮大和自媒体的出现,越来越多的研究人员开始关注如何利用自媒体上的数据预测一些社会事件。本文以豆瓣数据预测电影票房为例,通过爬虫得到豆瓣平台上电影信息数据以及评论数据以达到准确预测电影票房的效果,对电影的制作方以及电影的营销具有很好的指导作用。本文基于2016年全年以及2017年1月-11月国内上映的150部电影,筛选出上映两周短评数量最多的100部电影作为数据集进行分析。鉴于预测电影票房影响因素选择的重要性,往往一部电影的上映前两周的口碑往往影响了后期电影票房的走势情况,电影评论成为了观众是否进入影院观看电影的一大影响因素。于是本文在进行电影票房预测的变量选择时,创新性的加入了情感特征因子,该情感特征因子是通过构建电影评论情感倾向词典来提取的,提取后的正向情感特征因子、负向情感特征因子与中性情感特征因子与电影票房的相关系数达到了0.87,-0.89,0.78。充分说明了口碑对电影票房预测的重要性,同时也为电影票房预测新增了三个量化指标。本文还改进了电影票房的预测模型。通常用的电影票房预测模型是BP神经网络模型。但由于豆瓣网站上数据类型多元,很难用单一的模型去描述其... 

【文章来源】:上海师范大学上海市

【文章页数】:74 页

【学位级别】:硕士

【部分图文】:

基于Stacking方法的电影票房预测


票房市场规模和增速图

算法流程图,集成学习,基础层次


师范大学硕士学位论文 第 1 章 绪论集成学习(Ensemble learning)是最近几年来机器学习中非常流行的思想之是通过组合几种模型来提高机器学习的效果,与单一模型相比,该方法可以更好的预测结果。正因为如此,集成方法在许多著名的机器学习比赛中(如tflix,KDD 和 Kaggle 比赛)中能取得很好的名次[3]。Stacking 是一种集成学习技通过元分类器或者元回归聚合成多个分类或者回归模型,基础层次模型基于的训练集进行训练,然后元模型基于基础层次模型的输出进行训练。下图为cking 算法的基本思路图:

刺客,票房,信条,豆瓣


形金刚 5 15.45 春娇救志明 1.755弹专家 4.0049 刺客信条 1.610风破浪 10.4852对电影票房评论进行爬取的时候,存在一个问题,选取上映多久后于预测电影票房。如果采取的票房评论时间线很长,那么得到的结告诉电影的制作方,这样话电影制作方没有办法采取营销活动尽可到最少。而采用的时间周期过短,并没有足够的量去做文本分析。映时间取决于电影的好坏,比如《战狼 2》上映时间长达 4 个多月为上映三周后的票房过差而提前下映。于是本文分析了 95 部电影周豆瓣评论总量所占比例,如下图所示:

【参考文献】:
期刊论文
[1]基于Holt-Winters无季节指数平滑模型的国内电影票房预测[J]. 滑瑶,张辉,刘悦悦,韩晶晶.  中国传媒大学学报(自然科学版). 2017(04)
[2]豆瓣电影评论文本的情感分析研究——基于2017年电影《乘风破浪》爬虫数据[J]. 冯莎.  中国统计. 2017(07)
[3]基于两个单项模型的组合预测模型构建方法[J]. 张延利,张德生.  统计与决策. 2017(07)
[4]遗传神经网络模型在CPI预测中的实证检验[J]. 何丹.  统计与决策. 2017(02)
[5]基于评论情感分析的用户在线评价研究——以豆瓣网电影为例[J]. 马松岳,许鑫.  图书情报工作. 2016(10)
[6]基于随机森林的影片票房预测[J]. 张鑫,郭振宇.  现代电影技术. 2016(03)
[7]情感词典自动构建方法综述[J]. 王科,夏睿.  自动化学报. 2016(04)
[8]基于社交媒体用户评论和关注度的电影票房预测模型[J]. 周明升,韩冬梅.  微型机与应用. 2014(18)
[9]基于SVM与BP的分类与回归比较研究[J]. 肖晓,徐启华.  新型工业化. 2014(05)
[10]基于神经网络的电影票房预测建模[J]. 郑坚,周尚波.  计算机应用. 2014(03)

硕士论文
[1]基于深度学习卷积神经网络的电影票房预测[D]. 张雪.首都经济贸易大学 2017
[2]基于多元线性回归模型的电影票房预测系统设计与实现[D]. 任丹.中山大学 2015
[3]电影票房预测研究发展史简论[D]. 王雪娟.重庆大学 2015
[4]基于微博数据的电影票房预测研究[D]. 王伟.重庆大学 2015



本文编号:3379746

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/dianyingdianshilunwen/3379746.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户048c6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com