机器学习在电影票房预测中的应用研究
发布时间:2022-12-11 13:07
随着社会生活水平的提高,人们越来越注重精神层面的追求,娱乐消费在生活中所占的比例也越来越大。电影作为大众娱乐消费的重要组成部分,不但丰富了人们的业余生活和精神世界,而且也是各国之间文化交流的重要媒介。对于一部电影而言,票房的高低则是衡量影片成功与否的重要指标,投资者往往需要综合考虑风险和收益来决定是否投资电影。如果能对票房做出合理、准确的预测,就能在很大程度上减少投资风险带来的损失,并在影片拍摄、制作、宣传、上映等过程中合理调整策略,使投资收益最大化。本文选取了2016-2019年在中国大陆上映的526部电影作为研究对象,构建了由电影类型、热门题材、演员、导演、电影制式、上映档期、电影时长和发行公司等8个变量组成的票房收入预测指标体系,通过聚类算法把电影票房分为6类,利用MATLAB工具分别建立了决策树模型、朴素贝叶斯模型和随机森林模型,并对26部电影的票房进行了分类预测,结果表明:随机森林模型的预测效果高于决策树模型和朴素贝叶斯模型。在建立预测模型的同时,通过综合对比得到影响票房的四个重要因素:电影片长、电影制式、演员和上映档期。最后,根据实证分析的结果,为电影制片商、发行商和投资商...
【文章页数】:54 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.2 研究目的及意义
1.3 研究综述
1.3.1 国外研究综述
1.3.2 国内研究综述
1.4 研究内容
1.5 论文的组织结构
1.6 本章小结
第二章 电影票房预测模型的理论基础
2.1 机器学习
2.1.1 机器学习的概念
2.1.2 机器学习的历史
2.1.3 机器学习的分类
2.1.4 模型算法的选择
2.2 决策树分类理论
2.2.1 决策树简介
2.2.2 决策树分类
2.2.3 决策树算法及相关概念
2.2.4 决策树简化
2.2.5 决策树的优缺点
2.3 朴素贝叶斯分类理论
2.3.1 贝叶斯定理
2.3.2 朴素贝叶斯
2.3.3 离散属性与连续属性值的分别处理
2.3.4 朴素贝叶斯的优缺点
2.4 决策树的改进算法——随机森林
2.4.1 随机森林简介
2.4.2 随机森林的工作原理
2.4.3 随机森林的优缺点
2.5 性能评价指标
2.6 本章小结
第三章 电影票房数据采集及预处理
3.1 数据采集
3.2 数据预处理
3.2.1 数据清洗
3.2.2 数据归约
3.2.3 数据变换
3.3 本章小结
第四章 电影票房预测模型分析
4.1 数据划分
4.2 决策树模型的建立
4.2.1 决策树模型建立的流程
4.2.2 决策树模型建立过程
4.2.3 决策树模型评价
4.2.4 决策树模型变量重要性
4.3 朴素贝叶斯模型的建立
4.3.1 朴素贝叶斯模型建立的流程
4.3.2 朴素贝叶斯模型建立过程
4.3.3 朴素贝叶斯模型评价
4.3.4 朴素贝叶斯模型变量重要性
4.4 随机森林模型的建立
4.4.1 随机森林模型建立的流程
4.4.2 随机森林模型建立过程
4.4.3 随机森林模型评价
4.4.4 随机森林模型变量重要性
4.5 三种模型的预测对比
4.6 模型的重要因素对比
4.7 本章小结
第五章 结论和建议
5.1 论文结论
5.2 相关建议
5.3 不足之处
5.4 本章小结
致谢
参考文献
攻读学位期间参加科研情况及获得的学术成果
【参考文献】:
期刊论文
[1]机器学习在高校课程教学评价中的应用研究[J]. 门秀萍. 福建电脑. 2019(10)
[2]中国电影票房现状计量分析[J]. 白皓,陈绍刚. 合作经济与科技. 2019(01)
[3]贝叶斯分类模型在学生成绩预测中的应用研究[J]. 韩丽娜. 计算机与数字工程. 2018(10)
[4]中国电影票房的影响因素研究——基于2014-2016年间上映的340部电影的调查分析[J]. 邹霞,谢金文. 中国电影市场. 2018(06)
[5]数据挖掘中改进的C4.5决策树分类算法[J]. 王文霞. 吉林大学学报(理学版). 2017(05)
[6]决策树算法在学生成绩分析中的应用研究[J]. 韩丽娜,韩改宁. 电子设计工程. 2017(02)
[7]基于随机森林算法的用电负荷预测研究[J]. 李婉华,陈宏,郭昆,郭松荣,韩嘉民,陈羽中. 计算机工程与应用. 2016(23)
[8]基于多分类SVM和Hd的目标跟踪算法[J]. 苗超维,秦品乐. 计算机工程与设计. 2016(11)
[9]基于相关系数的ID3优化算法[J]. 吴思博,陈志刚,黄瑞. 计算机工程与科学. 2016(11)
[10]决策树ID3算法及其改进[J]. 杨洋. 软件导刊. 2016(08)
博士论文
[1]云计算安全动态检测与静态评测技术研究[D]. 赵鑫龙.大连海事大学 2017
[2]机器学习方法在入侵检测中的应用研究[D]. 解男男.吉林大学 2015
[3]基于机器学习的目标跟踪技术研究[D]. 陈东成.中国科学院研究生院(长春光学精密机械与物理研究所) 2015
硕士论文
[1]基于机器学习的第三方追踪和反广告拦截检测系统[D]. 孙景雪.西安电子科技大学 2019
[2]中国国产电影票房的影响因素研究[D]. 刘暄.中国科学技术大学 2019
[3]电影票房预测的实证研究[D]. 何继康.天津财经大学 2018
[4]IP因子在早期电影票房预测中的影响研究[D]. 尹聪敏.北京工业大学 2018
[5]中国电影票房影响因素分析及预测[D]. 蒙晓庆.天津财经大学 2018
[6]基于深度学习卷积神经网络的电影票房预测[D]. 张雪.首都经济贸易大学 2017
[7]大数据背景下电影作品的收益法评估应用研究[D]. 许萌萌.首都经济贸易大学 2017
[8]豆瓣网站电影在线评分的混合预测模型研究[D]. 刘明昌.河北大学 2017
[9]奥斯卡评奖机制下最佳影片与提名影片比较研究[D]. 李艳.山东师范大学 2017
[10]基于随机森林的电影票房价值评估[D]. 范伟伟.杭州电子科技大学 2017
本文编号:3718831
【文章页数】:54 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.2 研究目的及意义
1.3 研究综述
1.3.1 国外研究综述
1.3.2 国内研究综述
1.4 研究内容
1.5 论文的组织结构
1.6 本章小结
第二章 电影票房预测模型的理论基础
2.1 机器学习
2.1.1 机器学习的概念
2.1.2 机器学习的历史
2.1.3 机器学习的分类
2.1.4 模型算法的选择
2.2 决策树分类理论
2.2.1 决策树简介
2.2.2 决策树分类
2.2.3 决策树算法及相关概念
2.2.4 决策树简化
2.2.5 决策树的优缺点
2.3 朴素贝叶斯分类理论
2.3.1 贝叶斯定理
2.3.2 朴素贝叶斯
2.3.3 离散属性与连续属性值的分别处理
2.3.4 朴素贝叶斯的优缺点
2.4 决策树的改进算法——随机森林
2.4.1 随机森林简介
2.4.2 随机森林的工作原理
2.4.3 随机森林的优缺点
2.5 性能评价指标
2.6 本章小结
第三章 电影票房数据采集及预处理
3.1 数据采集
3.2 数据预处理
3.2.1 数据清洗
3.2.2 数据归约
3.2.3 数据变换
3.3 本章小结
第四章 电影票房预测模型分析
4.1 数据划分
4.2 决策树模型的建立
4.2.1 决策树模型建立的流程
4.2.2 决策树模型建立过程
4.2.3 决策树模型评价
4.2.4 决策树模型变量重要性
4.3 朴素贝叶斯模型的建立
4.3.1 朴素贝叶斯模型建立的流程
4.3.2 朴素贝叶斯模型建立过程
4.3.3 朴素贝叶斯模型评价
4.3.4 朴素贝叶斯模型变量重要性
4.4 随机森林模型的建立
4.4.1 随机森林模型建立的流程
4.4.2 随机森林模型建立过程
4.4.3 随机森林模型评价
4.4.4 随机森林模型变量重要性
4.5 三种模型的预测对比
4.6 模型的重要因素对比
4.7 本章小结
第五章 结论和建议
5.1 论文结论
5.2 相关建议
5.3 不足之处
5.4 本章小结
致谢
参考文献
攻读学位期间参加科研情况及获得的学术成果
【参考文献】:
期刊论文
[1]机器学习在高校课程教学评价中的应用研究[J]. 门秀萍. 福建电脑. 2019(10)
[2]中国电影票房现状计量分析[J]. 白皓,陈绍刚. 合作经济与科技. 2019(01)
[3]贝叶斯分类模型在学生成绩预测中的应用研究[J]. 韩丽娜. 计算机与数字工程. 2018(10)
[4]中国电影票房的影响因素研究——基于2014-2016年间上映的340部电影的调查分析[J]. 邹霞,谢金文. 中国电影市场. 2018(06)
[5]数据挖掘中改进的C4.5决策树分类算法[J]. 王文霞. 吉林大学学报(理学版). 2017(05)
[6]决策树算法在学生成绩分析中的应用研究[J]. 韩丽娜,韩改宁. 电子设计工程. 2017(02)
[7]基于随机森林算法的用电负荷预测研究[J]. 李婉华,陈宏,郭昆,郭松荣,韩嘉民,陈羽中. 计算机工程与应用. 2016(23)
[8]基于多分类SVM和Hd的目标跟踪算法[J]. 苗超维,秦品乐. 计算机工程与设计. 2016(11)
[9]基于相关系数的ID3优化算法[J]. 吴思博,陈志刚,黄瑞. 计算机工程与科学. 2016(11)
[10]决策树ID3算法及其改进[J]. 杨洋. 软件导刊. 2016(08)
博士论文
[1]云计算安全动态检测与静态评测技术研究[D]. 赵鑫龙.大连海事大学 2017
[2]机器学习方法在入侵检测中的应用研究[D]. 解男男.吉林大学 2015
[3]基于机器学习的目标跟踪技术研究[D]. 陈东成.中国科学院研究生院(长春光学精密机械与物理研究所) 2015
硕士论文
[1]基于机器学习的第三方追踪和反广告拦截检测系统[D]. 孙景雪.西安电子科技大学 2019
[2]中国国产电影票房的影响因素研究[D]. 刘暄.中国科学技术大学 2019
[3]电影票房预测的实证研究[D]. 何继康.天津财经大学 2018
[4]IP因子在早期电影票房预测中的影响研究[D]. 尹聪敏.北京工业大学 2018
[5]中国电影票房影响因素分析及预测[D]. 蒙晓庆.天津财经大学 2018
[6]基于深度学习卷积神经网络的电影票房预测[D]. 张雪.首都经济贸易大学 2017
[7]大数据背景下电影作品的收益法评估应用研究[D]. 许萌萌.首都经济贸易大学 2017
[8]豆瓣网站电影在线评分的混合预测模型研究[D]. 刘明昌.河北大学 2017
[9]奥斯卡评奖机制下最佳影片与提名影片比较研究[D]. 李艳.山东师范大学 2017
[10]基于随机森林的电影票房价值评估[D]. 范伟伟.杭州电子科技大学 2017
本文编号:3718831
本文链接:https://www.wllwen.com/shoufeilunwen/zaizhiboshi/3718831.html