基于用户评论情感分析的电影票房预测研究
发布时间:2023-01-31 01:05
电影作为娱乐服务业的重要领域,丰富了人们的生活,为人们提供高质量的精神食量的同时,也逐步成为了我国经济市场中的一个重要部分。然而我国电影行业起步晚,发展慢,国内市场的营销机制并不完善,对电影票房进行预测可以帮助影院提前布局,增加票房收入,因此论文研究如何利用影评预测电影票房。本文主要内容如下:(1)本文从电影票房影响因子的研究和电影票房预测模型的研究两个方面,详细地介绍了电影票房预测的国内外的发展,并介绍了现在主流的电影票房预测方法。(2)针对CHI算法可能会产生多余无关特征问题,本文提出了一种CHI-SVD的特征提取算法,该算法在CHI提取出的特征的基础上用SVD算法进行降维处理,从而能够保留原始特征的基础上再降维处理,能够有效地减少时间成本。通过实验发现,CHI-SVD算法性能比CHI算法要好。(3)为了提高情感词典的质量,从而更好的进行情感分类,本文将基于情感词典和基于统计信息的情感分类方法相结合,减小情感分类会被情感词典构造所影响带来的缺点,从而使得情感分类的效果更好。(4)为了进一步对电影票房进行准确预测,本文提出了一种融合SVR和多元线性回归算法的随机森林回归算法,并将情感...
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 引言
1.1 研究背景与意义
1.1.1 电影产业的发展
1.1.2 电影网络评论的发展及其价值
1.2 国内外研究现状
1.2.1 电影票房影响因子的研究
1.2.2 电影票房模型的研究
1.3 主要研究内容
1.4 论文的组织结构
第2章 相关技术介绍
2.1 网络爬虫介绍
2.1.1 网络爬虫概述
2.1.2 Scrapy网络爬虫
2.2 预处理
2.2.1 分词
2.2.2 停用词
2.2.3 词性标注
2.2.4 依存句法分析
2.3 特征选择
2.3.1 TF-IDF
2.3.2 互信息
2.3.3 信息增益
2.3.4 卡方检验
2.4 分类算法
2.4.1 逻辑回归
2.4.2 支持向量机
2.4.3 随机森林算法
2.5 回归分析
2.5.1 多元线性回归
2.5.2 SVR
2.6 情感词典
2.7 奇异值分解
2.8 本章小结
第3章 CHI-SVD情感倾向特征提取方法
3.1 整体框架
3.2 算法流程
3.3 实验评估方式
3.4 特征实验结果
3.5 本章小结
第4章 基于随机森林回归的票房预测算法
4.1 基于随机森林的票房预测算法
4.2 变量的选择
4.2.1 基于情感词典的情感特征
4.2.2 电影评分
4.2.3 电影类型比较参数
4.3 本章小结
第5章 实验分析
5.1 实验整体流程设计
5.2 数据源分析
5.2.1 国内电影评论主要数据源
5.2.2 电影票房数据源
5.3 数据集的构建
5.4 情感词典的构建
5.4.1 基础情感词典
5.4.2 基于CHI-SVD构建的情感词典
5.4.3 否定词词典
5.4.4 程度词词典
5.5 各参数与票房的相关性
5.6 不同预测模型比较
5.7 Baseline对比试验
5.8 本章小结
第6章 总结
6.1 全文总结
6.2 展望
致谢
参考文献
攻读学位期间的研究成果
【参考文献】:
期刊论文
[1]论网络评价对电影票房走势的影响[J]. 朱子骥. 西部广播电视. 2019(21)
[2]基于LSTM模型的电影票房预测算法[J]. 杨朝强,蒋卫丽,邵党国. 数据通信. 2019(05)
[3]基于ARIMA模型的电影票房收入预测[J]. 郭苗苗,齐林. 价值工程. 2019(20)
[4]基于多部情感词典与SVM的电影评论情感分析[J]. 吴杰胜,陆奎,王诗兵. 阜阳师范学院学报(自然科学版). 2019(02)
[5]基于数据挖掘的电影票房分析[J]. 席稼玮. 通讯世界. 2019(03)
[6]我国电影票房收入增长对GDP增速的预测作用——基于混频数据抽样模型的实证分析[J]. 魏宇,杨惠,梅德祥. 西部论坛. 2018(05)
[7]基于Python爬虫的电影评论情感倾向性分析[J]. 涂小琴. 现代计算机(专业版). 2017(35)
[8]基于极性词典的中文微博客情感分类[J]. 王勇,吕学强,姬连春,肖诗斌. 计算机应用与软件. 2014(01)
[9]中国电影营销的现状与问题分析[J]. 高雅堃,赵岚. 北方经济. 2011(22)
[10]中国电影产业市场结构及绩效分析[J]. 王红艳. 中国电影市场. 2011(07)
博士论文
[1]基于市场结构分析的中国电影产业发展研究[D]. 邓向阳.湖南大学 2011
硕士论文
[1]票房预测中的社交网络评论情感挖掘技术研究[D]. 柳池煜.南京邮电大学 2019
[2]考虑竞争和消费意图的电影首映日票房预测方法[D]. 吴凡.北京工业大学 2019
[3]基于社交网络分析的电影票房预测系统的设计与实现[D]. 富泽萌.北京邮电大学 2019
[4]基于多元回归和神经网络的我国电影票房的研究[D]. 汤子涵.湖南师范大学 2018
[5]基于Stacking方法的电影票房预测[D]. 甘雨涵.上海师范大学 2018
[6]基于评论数据的情感强度研究与实现[D]. 韩思宇.北京邮电大学 2018
[7]豆瓣网站电影在线评分的混合预测模型研究[D]. 刘明昌.河北大学 2017
[8]在线影评和在线短评对票房收入影响的比较研究[D]. 钟碧园.北京邮电大学 2017
[9]面向社交媒体的电影票房预测技术的研究与应用[D]. 刘涛.河北科技大学 2016
[10]基于消费意图和情感分析的票房预测建模[D]. 袁媛.杭州电子科技大学 2016
本文编号:3733590
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第1章 引言
1.1 研究背景与意义
1.1.1 电影产业的发展
1.1.2 电影网络评论的发展及其价值
1.2 国内外研究现状
1.2.1 电影票房影响因子的研究
1.2.2 电影票房模型的研究
1.3 主要研究内容
1.4 论文的组织结构
第2章 相关技术介绍
2.1 网络爬虫介绍
2.1.1 网络爬虫概述
2.1.2 Scrapy网络爬虫
2.2 预处理
2.2.1 分词
2.2.2 停用词
2.2.3 词性标注
2.2.4 依存句法分析
2.3 特征选择
2.3.1 TF-IDF
2.3.2 互信息
2.3.3 信息增益
2.3.4 卡方检验
2.4 分类算法
2.4.1 逻辑回归
2.4.2 支持向量机
2.4.3 随机森林算法
2.5 回归分析
2.5.1 多元线性回归
2.5.2 SVR
2.6 情感词典
2.7 奇异值分解
2.8 本章小结
第3章 CHI-SVD情感倾向特征提取方法
3.1 整体框架
3.2 算法流程
3.3 实验评估方式
3.4 特征实验结果
3.5 本章小结
第4章 基于随机森林回归的票房预测算法
4.1 基于随机森林的票房预测算法
4.2 变量的选择
4.2.1 基于情感词典的情感特征
4.2.2 电影评分
4.2.3 电影类型比较参数
4.3 本章小结
第5章 实验分析
5.1 实验整体流程设计
5.2 数据源分析
5.2.1 国内电影评论主要数据源
5.2.2 电影票房数据源
5.3 数据集的构建
5.4 情感词典的构建
5.4.1 基础情感词典
5.4.2 基于CHI-SVD构建的情感词典
5.4.3 否定词词典
5.4.4 程度词词典
5.5 各参数与票房的相关性
5.6 不同预测模型比较
5.7 Baseline对比试验
5.8 本章小结
第6章 总结
6.1 全文总结
6.2 展望
致谢
参考文献
攻读学位期间的研究成果
【参考文献】:
期刊论文
[1]论网络评价对电影票房走势的影响[J]. 朱子骥. 西部广播电视. 2019(21)
[2]基于LSTM模型的电影票房预测算法[J]. 杨朝强,蒋卫丽,邵党国. 数据通信. 2019(05)
[3]基于ARIMA模型的电影票房收入预测[J]. 郭苗苗,齐林. 价值工程. 2019(20)
[4]基于多部情感词典与SVM的电影评论情感分析[J]. 吴杰胜,陆奎,王诗兵. 阜阳师范学院学报(自然科学版). 2019(02)
[5]基于数据挖掘的电影票房分析[J]. 席稼玮. 通讯世界. 2019(03)
[6]我国电影票房收入增长对GDP增速的预测作用——基于混频数据抽样模型的实证分析[J]. 魏宇,杨惠,梅德祥. 西部论坛. 2018(05)
[7]基于Python爬虫的电影评论情感倾向性分析[J]. 涂小琴. 现代计算机(专业版). 2017(35)
[8]基于极性词典的中文微博客情感分类[J]. 王勇,吕学强,姬连春,肖诗斌. 计算机应用与软件. 2014(01)
[9]中国电影营销的现状与问题分析[J]. 高雅堃,赵岚. 北方经济. 2011(22)
[10]中国电影产业市场结构及绩效分析[J]. 王红艳. 中国电影市场. 2011(07)
博士论文
[1]基于市场结构分析的中国电影产业发展研究[D]. 邓向阳.湖南大学 2011
硕士论文
[1]票房预测中的社交网络评论情感挖掘技术研究[D]. 柳池煜.南京邮电大学 2019
[2]考虑竞争和消费意图的电影首映日票房预测方法[D]. 吴凡.北京工业大学 2019
[3]基于社交网络分析的电影票房预测系统的设计与实现[D]. 富泽萌.北京邮电大学 2019
[4]基于多元回归和神经网络的我国电影票房的研究[D]. 汤子涵.湖南师范大学 2018
[5]基于Stacking方法的电影票房预测[D]. 甘雨涵.上海师范大学 2018
[6]基于评论数据的情感强度研究与实现[D]. 韩思宇.北京邮电大学 2018
[7]豆瓣网站电影在线评分的混合预测模型研究[D]. 刘明昌.河北大学 2017
[8]在线影评和在线短评对票房收入影响的比较研究[D]. 钟碧园.北京邮电大学 2017
[9]面向社交媒体的电影票房预测技术的研究与应用[D]. 刘涛.河北科技大学 2016
[10]基于消费意图和情感分析的票房预测建模[D]. 袁媛.杭州电子科技大学 2016
本文编号:3733590
本文链接:https://www.wllwen.com/wenyilunwen/dianyingdianshilunwen/3733590.html