票房预测中的社交网络评论情感挖掘技术研究
发布时间:2021-01-31 02:00
近年来,电影艺术已经深入大众的学习娱乐生活中。电影市场每一年都会经历大起大落的票房战争,有些影片能够从观众挑剔的审美观众脱颖而出,有些即时请了高流量的明星却依然收获惨淡的票房,不得不说的是,或许是因为近两年票房整体的不尽如人意。电影制作方与影评媒体的矛盾不断地被摆在大众面前,似乎一些电影票房失利,直接因素就是由于观众的执白影评导致的。随着社交媒体的兴起,电影评论的发布者不再局限于电影研究员或专家学者,各大电影评分类网站、影评类自媒体、观众本身迅速占据舆论的风口浪尖,或是为喜欢的影片发生或是提出尖锐的批评。影评对于电影市场票房到底有多大影响力,以及能从影评中挖掘出多少有价值的信息服务于电影的票房预测,这是本文主要探究的问题。本文从构建多关系主题模型开始,将短影评中涉及的所有电影关注点挖掘出来。另一方面,利用已有的数据训练情感分类的LSTM模型。将短影评汇聚利用人名识别算法提取所有主创的短句,然后利用与训练的情感分类模型对这些短句提取情感特征。将所提取的正负面情感占比的变化情况作为特征加入到预测模型之中,利用生命周期构建多阶段的电影票房预测模型。最后得出结论,在首周使用非线性的SVR模型而...
【文章来源】:南京邮电大学江苏省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
多阶段票房预测总体框架
图 2.1 统计分词方法础上,以二元模型(2-gram)为基本模型经过地,假设 表示了多个字组成的句子。其中词语为 ( ) = ( )= ( ) ( ) ( ) ( 大,利用马尔科夫假设,假定该词最多只与前二元模型。则上式表示为 ( ) = ( )= ш ( ) 合概率表达一种 的合理程度。那么在所有分词技术的目标。假设最佳切分是 ,那么分
命名实体识别任务以及歧义现象
【参考文献】:
期刊论文
[1]面向领域文献的无监督中文分词自动优化方法[J]. 倪维健,孙浩浩,刘彤,曾庆田. 数据分析与知识发现. 2018(02)
[2]一个有效的基于GBRT的早期电影票房预测模型[J]. 韩忠明,原碧鸿,陈炎,赵宁,段大高. 计算机应用研究. 2018(02)
[3]直播平台在社交媒体的新发展——以微博“一直播”为例[J]. 梁宇驰,罗璇. 新闻研究导刊. 2016(19)
[4]用于微博情感分析的一种情感语义增强的深度学习模型[J]. 何炎祥,孙松涛,牛菲菲,李飞. 计算机学报. 2017(04)
[5]基于机器学习的中文微博情感分类实证研究[J]. 刘志明,刘鲁. 计算机工程与应用. 2012(01)
[6]一种改进的中文分词正向最大匹配算法[J]. 王瑞雷,栾静,潘晓花,卢修配. 计算机应用与软件. 2011(03)
[7]基于VSM的文本相似度计算的研究[J]. 郭庆琳,李艳梅,唐琦. 计算机应用研究. 2008(11)
[8]融合多特征的最大熵汉语命名实体识别模型[J]. 张玥杰,徐智婷,薛向阳. 计算机研究与发展. 2008(06)
[9]中文分词十年回顾[J]. 黄昌宁,赵海. 中文信息学报. 2007(03)
[10]停用词表对中文文本情感分类的影响[J]. 王素格,魏英杰. 情报学报. 2008 (02)
硕士论文
[1]基于统计和语义信息的中文分词算法研究[D]. 李良洁.青岛科技大学 2015
本文编号:3010004
【文章来源】:南京邮电大学江苏省
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
多阶段票房预测总体框架
图 2.1 统计分词方法础上,以二元模型(2-gram)为基本模型经过地,假设 表示了多个字组成的句子。其中词语为 ( ) = ( )= ( ) ( ) ( ) ( 大,利用马尔科夫假设,假定该词最多只与前二元模型。则上式表示为 ( ) = ( )= ш ( ) 合概率表达一种 的合理程度。那么在所有分词技术的目标。假设最佳切分是 ,那么分
命名实体识别任务以及歧义现象
【参考文献】:
期刊论文
[1]面向领域文献的无监督中文分词自动优化方法[J]. 倪维健,孙浩浩,刘彤,曾庆田. 数据分析与知识发现. 2018(02)
[2]一个有效的基于GBRT的早期电影票房预测模型[J]. 韩忠明,原碧鸿,陈炎,赵宁,段大高. 计算机应用研究. 2018(02)
[3]直播平台在社交媒体的新发展——以微博“一直播”为例[J]. 梁宇驰,罗璇. 新闻研究导刊. 2016(19)
[4]用于微博情感分析的一种情感语义增强的深度学习模型[J]. 何炎祥,孙松涛,牛菲菲,李飞. 计算机学报. 2017(04)
[5]基于机器学习的中文微博情感分类实证研究[J]. 刘志明,刘鲁. 计算机工程与应用. 2012(01)
[6]一种改进的中文分词正向最大匹配算法[J]. 王瑞雷,栾静,潘晓花,卢修配. 计算机应用与软件. 2011(03)
[7]基于VSM的文本相似度计算的研究[J]. 郭庆琳,李艳梅,唐琦. 计算机应用研究. 2008(11)
[8]融合多特征的最大熵汉语命名实体识别模型[J]. 张玥杰,徐智婷,薛向阳. 计算机研究与发展. 2008(06)
[9]中文分词十年回顾[J]. 黄昌宁,赵海. 中文信息学报. 2007(03)
[10]停用词表对中文文本情感分类的影响[J]. 王素格,魏英杰. 情报学报. 2008 (02)
硕士论文
[1]基于统计和语义信息的中文分词算法研究[D]. 李良洁.青岛科技大学 2015
本文编号:3010004
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3010004.html