基于FV-SA-SVM的电影评论情感分析
发布时间:2021-06-01 22:40
近年来,中国经济飞速发展,早已成为全球第二大经济体,人民生活水平不断提高,人民享受生活的方式越来越多样化,看电影则是主要的形式之一。随着观众人数的激增,电影市场规模也在逐渐扩大。根据国家电影局数据显示,2018年全国电影总票房为609.76亿元,我国已坐稳全球第二大电影市场。21世纪,互联网技术日新月异,随着手机的普及以及众多观影APP如雨后春岁般的涌出,人们可以随时随地的在网上购买电影票以及发表观影评论。根据观众的影评,可以得知他们的情感倾向,深度剖析观众对于电影的看法,从中总结出优点以及不足,指引电影业朝着更好的方向发展,使得观众影评的价值最大化。本文从猫眼APP爬取了动作、喜剧、青春以及悬疑四个类型共八部电影的影评,首先对影评进行预处理,然后使用FV-SA-SVM将影评划分为积极评论和消极评论两类,结果显示FV-SA-SVM算法的准确率分别达到了97.8%、95.3%、96.1%以及97.4%。接着将这种分类算法与SA-SVM算法、传统分类算法进行比较,发现FV-SA-SVM算法的准确率、精确率、召回率以及F1-Score这四个指标均优于SA-SVM算法和传统分类算法,从而验证了...
【文章来源】:上海师范大学上海市
【文章页数】:86 页
【学位级别】:硕士
【部分图文】:
012-2018年全国票房统计情况
上海师范大学硕士学位论文第1章绪论95.LDA模型进行主题抓龋主题模型通过对影评中隐含的主题进行挖掘,能够把两个通过词特征被认定为没有相似性的词汇以一定概率放在同一主题下,从而提取影评中主题相关度的方法。生成模型,就是认为每一篇文章的每一个词都是通过以“一定的概率选择了某个主题,并从这个主题中以一定的概率选择了某个词语”的过程得到的。由此,如果要产生一篇文章,每个词语出现的概率可表示为如下公式:(|)(|)(|)主题P词语文档P词语主题P主题文档(1.8)上式的概率公式可以用矩阵图表示为:其中“文档-单词”矩阵表示每个文档中每个单词的词频,即出现的概率;“主题-单词”矩阵表示每个主题中每个单词的出现概率;“文档-主题”矩阵表示每个文档中每个主题出现的概率。我们首先对文本进行了分词等工作,然后统计计算出逐个单词词频,就可以得到第一个矩阵,LDA模型就是通过第一个矩阵得到第二、三个矩阵得以实现的。文档生成过程如下图所示:图1-3LDA生成文档示意图
上海师范大学硕士学位论文第2章文献综述与相关理论182.2相关理论2.2.1支持向量机支持向量机(supportvectormachines)是一种二分类模型,它的目的是寻找一个超平面来对样本进行分割,分割的原则是间隔最大化,最终转化为一个凸二次规划问题来求解。由简至繁的模型包括:1.当训练样本线性可分时,通过硬间隔最大化,学习一个线性可分支持向量机;2.当训练样本近似线性可分时,通过软间隔最大化,学习一个线性支持向量机;3.当训练样本线性不可分时,通过核技巧和软间隔最大化,学习一个非线性支持向量机;给定训练样本集),(,),,(11mmyxyxD,其中]1,1[iy,分类学习最基本的想法就是基于训练集D在样本空间中找到一个划分超平面,将不同类别的样本分开。图2-1存在多个划分超平面将两类样本分开直观看上去,能将训练样本分开的划分超平面有很多,但应该去找位于两类训练样本“正中间”的划分超平面,即图4中红色的那条,因为该划分
【参考文献】:
期刊论文
[1]基于Word2vec和改进型TF-IDF的卷积神经网络文本分类模型[J]. 王根生,黄学坚. 小型微型计算机系统. 2019(05)
[2]基于SA-SVM的中文文本分类研究[J]. 郭超磊,陈军华. 计算机应用与软件. 2019(03)
[3]网络电影评论的情感倾向性分类研究[J]. 唐利. 遵义师范学院学报. 2018(06)
[4]A Novel Active Learning Method Using SVM for Text Classification[J]. Mohamed Goudjil,Mouloud Koudil,Mouldi Bedda,Noureddine Ghoggali. International Journal of Automation and Computing. 2018(03)
[5]基于粒子群算法的支持向量机的参数优化[J]. 陈晋音,熊晖,郑海斌. 计算机科学. 2018(06)
[6]基于模拟退火的自适应水波优化算法[J]. 王万良,陈超,李笠,李伟琨. 计算机科学. 2017(10)
[7]基于中心向量的多级分类KNN算法研究[J]. 刘述昌,张忠林. 计算机工程与科学. 2017(09)
[8]基于多注意力卷积神经网络的特定目标情感分析[J]. 梁斌,刘全,徐进,周倩,章鹏. 计算机研究与发展. 2017(08)
[9]基于词向量的电影评论情感分析方法[J]. 殷复莲,潘幸艺,柴剑平. 现代电影技术. 2017(08)
[10]一种基于LDA主题模型的评论文本情感分类方法[J]. 王伟,周咏梅,阳爱民,周剑峰,林江豪. 数据采集与处理. 2017(03)
硕士论文
[1]基于深度神经网络的中文情感分析研究[D]. 戴立武.华南理工大学 2019
[2]基于SOW-BTM的网络电影评论情感分类研究[D]. 胡晓康.山西财经大学 2018
[3]基于Stacking方法的电影票房预测[D]. 甘雨涵.上海师范大学 2018
[4]电商空调产品的评论数据情感分析[D]. 杨瑞欣.山西大学 2017
[5]基于中文微博的电影评论情感极性分类及舆论演化分析[D]. 牟兴.西华大学 2017
[6]基于情感词典与句型分类的中文微博情感分析研究[D]. 周杰.宁夏大学 2016
[7]网购评语情感挖掘研究[D]. 王任远.大连海事大学 2014
[8]面向微博电影评论的情感分类研究[D]. 李明.云南财经大学 2014
[9]面向英文电影评论的文本情感倾向性分类研究[D]. 冯莉.大连海事大学 2013
[10]网络电影评论的情感挖掘分析[D]. 郭伟.吉林大学 2010
本文编号:3210294
【文章来源】:上海师范大学上海市
【文章页数】:86 页
【学位级别】:硕士
【部分图文】:
012-2018年全国票房统计情况
上海师范大学硕士学位论文第1章绪论95.LDA模型进行主题抓龋主题模型通过对影评中隐含的主题进行挖掘,能够把两个通过词特征被认定为没有相似性的词汇以一定概率放在同一主题下,从而提取影评中主题相关度的方法。生成模型,就是认为每一篇文章的每一个词都是通过以“一定的概率选择了某个主题,并从这个主题中以一定的概率选择了某个词语”的过程得到的。由此,如果要产生一篇文章,每个词语出现的概率可表示为如下公式:(|)(|)(|)主题P词语文档P词语主题P主题文档(1.8)上式的概率公式可以用矩阵图表示为:其中“文档-单词”矩阵表示每个文档中每个单词的词频,即出现的概率;“主题-单词”矩阵表示每个主题中每个单词的出现概率;“文档-主题”矩阵表示每个文档中每个主题出现的概率。我们首先对文本进行了分词等工作,然后统计计算出逐个单词词频,就可以得到第一个矩阵,LDA模型就是通过第一个矩阵得到第二、三个矩阵得以实现的。文档生成过程如下图所示:图1-3LDA生成文档示意图
上海师范大学硕士学位论文第2章文献综述与相关理论182.2相关理论2.2.1支持向量机支持向量机(supportvectormachines)是一种二分类模型,它的目的是寻找一个超平面来对样本进行分割,分割的原则是间隔最大化,最终转化为一个凸二次规划问题来求解。由简至繁的模型包括:1.当训练样本线性可分时,通过硬间隔最大化,学习一个线性可分支持向量机;2.当训练样本近似线性可分时,通过软间隔最大化,学习一个线性支持向量机;3.当训练样本线性不可分时,通过核技巧和软间隔最大化,学习一个非线性支持向量机;给定训练样本集),(,),,(11mmyxyxD,其中]1,1[iy,分类学习最基本的想法就是基于训练集D在样本空间中找到一个划分超平面,将不同类别的样本分开。图2-1存在多个划分超平面将两类样本分开直观看上去,能将训练样本分开的划分超平面有很多,但应该去找位于两类训练样本“正中间”的划分超平面,即图4中红色的那条,因为该划分
【参考文献】:
期刊论文
[1]基于Word2vec和改进型TF-IDF的卷积神经网络文本分类模型[J]. 王根生,黄学坚. 小型微型计算机系统. 2019(05)
[2]基于SA-SVM的中文文本分类研究[J]. 郭超磊,陈军华. 计算机应用与软件. 2019(03)
[3]网络电影评论的情感倾向性分类研究[J]. 唐利. 遵义师范学院学报. 2018(06)
[4]A Novel Active Learning Method Using SVM for Text Classification[J]. Mohamed Goudjil,Mouloud Koudil,Mouldi Bedda,Noureddine Ghoggali. International Journal of Automation and Computing. 2018(03)
[5]基于粒子群算法的支持向量机的参数优化[J]. 陈晋音,熊晖,郑海斌. 计算机科学. 2018(06)
[6]基于模拟退火的自适应水波优化算法[J]. 王万良,陈超,李笠,李伟琨. 计算机科学. 2017(10)
[7]基于中心向量的多级分类KNN算法研究[J]. 刘述昌,张忠林. 计算机工程与科学. 2017(09)
[8]基于多注意力卷积神经网络的特定目标情感分析[J]. 梁斌,刘全,徐进,周倩,章鹏. 计算机研究与发展. 2017(08)
[9]基于词向量的电影评论情感分析方法[J]. 殷复莲,潘幸艺,柴剑平. 现代电影技术. 2017(08)
[10]一种基于LDA主题模型的评论文本情感分类方法[J]. 王伟,周咏梅,阳爱民,周剑峰,林江豪. 数据采集与处理. 2017(03)
硕士论文
[1]基于深度神经网络的中文情感分析研究[D]. 戴立武.华南理工大学 2019
[2]基于SOW-BTM的网络电影评论情感分类研究[D]. 胡晓康.山西财经大学 2018
[3]基于Stacking方法的电影票房预测[D]. 甘雨涵.上海师范大学 2018
[4]电商空调产品的评论数据情感分析[D]. 杨瑞欣.山西大学 2017
[5]基于中文微博的电影评论情感极性分类及舆论演化分析[D]. 牟兴.西华大学 2017
[6]基于情感词典与句型分类的中文微博情感分析研究[D]. 周杰.宁夏大学 2016
[7]网购评语情感挖掘研究[D]. 王任远.大连海事大学 2014
[8]面向微博电影评论的情感分类研究[D]. 李明.云南财经大学 2014
[9]面向英文电影评论的文本情感倾向性分类研究[D]. 冯莉.大连海事大学 2013
[10]网络电影评论的情感挖掘分析[D]. 郭伟.吉林大学 2010
本文编号:3210294
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/3210294.html