卷烟在线评论的文本情感分析
发布时间:2021-10-09 03:52
【背景和目的】卷烟在线评论能够真实反映卷烟的口碑,有助于卷烟工商企业了解消费者的卷烟使用体验和卷烟口碑动态。为了从海量卷烟消费在线评论中提炼有效的消费者体验信息,本文进行了卷烟在线评论的文本情感分析研究。【方法】首先构建了适用于烟草领域的卷烟在线评论情感词典,并据此建立了卷烟评价文本情感分析模型。然后选取烟悦网(http://www.yanyue.cn/)上评论较多两款卷烟产品作为研究对象,通过Python通用网络爬虫采集了2008年至2018年两个产品的在线评论,经数据清洗处理后,得到有效在线评论数据。将评论数据输入卷烟评价文本情感分析模型,按照产品、时间、地区等维度分别计算出情感指数。通过情感指数变化和比较,可以洞察卷烟在线评论中的情感表达,并给出了相应的对策与建议。【结论】情感指数能够为卷烟经营评价方式提供新的洞察力,动态监测消费者情感变化,及时把握烟草市场环境的消费者情感趋势。
【文章来源】:中国烟草学报. 2020,26(02)北大核心CSCD
【文章页数】:9 页
【部分图文】:
研究路线图
(3)引入卷烟在线评论情感词典,设定积极词分值为1,消极词分值为-1。从评论的第一个词开始,如果词语属于卷烟在线评论情感词典,则判断该词前是否有程度副词,如果有,则用程度副词权重与词语分值相乘,如果程度副词前还包含否定词,则用否定词权重、程度副词权重与词语分值相乘。遍历进行至整条评论没有情感词为止,将每次遍历过程的得分进行加和,得到基于卷烟在线评论情感词典的情感评分。(4)将(3)中的评分进行0-1标准化处理后,与(1)中评分相加,进行再次0-1标准化处理,得到最终的评论情感得分。
以评论“口感醇和柔顺,香气非常正道,价格稍贵”为例,基于SnowNLP计算整句评论的情感得分为S1(0.92),由卷烟在线评论情感词典可知,“醇和”、“柔顺”为口感的积极情感词,“正道”为香气的积极情感词且“非常”为极量程度副词,“贵”为价格的消极情感词且“稍”为中量程度副词,则基于卷烟在线评论情感词典计算所得情感得分为S2(2.8)。将S2进行0-1标准化后与S1相加得到S3(1.46),对S3再进行0-1标准化得到最终情感评分0.72。SnowNLP情感分析将句子的情感程度表示为[0,1]区间的情感分值,即判断句子极性的概率。本文对卷烟在线评论情感文本情感分析结果采用三级分类,即积极、消极和中性。根据文本情感判断模型的情感分值与0.5比较情况,做出判别,即将得分大于0.5、等于0.5、小于0.5分为积极情感、中性情感、消极情感三类。采用Python实现图2模型,得到2008年至2018年卷烟在线评论情感判断的结果(如表4,仅列举部分)。
【参考文献】:
期刊论文
[1]基于Python的微博情感分析系统设计[J]. 王欣,周文龙. 信息与电脑(理论版). 2019(06)
[2]基于在线评论情感分析的海淘APP用户满意度研究[J]. 赵杨,李齐齐,陈雨涵,曹文航. 数据分析与知识发现. 2018(11)
[3]维吾尔文情感分类特征建设研究[J]. 热西旦木·吐尔洪太,吾守尔·斯拉木. 计算机应用研究. 2019(12)
[4]基于互联网文本情感分析的消费情感指数构建[J]. 刘苗,李蔚,朱述政,喻燕君,刘扬,纪宏. 统计与信息论坛. 2018(08)
[5]面向旅游在线评论情感词典构建方法[J]. 严仲培,陆文星,束柬,王彬有. 计算机应用研究. 2019(06)
[6]面向商品评论文本的情感分析与挖掘[J]. 李涵昱,钱力,周鹏飞. 情报科学. 2017(01)
[7]文本情感分析[J]. 赵妍妍,秦兵,刘挺. 软件学报. 2010(08)
本文编号:3425581
【文章来源】:中国烟草学报. 2020,26(02)北大核心CSCD
【文章页数】:9 页
【部分图文】:
研究路线图
(3)引入卷烟在线评论情感词典,设定积极词分值为1,消极词分值为-1。从评论的第一个词开始,如果词语属于卷烟在线评论情感词典,则判断该词前是否有程度副词,如果有,则用程度副词权重与词语分值相乘,如果程度副词前还包含否定词,则用否定词权重、程度副词权重与词语分值相乘。遍历进行至整条评论没有情感词为止,将每次遍历过程的得分进行加和,得到基于卷烟在线评论情感词典的情感评分。(4)将(3)中的评分进行0-1标准化处理后,与(1)中评分相加,进行再次0-1标准化处理,得到最终的评论情感得分。
以评论“口感醇和柔顺,香气非常正道,价格稍贵”为例,基于SnowNLP计算整句评论的情感得分为S1(0.92),由卷烟在线评论情感词典可知,“醇和”、“柔顺”为口感的积极情感词,“正道”为香气的积极情感词且“非常”为极量程度副词,“贵”为价格的消极情感词且“稍”为中量程度副词,则基于卷烟在线评论情感词典计算所得情感得分为S2(2.8)。将S2进行0-1标准化后与S1相加得到S3(1.46),对S3再进行0-1标准化得到最终情感评分0.72。SnowNLP情感分析将句子的情感程度表示为[0,1]区间的情感分值,即判断句子极性的概率。本文对卷烟在线评论情感文本情感分析结果采用三级分类,即积极、消极和中性。根据文本情感判断模型的情感分值与0.5比较情况,做出判别,即将得分大于0.5、等于0.5、小于0.5分为积极情感、中性情感、消极情感三类。采用Python实现图2模型,得到2008年至2018年卷烟在线评论情感判断的结果(如表4,仅列举部分)。
【参考文献】:
期刊论文
[1]基于Python的微博情感分析系统设计[J]. 王欣,周文龙. 信息与电脑(理论版). 2019(06)
[2]基于在线评论情感分析的海淘APP用户满意度研究[J]. 赵杨,李齐齐,陈雨涵,曹文航. 数据分析与知识发现. 2018(11)
[3]维吾尔文情感分类特征建设研究[J]. 热西旦木·吐尔洪太,吾守尔·斯拉木. 计算机应用研究. 2019(12)
[4]基于互联网文本情感分析的消费情感指数构建[J]. 刘苗,李蔚,朱述政,喻燕君,刘扬,纪宏. 统计与信息论坛. 2018(08)
[5]面向旅游在线评论情感词典构建方法[J]. 严仲培,陆文星,束柬,王彬有. 计算机应用研究. 2019(06)
[6]面向商品评论文本的情感分析与挖掘[J]. 李涵昱,钱力,周鹏飞. 情报科学. 2017(01)
[7]文本情感分析[J]. 赵妍妍,秦兵,刘挺. 软件学报. 2010(08)
本文编号:3425581
本文链接:https://www.wllwen.com/guanlilunwen/shengchanguanlilunwen/3425581.html