面向中文产品评论的情感分析研究

发布时间:2021-07-17 17:09
  在Web2.0时代,用户是创造信息的主体。随着社交媒体和电商平台的急速发展,每天都有海量用户参与到人物、事件、产品的评论中来,这些信息有效传达了人们各种各样的观点和情感倾向。海量的中文产品评论数据为快捷、高效和科学获取用户对于产品的情感满意度提供了可能。然而,人工方法很难科学合理地对海量文本评论进行归纳和整理和应用。如何从这些非结构化的数据中挖掘出潜在的价值成为互联网产业的迫切需求。基于自然语言处理的文本情感分析技术主要是在大数据领域相关技术方法获取和处理中文用户评论数据的基础上,针对如何快速实现用户评论数据的自动分类、检测和归纳,快捷、高效和科学地评估用户满意度进行研究与应用。然而,针对具体主题领域的数据,传统文档级情感分析方法对数据的多维度认知尚存在一定程度的不足,亟待从属性角度寻求新的技术方法。针对大数据时代海量中文产品评论的情感分析问题,在对国内外情感分析技术和方法研究和分析的基础上,采用同一数据集,对传统通用情感词典进行性能测试,并通过情感分析实验对比分析基于情感词典与基于机器学习的情感分析方法的性能和特点。对Word2Vec词向量分布式表示模型和BERT语言表示模型的结构、... 

【文章来源】:西南大学重庆市 211工程院校 教育部直属院校

【文章页数】:102 页

【学位级别】:硕士

【部分图文】:

面向中文产品评论的情感分析研究


技术路线

字体,文本


西南大学工程硕士学位论文12gensim库中的函数将数据转化为txt文件,转换格式后的文本命名为wiki.zh.txt,这些语料中有大量的繁体字(图2-1),这里使用了OpenCC工具将所有的文本数据都变成简体文字(图2-2),转换后的文本命名为wiki.zh.simp.txt。图2-1字体转换前Fig.2-1Beforefontconversion图2-2字体转换后Fig.2-2Afterfontconversion

字体,文本


西南大学工程硕士学位论文12gensim库中的函数将数据转化为txt文件,转换格式后的文本命名为wiki.zh.txt,这些语料中有大量的繁体字(图2-1),这里使用了OpenCC工具将所有的文本数据都变成简体文字(图2-2),转换后的文本命名为wiki.zh.simp.txt。图2-1字体转换前Fig.2-1Beforefontconversion图2-2字体转换后Fig.2-2Afterfontconversion

【参考文献】:
期刊论文
[1]中国互联网发展进入万物互联新阶段[J]. 张莉.  中国对外贸易. 2019(08)
[2]基于Python的微博情感分析系统设计[J]. 王欣,周文龙.  信息与电脑(理论版). 2019(06)
[3]基于Tornado的课程管理系统的设计与实现[J]. 刘涛,孙茜,易善凯.  软件工程. 2018(12)
[4]基于隐马尔可夫模型的中文分词[J]. 吴帅,潘海珍.  现代计算机(专业版). 2018(33)
[5]基于word2vec词模型的中文短文本分类方法[J]. 高明霞,李经纬.  山东大学学报(工学版). 2019(02)
[6]基于集成神经网络的短文本分类模型[J]. 高云龙,左万利,王英,王鑫.  吉林大学学报(理学版). 2018(04)
[7]基于决策树的网民评价情感分析[J]. 刘钢,张维石.  现代计算机(专业版). 2017(32)
[8]情感词典构建综述[J]. 梅莉莉,黄河燕,周新宇,毛先领.  中文信息学报. 2016(05)
[9]面向短文本情感分类的特征拓扑聚合模型[J]. 胡杨,冯旭鹏,黄青松,付晓东,刘骊,刘利军.  中文信息学报. 2016(05)
[10]基于朴素贝叶斯的文本分类研究综述[J]. 贺鸣,孙建军,成颖.  情报科学. 2016(07)



本文编号:3288592

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3288592.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户33f95***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com