面向电子商务的评论文本情感分析研究
发布时间:2017-09-20 19:26
本文关键词:面向电子商务的评论文本情感分析研究
更多相关文章: 情感分析 评论文本 情感词典 隐含语义索引 序列回归
【摘要】:评论文本情感分析一般是指通过基于语义或者机器学习的方法对评论文本挖掘和分析并从中获取能够表达消费者评论态度的一些主观信息,如立场、建议、情绪等,在完成这些工作的之后对评论文本的情感倾向进行计算,并给出判断。近年来随着电子商务的发展,面向电子商务的评论文本情感分析研究已经成为了当前相关领域的重点研究课题。通过对相关商品的评论文本进行情感分析可以使买卖双方准确了解商品的优缺点及消费者对商品的评论。从而为卖方改进商品、制定合适的销售策略以及为买方根据自己的需求购买合适的商品提供有效依据。然而,由于传统的评论文本情感分析方法大都仅采用统计评论中褒、贬义词数量并对其进行分析得出评论判断结果,难以准确获取对评论的真实情感。论文针对传统评论文本情感分析方法存在的缺点,采用基于语义和机器学习的方法对评论文本情感分析问题进行研究验证论文中的方法可以提高情感分析准确率。具体工作如下: 1.采用情感词典对评论文本进行特征提取,并构建分类模型进行评论文本情感分析。论文针对笔记本电脑领域评论文本的特点,综合考虑修饰词和评价搭配关系构建情感词典,并给出情感词典各要素词典的情感强度标注处理方法。论文构建的情感词典主要的主要元素包括评价要素、情感词/评价词、否定词、程度副词、转折词以及评价搭配关系,在处理完这些主要元素的情感倾向强度标注之后对评论文本的情感倾向进行计算,并通过实验证明修饰词典以及评价搭配词典对情感分类的有效性。 2.采用隐含语义索引方法对评论文本进行特征变换,并构建分类模型进行评论文本情感分析。论文针对电子商务中分级打分问题的实际需求,采用隐含语义索引方法对评论文本进行文本模型表示并实现词-文档矩阵的维数约减,在此基础上利用核判别学习序列回归方法对训练样本集进行训练,获得的序列回归模型可以实现对评论文本的情感分级,并通过与VSM特征变换下的情感分析方法进行对比实验证明了基于隐含语义索引的评论文本情感序列回归方法对情感分析的有效性。
【关键词】:情感分析 评论文本 情感词典 隐含语义索引 序列回归
【学位授予单位】:中国科学技术大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.1
【目录】:
- 摘要5-6
- ABSTRACT6-8
- 目录8-11
- 第1章 绪论11-17
- 1.1 研究背景及研究意义11-12
- 1.2 文本情感分析研究综述12-15
- 1.2.1 情感分析相关知识介绍13
- 1.2.2 国内外研究现状13-15
- 1.2.2.1 国外研究现状14
- 1.2.2.2 国内研究现状14-15
- 1.3 论文主要工作15
- 1.4 论文组织结构15-17
- 第2章 文本情感分析基本原理17-33
- 2.1 基于机器学习的方法17-28
- 2.1.1 语料库选择18-19
- 2.1.2 文本预处理19-20
- 2.1.3 文本表示模型20-21
- 2.1.4 特征提取21-22
- 2.1.5 特征选择22-25
- 2.1.6 文本分类机器学习算法25-28
- 2.2 基于语义的方法28-32
- 2.2.1 情感词典综述29-31
- 2.2.1.1 情感词典相关知识29-30
- 2.2.1.2 常见中文情感词库30-31
- 2.2.2 情感词典扩展31-32
- 2.3 本章小结32-33
- 第3章 基于情感词典的评论文本情感分类研究33-45
- 3.1 情感词典构建33-37
- 3.1.1 评价要素选取33-34
- 3.1.2 情感词处理34-35
- 3.1.3 否定词处理35
- 3.1.4 程度副词处理35-36
- 3.1.5 转折词处理36
- 3.1.6 评价搭配词典构建36-37
- 3.2 情感倾向计算37-40
- 3.2.1 评价单元识别38-39
- 3.2.2 总结词识别39-40
- 3.2.3 情感倾向计算40
- 3.3 实验设计与结果分析40-43
- 3.3.1 实验语料选取41
- 3.3.2 实验评价指标41-42
- 3.3.3 实验设计42-43
- 3.3.4 实验结果与分析43
- 3.4 本章小结43-45
- 第4章 基于隐含语义索引的文本情感序列回归方法45-51
- 4.1 序列回归方法提出背景45
- 4.2 评论文本表示方法45-47
- 4.3 评论文本序列回归方法47
- 4.4 实验设计与结果分析47-49
- 4.4.1 实验语料选取48
- 4.4.2 实验设计48
- 4.4.3 实验结果与分析48-49
- 4.5 本章小结49-51
- 第5章 总结与展望51-53
- 5.1 研究工作总结51
- 5.2 未来工作展望51-53
- 参考文献53-57
- 致谢57-59
- 在读期间发表的学术论文与取得的其他研究成果59
【参考文献】
中国期刊全文数据库 前10条
1 廖祥文;曹冬林;方滨兴;许洪波;程学旗;;基于概率推理模型的博客倾向性检索研究[J];计算机研究与发展;2009年09期
2 刘志明;刘鲁;;基于机器学习的中文微博情感分类实证研究[J];计算机工程与应用;2012年01期
3 潘宇;林鸿飞;;基于语义极性分析的餐馆评论挖掘[J];计算机工程;2008年17期
4 吕林涛;董迎;;基于上下文的概念语义相似度计算模型[J];计算机工程;2010年21期
5 代六玲,黄河燕,陈肇雄;中文文本分类中特征抽取方法的比较研究[J];中文信息学报;2004年01期
6 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[J];中文信息学报;2006年01期
7 唐慧丰;谭松波;程学旗;;基于监督学习的中文情感分类技术比较研究[J];中文信息学报;2007年06期
8 徐军;丁宇新;王晓龙;;使用机器学习方法进行新闻的情感自动分类[J];中文信息学报;2007年06期
9 刘康;赵军;;基于层叠CRFs模型的句子褒贬度分析研究[J];中文信息学报;2008年01期
10 江敏;肖诗斌;王弘蔚;施水才;;一种改进的基于《知网》的词语语义相似度计算[J];中文信息学报;2008年05期
,本文编号:889971
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/889971.html