基于半监督递归自编码的情感分类研究
本文关键词:基于半监督递归自编码的情感分类研究
更多相关文章: 情感分类 SVM方法 深层学习 半监督RAE方法
【摘要】:文本情感分析在数据挖掘领域有着十分重要的地位,文本情感分类又是文本情感分析中的一项重要研究内容。文本情感分类是指利用自然语言处理方式,对文本的主观情感倾向性进行分析,包括抽取文本中与情感倾向性判断有关的各个要素,判断文本的情感倾向性等。文本的情感倾向性可以分为正面、负面、中立等不同情况。针对互联网上的海量评论文本,如何对其进行快速有效的分析与利用引起了越来越多学者的重视。目前关于情感分类问题的研究,主要分为基于情感词典的情感分类和基于机器学习的情感分类两大类,且都取得了不错的成果。但由于基于情感词典的分类方法中情感词典的好坏将直接影响最终分类的准确率,而情感词典的构建又完全依赖于人的主观经验,因而很多学者着力于构建更好更完整的情感词典。在基于传统机器学习的方法中,建模的过程中通常使用较简单的函数,计算也往往使用诸如统计等一些简单的运算方法,所以通常被认为是浅层学习。本文引入基于深层学习的半监督递归自编码(RAE, Recursive Auto Encoders)方法来解决中文文本的情感分类问题,它通过学习非线性的深层网络结构,利用分布式向量来表达文本的特征,从而弥补了浅层学习在表达能力和泛化能力方面的约束。为了证明半监督RAE方法的有效性,文中首先建立传统的支持向量机(SVM, Support Vector Machine)情感分类模型进行文本情感分类,得到的最优情感分类结果是87%。然后利用基于深层学习的半监督RAE方法,得到的最优文本情感分类结果为88.3%,在文本预处理、特征选择等处理过程与基于传统SVM方法完全相同的情况下,准确率提高了1.3个百分点。
【学位授予单位】:内蒙古大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:B842.6
【参考文献】
中国期刊全文数据库 前7条
1 张倩;杨耀权;;基于支持向量机核函数的研究[J];电力科学与工程;2012年05期
2 刘梅彦;张仰森;张涛;;基于语义分析的不良倾向文本的识别算法研究[J];北京信息科技大学学报(自然科学版);2014年04期
3 刘志明;刘鲁;;基于机器学习的中文微博情感分类实证研究[J];计算机工程与应用;2012年01期
4 周竹荣;邱玉辉;夏磊;;基于互信息和本体的协同检索模型的研究[J];计算机科学;2008年04期
5 闻彬;何婷婷;罗乐;宋乐;王倩;;基于语义理解的文本情感分类方法研究[J];计算机科学;2010年06期
6 柳位平;朱艳辉;栗春亮;向华政;文志强;;中文基础情感词词典构建方法研究[J];计算机应用;2009年10期
7 代大明;王中卿;李寿山;李培峰;朱巧明;;基于情绪词的非监督中文情感分类方法研究[J];中文信息学报;2012年04期
中国博士学位论文全文数据库 前1条
1 宋胜利;文本语义表示及多层分类关键技术研究[D];西安电子科技大学;2012年
中国硕士学位论文全文数据库 前6条
1 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
2 张磊;基于最大熵模型的汉语词性标注研究[D];大连理工大学;2008年
3 李兆福;基于K最短路径的中文分词算法研究与实现[D];哈尔滨工程大学;2009年
4 史南胜;基于句法树模式的产品评论意见挖掘研究[D];东华大学;2013年
5 李耀林;面向评价对象的商品评论情感倾向性分析研究[D];浙江工商大学;2013年
6 徐薇;中文微影评文本情感倾向性识别技术研究[D];华中师范大学;2013年
,本文编号:1149852
本文链接:https://www.wllwen.com/shekelunwen/xinlixingwei/1149852.html