网络评论文本的情感倾向性研究
本文选题:情感分析 切入点:情感词典 出处:《暨南大学》2016年硕士论文 论文类型:学位论文
【摘要】:随着近几年来电子商务的快速发展,越来越多的用户在网上购买商品后会留下对商品或服务的评论,并且该类评论数据的数量正在不断增长。这些数据不仅可以作为消费者购物的参考信息,也可以为商家的销售策略提供很多建议和商机,因此研究这些评论文本数据具有很大价值。作为文本分析的重要技术之一,文本情感分析在近几年得到了研究人员的广泛关注,并取得了很多的研究成果。文本情感分析根据评论文本中观点的褒贬倾向来进行文本分类,其分类方法包括基于情感词典的方法和基于机器学习的方法,其中第一种方法易于实现但是领域针对性不强,第二种方法分类效果更好但是需要大量的训练语料。本文首先介绍了情感分析的研究背景、国内外研究现状以及关键技术。然后对比了基于情感词典和基于机器学习两种方法的优缺点,并且结合机器学习中深度模型的有效性,选取了长短型记忆递归网络作为分类模型,提出将情感词典与深度学习模型两者结合的新方法来分阶段进行文本分类。新方法既克服了情感词典的不完整性缺点也解决了机器学习的大量语料需求。最后,本文通过对比实验证明在缺少训练语料情况下,将情感词典和长短型记忆递归网络结合的方法应用在文本分类中可以获得较高的精确度。
[Abstract]:With the rapid development of electronic commerce in recent years, more and more users will leave comments on goods or services after buying goods on the Internet. And the number of such reviews is growing. These data not only serve as a reference for consumers to shop for, but also provide a lot of advice and business opportunities for businesses' sales strategies. As one of the important techniques of text analysis, text emotion analysis has been paid much attention by researchers in recent years. A lot of research results have been made. Text affective analysis carries out text categorization according to the positive or negative tendency of opinion in the comment text. The classification methods include affective dictionary based approach and machine learning based approach. The first method is easy to implement but the domain is not specific. The second method has better classification effect but requires a lot of training data. Firstly, this paper introduces the research background of emotion analysis. Then, the advantages and disadvantages of affective dictionary and machine based learning are compared, and the validity of depth model in machine learning is combined. The long-long memory recursive network is selected as the classification model. A new method, which combines emotion dictionary with depth learning model, is proposed to classify text in stages. The new method not only overcomes the incompleteness of emotion dictionary, but also solves the need of a large amount of corpus for machine learning. In this paper, it is proved that in the absence of training corpus, the combination of affective dictionary and long-memory recursive network can achieve high accuracy in text classification.
【学位授予单位】:暨南大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【相似文献】
相关期刊论文 前10条
1 李盛瑜;何文;;一种对聊天文本进行特征选取的方法研究[J];计算机科学;2007年05期
2 蒋志方;祝翠玲;吴强;;一个对不带类别标记文本进行分类的方法[J];计算机工程;2007年12期
3 赵钢;;从复杂文本中导入数据的方法[J];中国审计;2007年18期
4 易树鸿;张为群;;一种基于粗集的文本数据特征信息的挖掘方法[J];计算机科学;2002年08期
5 李建中,杨艳,张艳秋;并行文本管理原型系统PDoc的功能与总体框架[J];哈尔滨工业大学学报;2004年09期
6 覃晓;元昌安;彭昱忠;丁超;;基于基因表达式编程的Web文本分类研究[J];网络安全技术与应用;2009年03期
7 谌志群;;文本趋势挖掘综述[J];情报科学;2010年02期
8 王亚民;刘洋;;含附件文本的分类算法研究[J];情报杂志;2012年08期
9 江伟;潘昊;;基于优化的多核学习方法的Web文本分类的研究[J];计算机技术与发展;2013年10期
10 陈福海;C++中用>>和<<重载实现文本文件的方便存取[J];现代计算机;1997年05期
相关会议论文 前10条
1 许君;王朝坤;刘立超;王建民;刘璋;;云环境中的近似复制文本检测[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
2 易天元;叶春生;;工业锅炉图纸输入的文本数据处理[A];1997中国控制与决策学术年会论文集[C];1997年
3 胡蓉;唐常杰;陈敏敏;栾江;;关联规则制导的遗传算法在文本分类中的应用[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
4 李文波;孙乐;黄瑞红;冯元勇;张大鲲;;基于Labeled-LDA模型的文本分类新算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 黄云平;孙乐;李文波;;基于上下文图模型文本表示的文本分类研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
6 蒋勇;陈晓静;;一种多方向手写文本行提取方法[A];第二十七届中国控制会议论文集[C];2008年
7 李瑞;王朝坤;郑伟;王建民;王伟平;;基于MapReduce框架的近似复制文本检测[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
8 胡俊;黄厚宽;;一种基于SVM的可视化文本分类的方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
9 劳锦明;韦岗;;文本压缩技术研究的新进展[A];开创新世纪的通信技术——第七届全国青年通信学术会议论文集[C];2001年
10 江荻;;藏语文本信息处理的历程与进展[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
相关重要报纸文章 前1条
1 戴洪玲;向Excel中快速输入相同文本[N];中国电脑教育报;2004年
相关博士学位论文 前10条
1 宋歌;基于聚类森林的文本流分类方法研究[D];哈尔滨工业大学;2014年
2 韩开旭;基于支持向量机的文本情感分析研究[D];东北石油大学;2014年
3 郑立洲;短文本信息抽取若干技术研究[D];中国科学技术大学;2016年
4 韩磊;汉语句义结构模型分析及其文本表示方法研究[D];北京理工大学;2016年
5 刘林;面向论坛文本的大学生情绪识别研究[D];华中师范大学;2016年
6 张博宇;基于局部特征的场景文本分析方法研究[D];哈尔滨工业大学;2015年
7 胡明涵;面向领域的文本分类与挖掘关键技术研究[D];东北大学 ;2009年
8 孙晓华;基于聚类的文本机会发现关键问题研究[D];哈尔滨工程大学;2010年
9 尚文倩;文本分类及其相关技术研究[D];北京交通大学;2007年
10 霍跃红;典籍英译译者文体分析与文本的译者识别[D];大连理工大学;2010年
相关硕士学位论文 前10条
1 金传鑫;气象文本分类特征选择方法及其在MapReduce上的实现[D];南京信息工程大学;2015年
2 李少卿;不良文本及其变体信息的检测过滤技术研究[D];复旦大学;2014年
3 杨名阳;基于空间文本数据的k近邻连接研究[D];上海交通大学;2015年
4 李天彩;短文本信息流的会话抽取与分析技术研究[D];解放军信息工程大学;2015年
5 陈亮宇;面向微博文本的事件抽取[D];东南大学;2015年
6 许慧芳;基于全覆盖粒计算模型的文本表示和特征提取研究[D];太原理工大学;2016年
7 王炜;面向网络舆情的文本语义倾向性分类算法研究[D];河北工程大学;2016年
8 任倚天;基于支持向量机的海量文本分类并行化技术研究[D];北京理工大学;2016年
9 光顺利;基于Spark的文本分类的研究[D];长春工业大学;2016年
10 张高祥;基于SVM的文本信息过滤算法研究[D];吉林大学;2016年
,本文编号:1624828
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/1624828.html