当前位置:主页 > 科技论文 > 软件论文 >

OTA网站评论文本的情感分析研究

发布时间:2018-03-03 03:32

  本文选题:OTA 切入点:情感分析 出处:《云南财经大学》2017年硕士论文 论文类型:学位论文


【摘要】:随着经济的发展,人们对旅游的需求不断增加,使得在线旅游消费市场呈爆发式的增长。因此,以携程网、去哪儿网等为代表的旅游OTA网站积累了海量的用户的评论文本数据。如何从这些大量的文本数据中获取有用的信息以提高用户体验成为亟需解决的问题。本文针对OTA网站评论文本数据进行了情感分析研究。具体工作如下:首先,本文通过网络爬虫技术抓取了一定量旅游OTA网站的评论文本数据作为研究对象并构建了相应的分类词库以及情感词库。由于旅游OTA网站评论文本的特殊性,目前的一些开源的情感词库不能十分有效的匹配该类评论文本数据,而且主流的情感词库大部分是二分类的情感判别,无法体现用户具体的情感倾向程度;也不能将用户的情感倾向按评价要素细分或者按用户偏好个性化获取情感倾向程度。基于此本文针对该类评论文本数据重新构建了专有的按评价要素细分的分类词库以及情感词库。从而能够更有效地获得用户的情感倾向值。同时也是本文模型构建中不可或缺的一部分。其次,本文提出一种基于LSA(潜在语义分析)与DBN(深度信念网络)的深度学习模型。由于传统的基于文本向量空间所构建的文本特征矩阵仅仅体现了文本信息中词频的信息,而未能包含词语于词语之间潜藏的语义信息(如:一词多义或一义多词等)所以在模型拟合过程中其效果往往有所欠缺。因此,本文运用LSA方法将原始的文本特征矩阵进行SVD分解,再通过合理的选取分解后奇异值的个数重构文本特征矩阵。最后,基于重构后的文本特征矩阵构建了DBN的深度学习模型以期通过对文本数据的训练学习能够有效地获得文本的情感倾向值。最后,本文还设计了六组数据与模型的对比实验以验证模型的有效性。从最终各个模型十折交叉验证的总体对比结果来看,本文构建的基于LSA(潜在语义分析)与DBN(深度信念网络)的深度学习模型具有较好的性能。
[Abstract]:With the development of economy, people's demand for tourism is increasing, which makes the online travel consumption market explosive. Therefore, to Ctrip, The travel OTA website, which is represented by the travel website, has accumulated a lot of comments text data from users. How to obtain useful information from these lots of text data in order to improve the user experience has become a problem that needs to be solved in this paper. This paper makes an emotional analysis on the text data of comments on OTA website. The specific work is as follows: first of all, This paper grabs a certain amount of comment text data of tourism OTA website as the research object through web crawler technology, and constructs the corresponding classifying lexicon and emotion lexicon. Because of the particularity of tourism OTA website comment text, At present some open source emotion lexicon can not match this kind of comment text data very effectively and the mainstream emotion lexicon is mostly two-classification emotion judgment which can not reflect the specific emotional tendency of the user. Nor can the emotional tendency of users be subdivided into evaluation elements or individualized by user preferences. Based on this this paper reconstructs a proprietary classification based on evaluation elements for this kind of comment text data. Thesaurus and affective lexicon can obtain the user's emotional tendency value more effectively. It is also an indispensable part of the model building in this paper. Secondly, In this paper, a deep learning model based on LSA (latent semantic Analysis) and DBN (Deep belief Network) is proposed. Because the traditional text feature matrix based on text vector space only embodies the information of word frequency in the text information. However, the semantic information hidden between words (such as polysemy or multi-word) is often lacking in the process of model fitting. In this paper, the original text feature matrix is decomposed by LSA method, then the text feature matrix is reconstructed by selecting the number of singular values reasonably. Based on the reconstructed text feature matrix, a depth learning model of DBN is constructed in order to obtain the emotional tendency of the text effectively by training the text data. In order to verify the validity of the model, six groups of data and model are designed to verify the validity of the model. The depth learning model based on LSA (latent semantic analysis) and DBN (Deep belief Network) has good performance.
【学位授予单位】:云南财经大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.1

【参考文献】

相关期刊论文 前10条

1 李亚克;田青;高航;;结合类标签关联度的有序核判别回归学习[J];数据采集与处理;2016年03期

2 刘贤友;孙丙宇;李文波;汪超永;;基于隐含语义索引的文本情感序列回归方法[J];计算机系统应用;2014年07期

3 张靖;金浩;;汉语词语情感倾向自动判断研究[J];计算机工程;2010年23期

4 柳位平;朱艳辉;栗春亮;向华政;文志强;;中文基础情感词词典构建方法研究[J];计算机应用;2009年10期

5 廖祥文;曹冬林;方滨兴;许洪波;程学旗;;基于概率推理模型的博客倾向性检索研究[J];计算机研究与发展;2009年09期

6 李杰;曹谢东;余飞;;基于语义相似度计算的词汇语义自动分类系统[J];计算机仿真;2008年08期

7 李钝;乔保军;曹元大;万月亮;;基于语义分析的词汇倾向识别研究[J];模式识别与人工智能;2008年04期

8 叶强;张紫琼;罗振雄;;面向互联网评论情感分析的中文主观性自动判别方法研究[J];信息系统学报;2007年01期

9 唐慧丰;谭松波;程学旗;;基于监督学习的中文情感分类技术比较研究[J];中文信息学报;2007年06期

10 刘美茹;;基于LSI和SVM的文本分类研究[J];计算机工程;2007年15期

相关硕士学位论文 前1条

1 刘贤友;面向电子商务的评论文本情感分析研究[D];中国科学技术大学;2015年



本文编号:1559390

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1559390.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户33f1b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com