面向电商评论细粒度观点挖掘的拓展主题模型研究
本文选题:电商评论 切入点:细粒度观点挖掘 出处:《浙江工商大学》2017年硕士论文
【摘要】:随着互联网和电子商务技术的发展,网络购物成为一种热潮,人们可以实现足不出户购买到自己心仪的商品。但是,与传统线下购物相比,网络购物有着商品种类繁多、用户无法直接感受商品的质量、体验商品功能等特征,这使得电商网站上的商品评论信息成为消费者选择和购买决策的重要参考。同时,评论信息作为反馈机制也可以帮助商家改进产品、提升服务。但是,目前电商网站评论数据量巨大、内容庞杂,采用人工阅读方式无法准确有效的得到有用的信息。而且人们更希望得到的是关于产品或服务多个方面的细粒度评价信息,而非其整体情感倾向。因此,针对电商评论的细粒度观点挖掘成为了热门的研究课题,受到国内外研究学者的广泛关注。细粒度观点挖掘旨在从评论数据中抽取出被评价实体方面以及相对应的情感,生成评价摘要,,为潜在消费者和商家提供决策支持。考虑到目前细粒度观点挖掘方法如基于人工定义、基于频率、基于有监督学习方法的局限性,而LDA主题模型作为无监督方法不仅不需要人工标注的训练数据,还可以克服上面所述方法中没有将具有相似语义的特征词进行聚类的缺点,被研究者广泛应用。但是LDA模型抽取的主题粒度较粗,无法识别被评价实体方面,而且三层模型无法实现细粒度观点挖掘目标,需要进行改进和拓展。针对上面提到的问题,本文根据细粒度观点挖掘的目标,对LDA模型进行设计和拓展,提出了细粒度的主题情感混合模型(Fine-grained Topic Sentiment Unification Model,FG-TSU 模型)。首先针对标准的LDA模型识别出的主题粒度较粗,本文将主题分为局部主题和全局主题,利用滑动窗口的方法将词共现信息从文档级降到句子级,实现细粒度局部主题的抽取;然后,本文根据词分类和在模型中引入指示变量用以区分方面词和观点词;最后,本文在LDA模型的三层模型基础上加入了情感层,对主题和情感进行同时建模,实现情感倾向分析,不仅可以获得整篇评论的情感极性,还可以获得被评价实体方面层的情感极性,最终完成细粒度观点挖掘的目标,生成评价摘要。为了验证本模型具有跨领域性,本文选取了酒店和手机两个领域的电商评论数据集进行实验,设计了三个实验,实验结果表明本模型在实现电商评论细粒度观点挖掘上的可行性。
[Abstract]:With the development of Internet and electronic commerce technology, online shopping has become a kind of upsurge.However, compared with the traditional offline shopping, online shopping has a wide variety of goods, users can not directly feel the quality of goods, experience commodity functions and other characteristics.This makes the product review information on e-commerce website an important reference for consumers to choose and purchase.At the same time, comments as a feedback mechanism can also help businesses improve their products and services.However, at present, the amount of comments on e-commerce websites is huge and the content is complex, so manual reading method can not get useful information accurately and effectively.Moreover, people prefer to get fine-grained evaluation information about multiple aspects of products or services, rather than their overall emotional tendency.Therefore, fine-grained point of view mining for ecommerce reviews has become a hot research topic and received extensive attention from domestic and foreign researchers.Fine-grained viewpoint mining aims to extract the evaluation entity and its corresponding emotions from the comment data, generate evaluation summary, and provide decision support for potential consumers and merchants.Considering the limitations of current fine-grained viewpoint mining methods, such as artificial definition, frequency based and supervised learning, the LDA topic model, as an unsupervised method, not only does not require manual tagging training data.It can also overcome the shortcoming of the method mentioned above that there is no clustering of feature words with similar semantics, which has been widely used by researchers.However, the LDA model can not identify the evaluated entity because of its coarse granularity, and the three-tier model can not achieve the goal of fine-grained viewpoint mining, so it needs to be improved and extended.Aiming at the problems mentioned above, according to the goal of fine-grained view mining, this paper designs and extends the LDA model, and proposes a fine-grained Topic Sentiment Unification model for FG-TSU.Firstly, aiming at the coarse granularity of the theme recognized by the standard LDA model, the topic is divided into local theme and global topic, and the cooccurrence information is reduced from document level to sentence level by sliding window method.Then, according to the classification of words and the introduction of demonstrative variables in the model to distinguish aspect words and opinion words; finally, this paper adds emotional layer to the three-layer model of LDA model, and models the subject and emotion simultaneously.The emotional tendency analysis can not only obtain the emotional polarity of the whole review, but also obtain the emotional polarity of the aspect layer of the evaluated entity. Finally, the goal of fine-grained viewpoint mining can be completed, and the evaluation summary can be generated.In order to verify the cross-domain nature of the model, this paper selects the e-business comment data set in the hotel and mobile phone fields to carry on the experiment, and designs three experiments.The experimental results show that this model is feasible to realize the mining of fine grained viewpoint of ecommerce review.
【学位授予单位】:浙江工商大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:F724.6;F274
【相似文献】
相关期刊论文 前2条
1 张金魁;桂雁军;;面向汽车电子商务的细粒度商品本体元模型[J];现代经济信息;2014年07期
2 ;[J];;年期
相关会议论文 前5条
1 叶蕴芳;杨榆;罗鑫;徐国爱;;Appfuse系统中细粒度权限控制的研究与实现[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
2 江伟玉;高能;刘泽艺;林雪燕;;一种云计算中的多重身份认证与授权方案[A];第27次全国计算机安全学术交流会论文集[C];2012年
3 郭磊;唐玉华;周杰;董亚卓;;基于FPGA的Cholesky分解细粒度并行结构与实现[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年
4 李俊青;谢圣献;刘广亮;陈晨;;P2P网络基于蚁群优化的动态细粒度访问控制框架[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
5 盛振华;吴羽;江锦华;寿黎但;陈刚;;InfoSigs:一种面向WEB对象的细粒度聚类算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
相关重要报纸文章 前2条
1 赵晓涛;巡展中的三大热门[N];网络世界;2007年
2 乐天邋编译;编织一张更好的Web[N];计算机世界;2007年
相关博士学位论文 前4条
1 付兴兵;基于属性基加密的细粒度访问控制机制研究[D];电子科技大学;2016年
2 时杰;关系数据库细粒度访问控制研究[D];华中科技大学;2010年
3 朱倩;面向自由文本的细粒度关系抽取的关键技术研究[D];江苏大学;2011年
4 余a\;基于Simulink模型的细粒度多线程技术研究[D];浙江大学;2014年
相关硕士学位论文 前10条
1 赵黎光;基于依存句法的句子级细粒度情感计算[D];华南理工大学;2015年
2 李星宇;一种细粒度Cloud-RAN框架与关键技术研究[D];电子科技大学;2014年
3 郦丽珍;基于Open vSwitch虚拟网络的细粒度访问控制[D];复旦大学;2013年
4 姚亮;数据访问控制中基于中间代理的用户撤销方法[D];西安电子科技大学;2014年
5 占文平;面向产品评论的情感分析技术研究[D];浙江工商大学;2015年
6 楼弘;基于深度神经网络的传感器覆盖细粒度优化研究[D];浙江工业大学;2015年
7 蔡雅雅;基于半监督集成剪枝算法的细粒度城市空气质量估计[D];浙江大学;2016年
8 何东梅;细粒度物体分类算法研究与实现[D];北京交通大学;2016年
9 廖纯;基于句法和语义的话题细粒度情感分析的研究[D];北京理工大学;2016年
10 李毅;属性层级观点挖掘技术的研究与应用[D];石家庄铁道大学;2016年
,本文编号:1706681
本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/1706681.html