当前位置:主页 > 经济论文 > 国际贸易论文 >

电子商务环境下用户观点的情感挖掘研究

发布时间:2020-07-12 04:15
【摘要】:随着互联网技术和电子商务的迅速发展,人类社会正快速步入“全民网购”时代。消费者对产品的评论内容包含了商品的体验,也为其他消费者、企业产品的反馈提供了重要的信息资源。如何高效地挖掘用户评论中消费者对产品以及相关方面所持有的观点成为情感挖掘分析领域的热点问题。但是,由于中文自然语言表述的多样性和复杂性,使用户评论的情感分析和研究变得更具有挑战性。目前,对文本情感分析的研究主要集中于细粒度的情感挖掘。它能深入到用户评价的多个方面,提取评价信息中涉及的评价对象、评价词等元素,并对其进行情感倾向分析,从而准确地反映用户的评价意图。但是,现有的细粒度文本情感挖掘仍然存在一些至今还没有很好解决的问题。例如,评价对象与评价词不完备、评价词的情感倾向歧义等问题。如何有效解决这些问题,实现基于细粒度的文本情感分析,正受到学术界的广泛关注。本文首先分析了文本情感分析的国内外发展现状和存在问题,然后以文本情感挖掘的句法分析和语义分析为主线,对电子商务环境下用户评论的观点挖掘进行了研究。归纳起来,本文的主要研究工作表现在以下几个方面:(1)电商平台的产品评论数据获取与预处理。首先,使用Python爬虫方式获取京东商城的手机评论、相机评论和电脑评论信息。然后,对获取的评论数据进行清洗。最后,对数据集进行分句、分词、句法分析、语义分析等预处理,为后续的研究做好数据准备。(2)提出了基于语义的评价信息抽取方法。应用条件随机场(CRFs)模型,提出在条件随机场模型中引入句法分析和语义分析,解决评价对象、评价词的抽取。首先,对预处理后的评论内容进行用户关注度分析,半自动标注数据集。然后,构建适用于电商平台数据的评价信息抽取模型。最后,进行了实验分析。结果表明基于语义的评价信息抽取方法在抽取评价对象和评价词上F值分别达到了92.31%、89.90%,并验证了句法关系和语义关系对评价信息抽取的正确和有效。(3)提出了基于语义关系的评价单元抽取方法。针对评价对象与评价词不完备问题,提出了结合句法关系、语义关系的多粒度条件随机场模型抽取评价单元方法SSMCRFs(Syntactic Semantic and Multi-grained Conditional Random Fields,SSMCRFs),解决了评价单元的抽取问题。通过3个实验分别证明了SSMCRFs方法的有效性以及句法特性和语义特性对评价单元识别的效果。(4)产品评价情感倾向分析。针对评价词的情感倾向歧义问题,考虑了评价对象和评价词两者的依赖关系,采用SSMCRFs加支持向量机对评价单元进行情感倾向分析。首先,人工标注评价单元数据集为评价对象,评价词,极性三元组。然后,对获取的评论信息进行了情感倾向分析。最后,根据情感倾向分析结果和评价单元频数进行可视化展示。
【学位授予单位】:四川师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:F724.6;F274;TP391.1
【图文】:

框架图,文本,预处理,框架


挖掘 它是人们对产品 表达的情感观点是消极的感分类研究还在政冶 经挖掘要经历一系列流程如 2.1 文本情感挖掘的一般的数据集就是用户在电都是顾客或消费者对第三价值的用户评论 语料库预处理评价信息抽取原始评论语料库

架构图,哈工大,架构,平台


图 2.3 哈工大语言技术平台架构表 2.1 词性中的标注及含义标注 含义 标注 含义 标注 含义 标注 含义b 区别词 j 简称 ni 机构名 q 量词a 形容词 i 习用语 nl 处所名词 r 代词d 副词 k 后接成分 ns 地名 u 助词c 连词 m 数词 nt 时间词 v 动词e 感叹词 n 名词 nz 其他专名 wp 标点符号g 语素字 nd 方位名词 o 拟声词 ws 字符串h 前接成分 nh 人名 p 介词 x 非语素字表 2.2 依存句法分析中的标注名及含义

模型图,支持向量机,模型,样本空间


相关理论概述类问题的算法 SVM 的基本思想:简单的来说是实现升维和线性性超平面,并求解一个最优化问题,就是将寻找最优线性超平面的基于 Mercer 核展开定理,通过非线性映射,把样本空间映射到一穷维的特征 Hilbert 空间,来解决样本空间中的高度非线性分类和M 被认为是性能最好的分类器 如图 2.4 所示是一个支持向量机模

【参考文献】

相关期刊论文 前7条

1 郭冲;王振宇;;面向细粒度意见挖掘的情感本体树及自动构建[J];中文信息学报;2013年05期

2 郑敏洁;雷志城;廖祥文;陈国龙;;基于层叠CRFs的中文句子评价对象抽取[J];中文信息学报;2013年03期

3 陈炯;张虎;曹付元;张永奎;;面向中文客户评论的产品属性抽取方法研究[J];计算机工程与设计;2012年03期

4 王荣洋;鞠久朋;李寿山;周国栋;;基于CRFs的评价对象抽取特征研究[J];中文信息学报;2012年02期

5 杨源;林鸿飞;;基于产品属性的条件句倾向性分析[J];中文信息学报;2011年03期

6 赵妍妍;秦兵;车万翔;刘挺;;基于句法路径的情感评价单元识别[J];软件学报;2011年05期

7 杨江;侯敏;王宁;;基于浅层篇章结构的评论文倾向性分析[J];中文信息学报;2011年02期

相关会议论文 前1条

1 王根;赵军;;中文褒贬义词语倾向性的分析[A];第三届学生计算语言学研讨会论文集[C];2006年

相关硕士学位论文 前9条

1 李毅捷;基于复杂句式文本情感分类研究[D];太原理工大学;2018年

2 刘超然;在线新闻网民评论情感倾向性分析及可视化研究[D];哈尔滨工业大学;2018年

3 张鑫;基于在线评论的细粒度情感分析研究[D];大连海事大学;2018年

4 冯仓龙;商品细粒度评价的识别与分析[D];沈阳航空航天大学;2017年

5 徐莹莹;基于深度神经网络模型的句子级文本情感分类研究[D];深圳大学;2016年

6 邸鹏;基于句子情感权值合成算法的篇章情感分析[D];太原理工大学;2015年

7 刘平洋;句子级情感倾向性分析与研究[D];北京邮电大学;2015年

8 聂欣慧;基于产品特征的领域情感本体构建及应用研究[D];首都师范大学;2014年

9 张s

本文编号:2751406


资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/guojimaoyilunwen/2751406.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4ee45***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com