基于文本挖掘的电商用户评论分析与系统实现
发布时间:2020-07-30 16:43
【摘要】:文本挖掘和情感分析技术在电子商务中具有重要作用。通过分析电商平台的用户评论数据,挖掘其中包含的用户情感信息,既可为企业提供更精确的数据统计、广告推送和商家商品排名,也可为用户选购相应商品时提供有价值参考。目前中文情感词典不完善、基于词典的文本情感分析方法通常仅基于情感词出现的频率,导致分析结果准确度低。本文研究基于文本挖掘的电商用户评论分析与系统实现,研究具有重要的理论和实际意义。本文以电商网站的评论文本数据为研究目标,从情感词的提取、情感词库的构建以及电商网站评论文本的情感值计算等方面对基于词典的情感分析方法进行了研究。论文的主要工作包含以下几个方面:(1)针对目前通用情感词典过于泛化和领域适应性弱的缺点,本文提出一种基于依存句法抽取情感词的方法。通过对淘宝网历史评论数据进行依存句法分析,挖掘出包含用户情感倾向的依存关系,建立规则表;根据规则从大量历史评价语料中抽取情感词;基于半自动方法构建适合电商领域的情感词典;基于词语相似度进行自动情感极性标注和基于人工干预的情感极性标注,建立面向电商评论文本的情感词库。(2)针对目前仅基于句子中正面情感词和负面情感词个数判断文本情感倾向算法分析准确度低的问题,本文分析了中文文本中否定词、程度词和连词等对文本情感的重要影响,建立相应的辅助词库,提出一种综合计算文本情感极性值的计算方法,提高文本情感分析的准确率。(3)最后,基于上述研究设计并实现了电商用户评论分析系统的原型,使用淘宝网手机类商品的大量评论数据进行评测,最终获得了 90%以上的准确率,验证了该方法的可行性与准确性。
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.1
【图文】:
通过对比淘宝、京东、国美、苏宁等各大电商网站的商品评论系统,目前各大主流逡逑电商平台的用户评论系统都是采用“评分星级+预定义标签+评论文本”的形式来对用逡逑户评价进行采集和分析。如图1.1所示,以天猫商城的用户评价系统为例,用户对某个商逡逑品进行评价时,需要同时选择一个评分等级和若干预定义标签,然后再输入具体的评论逡逑文本,提交到后台后,后台会通过星级、标签和文本内容来进行综合判断,得出用户的逡逑情感倾向,最终以好评或差评的形式展现给用户。逡逑累计评价70332逡逑与描述裙符逡逑Z邋Zr逦质蜜好(3S03)逦手感不锾(2708》逦?费便宜(2127)逦深史蓉不错(ISIS)逦饫透不错《1157)逦Hg努恐度好(S53)逡逑4.8逡逑资:以按键一_!9>逡逑:认羁写评份蘧多苟获天猫达人成教忹20桌」逡逑其他买家5需要你的建议壤!逡逑w邋■:;:?逦<:;Y逡逑*卖家翳务t.:;逦厂?逡逑t?邋w1邋O逡逑灥泠0/s逡逑笑子
本文编号:2775812
【学位授予单位】:东南大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.1
【图文】:
通过对比淘宝、京东、国美、苏宁等各大电商网站的商品评论系统,目前各大主流逡逑电商平台的用户评论系统都是采用“评分星级+预定义标签+评论文本”的形式来对用逡逑户评价进行采集和分析。如图1.1所示,以天猫商城的用户评价系统为例,用户对某个商逡逑品进行评价时,需要同时选择一个评分等级和若干预定义标签,然后再输入具体的评论逡逑文本,提交到后台后,后台会通过星级、标签和文本内容来进行综合判断,得出用户的逡逑情感倾向,最终以好评或差评的形式展现给用户。逡逑累计评价70332逡逑与描述裙符逡逑Z邋Zr逦质蜜好(3S03)逦手感不锾(2708》逦?费便宜(2127)逦深史蓉不错(ISIS)逦饫透不错《1157)逦Hg努恐度好(S53)逡逑4.8逡逑资:以按键一_!9>逡逑:认羁写评份蘧多苟获天猫达人成教忹20桌」逡逑其他买家5需要你的建议壤!逡逑w邋■:;:?逦<:;Y逡逑*卖家翳务t.:;逦厂?逡逑t?邋w1邋O逡逑灥泠0/s逡逑笑子
本文编号:2775812
本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/2775812.html