基于语义情感信息的评论有用性研究
发布时间:2019-10-18 11:26
【摘要】:在电子商务平台,用户评论为用户提供了丰富的意见乃至购物导向,影响着用户的购物决策。而随着电子商务的发展和越来越多的用户参与其中,在线评论的数量急剧增长,用户难以从海量的评论中摄取有用的信息借以对产品的各方面有所了解,更难以从庞杂的信息流中对可靠和有用的评论加以识别。近年来针对评论的研究主要涉及垃圾评论、评论质量和评论摘要三个方面。垃圾评论通过发掘特征基于机器学习方法都能较好识别,评论摘要和评论质量是多年来研究领域一直讨论的问题,是在线网络平台对评论的不同组织方式。本文针对评论摘要和评论质量研究中存在的问题,主要完成了以下工作:(1)针对传统基于句法分析在不规范评论文本中的缺陷和主题模型应用于产品特征提取中的问题,提出了基于句法分析和主题模型结合的改进LDA模型SA-LDA进行产品特征抽取。(2)对于特征词的聚类,结合语义相似度和观点相似度的方法对特征词之间的距离进行度量。(3)利用句法分析得到的特征集和观点集对观点句进行识别,作为主题模型的输入,并结合must-link和cannot-link两种约束条件进行主题学习,保证了模型的准确率。(4)探索评论摘要与评论有用性之间的联系,基于相同观点具有一致有用性的思想,提出一个无监督模型OSUD通过观点支持度对评论的有用性进行预测。(5)挖掘评论回复信息对观点支持度以及评论有用性的影响,评论回复表征了用户针对产品某方面特征的意见表述,比评论有用投票更具参考价值。本文的实验数据从中关村网站获取,通过人工标记数据的方式构造数据集,实验证明本文的特征提取方法在保证较好召回率的同时对准确率也有所提升,且对于部分隐式特征也能较好抽取。基于观点支持度的评论有用性模型在保证有效性的同时能够对实验结果提供很好的解释。
【图文】:
重庆大学硕士学位论文 1 绪 论1 绪 论1.1研究背景及意义1.1.1 研究背景中国互联网络信息中心(CNNIC)2016 年 1 月发布了《第 37 次中国互联网发展状况统计报告》[1],报告显示,2015 年新增网民近四千万人,如今网民规模已达 6.88 亿,互联网普及率已超过百分之五十,较 2014 年底提升了 2.4 个百分点。如图 1.1 所示。
品进行改进和提升,从而提高产品在市场中的竞争力;用户通过评论可以快速对产品各个方面有所了解,并且通过产品的性能评价对比,为用户购物决策带来方便。此外,也有商家利用评论信息对消费者进行误导,通过发表垃圾评论信息推广自己的产品或诋毁竞争对手的产品;同时,消费者所发表的评论信息质量良莠不齐,不同用户也会关注产品不同方面的特性,于是产生了信息洪灾,使用户难以便捷地获取对自己有用的评论数据,也难以辨别评论内容的可信度。这就需要一种有效合理的方法对海量评论信息进行挖掘和分析,进而有效地对评论进行组织。目前,电商网站大都提供两种评论组织方式,即评论排序和评论摘要。评论排序用于将评论按照某种顺序进行列表展示,,许多网站基于时间和有用投票率两种方式对评论进行排序显示,但效果并不理想。林煜明等提到,按时间排序可能会使得许多高质量的评论排序靠后,且不能识别垃圾评论,评论质量难以保证;而按有用性得票率排序则可能存在得票不公平的问题,因为用户更倾向于投有用的票,且新产生的评论投票较少难以区分[3]。 如此,“评论挖掘”技术应运而生。
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
本文编号:2551060
【图文】:
重庆大学硕士学位论文 1 绪 论1 绪 论1.1研究背景及意义1.1.1 研究背景中国互联网络信息中心(CNNIC)2016 年 1 月发布了《第 37 次中国互联网发展状况统计报告》[1],报告显示,2015 年新增网民近四千万人,如今网民规模已达 6.88 亿,互联网普及率已超过百分之五十,较 2014 年底提升了 2.4 个百分点。如图 1.1 所示。
品进行改进和提升,从而提高产品在市场中的竞争力;用户通过评论可以快速对产品各个方面有所了解,并且通过产品的性能评价对比,为用户购物决策带来方便。此外,也有商家利用评论信息对消费者进行误导,通过发表垃圾评论信息推广自己的产品或诋毁竞争对手的产品;同时,消费者所发表的评论信息质量良莠不齐,不同用户也会关注产品不同方面的特性,于是产生了信息洪灾,使用户难以便捷地获取对自己有用的评论数据,也难以辨别评论内容的可信度。这就需要一种有效合理的方法对海量评论信息进行挖掘和分析,进而有效地对评论进行组织。目前,电商网站大都提供两种评论组织方式,即评论排序和评论摘要。评论排序用于将评论按照某种顺序进行列表展示,,许多网站基于时间和有用投票率两种方式对评论进行排序显示,但效果并不理想。林煜明等提到,按时间排序可能会使得许多高质量的评论排序靠后,且不能识别垃圾评论,评论质量难以保证;而按有用性得票率排序则可能存在得票不公平的问题,因为用户更倾向于投有用的票,且新产生的评论投票较少难以区分[3]。 如此,“评论挖掘”技术应运而生。
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【参考文献】
相关期刊论文 前6条
1 周红庆;吴扬扬;;中文客户评论对象特征的抽取与聚类方法[J];微型机与应用;2014年15期
2 黄婷婷;曾国荪;熊焕亮;;基于商品特征关联度的购物客户评论可信排序方法[J];计算机应用;2014年08期
3 靳健;季平;;用于在线产品评论质量分析的Co-training算法[J];上海大学学报(自然科学版);2014年03期
4 林煜明;王晓玲;朱涛;周傲英;;用户评论的质量检测与控制研究综述[J];软件学报;2014年03期
5 扈中凯;郑小林;吴亚峰;陈德人;;基于用户评论挖掘的产品推荐算法[J];浙江大学学报(工学版);2013年08期
6 刘海涛;依存语法和机器翻译[J];语言文字应用;1997年03期
本文编号:2551060
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/2551060.html